Arhiva za ‘prepoznavanje govora’ tag
Apple pregovara o kupovini kompanije Nuance koja stoji iza tehnologije za prepoznavanje glasa
Mnogi online mediji prenose vijest da je kompanija Apple u ozbiljnim pregovorima sa Nuance Communications. Potencijalni sporazum između Apple i kompanije Nuance sugerira da Apple nastoji da obezbjedi nove mogućnosti prepoznavanje glasa za svoj iOS 5.
Direktni rival kompanije Apple je Google, koji ima svoj vlastiti okvir za prepoznavanje glasa. No, problemi s Google prepoznavanjem glasa i transkripcijom su stvari već dobro poznate svima. Postoji jako mnogo dokumentiranih primjera neuspjelih i neugodnih primjena Google prepoznavanja glasa, koji se mogu pronaći na blogovima, YouTube itd.
Bez obzira na sve mane, Google koristi svoju tehnologiju za prepoznavanje glasa u Android-u ali i za pružanje funkcionalnosti koja nedostaje Apple iOS. Apple iOS uključuje neke osnovne glasovne naredbe za interakciju s kontaktima ili iPod aplikaijama, ali prepoznavanje glasa u Android-u korisnicima omogućuju interakciju s mobilnim OS koristeći svoj glas, za pretraživanje, diktiranje e-pošte, unos smjerova u mapama, i još mnogo toga.
Postoje aplikacije kao što su Bing i Dragon Dictation, razvijen od strane Nuance, koji donosi sposobnost prepoznavanje glasa i naredbi za iPhone i iPad. Također, Dragon Dictation možete koristiti za točno speech-to-text prepoznavanje glasa koje možete poslati na Twitter, postovati na Facebook, poslati u obliku SMS-a na drugi mobilni telefon, i još mnogo toga.
Prema nekim navodima, eventualni dogovor o kupovini kompanije Nuance, bi Apple moglo da košta gotovo 6 milijardi dolara, tako da mnogi pretpostavljaju da razgovori ipak idu u pravcu da se napravi neka vrsta partnerstva koje bi bilo povoljno za obje kompanije a koje bi također moglo definirati i budućnost iOS-a.
Prepoznavanje jezika, postoje glasine, igra veliku ulogu u budućnosti iOS-a. Prošle godine, Apple je kupio još jednu kompaniju za prepoznavanje govora, Siri, koja se temelji na tehnologiji kompanije Nuance. Postigne li dogovor, Apple bi mogao ugraditi tehnologiju za prepoznavanje glasa koja stoji iza Dragon Dictation u osnovnu funkcionalnost iOS 5 i proširiti mogućnosti glasovnih naredbi u iPhone i iPad-u, u cilju bolje konkurencije Android-u u ovom segmentu funkcionalnosti.
Tehnologija budućnosti: Microsoft-ov telefon prevodilac
Jedan od hitova na ovogodišnjem TechFest-a u Redmondu je tzv telefon prevodilac. To je kombiniranje prepoznavanja govora, strojnog prevođenja i tekst-u-govor tehnologije na takav naćin da omogući telefonski razgovor ljudima koji ne govore isti jezik.
Test sa Frank Seide-om, jednim od istraživača koji stoji iza projekta, gdje je razmjenjeno par pitanja na engleskom jeziku, dok je Seide odgovarrao na njemačkom jeziku. Kao što se može vidjeti iz video-a ispod, to je daleko od savršenog ali na kraju krajeva, dobiti suštinu onoga što je netko rekao bez dijeljenja zajedničkog jezika je prilično dobra stvar.
Prepoznavanja govora i strojno prevođenje su skloni pogreškama tako da će njihovo kombiniranje vjerojatno dovesti do nekih prilično smiješnih rezultata ali je to svakako obećavajuća tehnologija.
Nisu sve pogreške proizvod prepoznavanja govora i strojnog prevođenje. U nekim slučajevima prijevod ili prepoznavanje govora nisu odradili posao baš točno, međutim ima slučajeva gdje su pogreške proizvod ljudske pogrešne komunikacije, tj. nesporazuma.