Visul de a avea un asistent inteligent care să poată purta o conversație naturală, așa cum am văzut în filmul „Her” din 2013, ne fascinează de mult timp. Dar chiar și după mai bine de un deceniu, realitatea nu se ridică la nivelul imaginației noastre, iar inteligența artificială încă are limitele ei când vine vorba de comunicare, după cum arată un raport recent.
Potrivit Techxplore, una dintre cele mai mari probleme cu care se confruntă asistenții vocali este capacitatea lor redusă de a procesa toate nuanțele vorbirii umane.
Cum stau lucrurile cu recunoașterea vorbirii
Dacă ai încercat vreodată să vorbești cu un bot digital care nu a reușit să-ți înțeleagă cuvintele, ai dat nas în nas cu principala limitare a inteligenței artificiale – dificultatea de a face față diversității în modul în care oamenii vorbesc.
Sistemele automate au probleme mai ales când trebuie să recunoască:
- Diferite accente și dialecte
- Intonații neobișnuite
- Particularitățile vocii feminine
- Vocea persoanelor în vârstă
- Modul în care vorbesc copiii
De ce se întâmplă asta în practică
Inteligența artificială funcționează pe baza unor presupuneri statistice: în loc să țină cont de context și indicii suplimentare (cum ar fi tonul vocii), de cele mai multe ori fie greșește, fie „renunță” pur și simplu să mai încerce să înțeleagă.
Un exemplu concret: când sistemul e antrenat doar cu vocea vorbitorilor nativi ai unei limbi, va avea dificultăți să înțeleagă pe cineva care vorbește aceeași limbă dar cu accent diferit sau amestecă mai multe limbi.
Problema devine și mai serioasă pentru că inteligența artificială se folosește tot mai mult în domenii esențiale, de la sistemul medical până la serviciile de urgență. Gândește-te la un scenariu: suni la 112 după un accident, dar botul-asistent nu te înțelege din prima. În astfel de momente critice, orice întârziere poate avea consecințe grave.
Erorile de recunoaștere apar din cauză că datele folosite pentru antrenarea modelelor de limbaj nu sunt suficient de diverse. Mai mult, sistemele tind să „uniformizeze” vorbirea, ștergând accentele, ceea ce întărește prejudecățile despre ce înseamnă „vorbire corectă”. Unele companii au mers până acolo încât oferă instrumente care modifică accentul în timp real pentru a se potrivi standardelor marilor clienți, cum ar fi call center-urile internaționale.
Ce soluții avem pentru viitor
Pentru ca tehnologiile vocale să devină cu adevărat universale, cei care le dezvoltă au nevoie de mai mult timp și resurse ca să antreneze modelele ținând cont de toate accentele, limbile și particularitățile vorbirii. Programele trebuie să devină mai empatice în modul în care ascultă și să nu mai forțeze utilizatorul să se adapteze la algoritm.
Factorul uman rămâne crucial: mulți oameni preferă să vorbească cu operatori reali, mai ales în situații stresante. Chiar dacă inteligența artificială a făcut progrese mari, încă e departe de a înțelege toate subtilitățile vorbirii umane.
Te invităm să ne spui în comentarii care a fost experiența ta cu asistenții vocali și ce crezi că ar trebui îmbunătățit la ei.
Sursa imaginii: Getty Images
Etichete: asistenți vocali, inteligență artificială, recunoaștere vocală, tehnologie, comunicare, accesibilitate