Modelele AI pot suferi de „halucinații" auditive. Aplicațiile de transcriere sunt induse în eroare de accentele diferite și de tulburările de limbaj
Postat la: 27.04.2024 | Scris de: ZIUA NEWS
0
Până acum, tendința programelor de inteligență artificială de a inventa ocazional lucruri sau de a avea „halucinații" a fost bine documentată. Roboții de chat au generat informații medicale eronate, au inventat cazuri juridice false și au fabricat citate. Acum, un nou studiu a descoperit că modelele de inteligență artificială nu numai că văd lucruri, dar și aud lucruri, scrie revista Science.
Whisper de la OpenAI, un model de inteligență artificială antrenat să transcrie înregistrări audio, a inventat propoziții în aproximativ 1,4% din transcrierile înregistrărilor audio testate. În mod deconcertant, o mare parte din propozițiile fabricate conțineau texte ofensatoare sau potențial dăunătoare.
„Medicii folosesc instrumente de conversie a vorbirii în text pentru a transcrie notițele pacienților", spune Allison Koenecke, informatician la Universitatea Cornell și autor principal al studiului. „Dacă Whisper inventează niște transcrieri care nu sunt spuse, despre cum un pacient a omorât pe cineva și, de asemenea, sau îl îndeamnă să ia un medicament care este complet inventat, imaginați-vă cât de grave pot fi consecințele."
Studiul subliniază provocările cu care se confruntă instrumentele de transcriere: diversitatea tiparelor de vorbire din întreaga lume, precum și disponibilitatea limitată a datelor de instruire, spune Odette Scharenborg, tehnolog la Universitatea de Tehnologie din Delft, care nu a fost implicată în studiu. „Niciun sistem de conversie a vorbirii în text nu este încă capabil să modeleze la un nivel bun toată această variabilitate a articulației și a pronunției", spune ea.
Roboții de chat generativi se bazează pe modele de limbaj de mari dimensiuni (LLM), care primesc solicitări de text și produc rezultate prin prezicerea cuvintelor probabile pe baza modelelor învățate în urma antrenamentului pe miliarde de pagini de text din cărți și pagini web. Sistemele de transcriere combină aceste modele lingvistice cu modele audio care învață reprezentări ale tiparelor de vorbire.
Modelele mari de inteligență artificială funcționează bine: Transcrierile lor sunt mai precise decât alte instrumente de conversie a vorbirii în text care se bazează pe modele lingvistice de dimensiuni reduse. Dar Koenecke a vrut să analizeze mai atent. „Chiar dacă performanța pare mai bună decât media, avem aceste cazuri limită în cadrul textului în sine pe care ne temem că oamenii le-ar putea rata dacă presupun că Whisper transcrie totul cu fidelitate", spune ea.
Echipa lui Koenecke a oferit lui Whisper aproximativ 20 de ore de înregistrări audio de la vorbitori cu și fără afazie, o tulburare de limbaj în care oamenii au tendința de a vorbi încet și cu mai multe pauze. Segmentele audio conțineau dialoguri conversaționale pe teme precum povești personale și relatări de basm. În rulările efectuate în aprilie și mai 2023 pe o versiune anterioară a Whisper, cercetătorii au constatat că 1,7% din segmentele audio de la vorbitori cu afazie și 1,2% din segmentele audio de la persoane fără afazie au dus la transcrieri cu unele texte fabricate.
Aproximativ 40% dintre segmentele fabricate au fost dăunătoare sau îngrijorătoare într-un anumit fel. Aproximativ jumătate dintre aceste secvențe îngrijorătoare făceau referire la acte de violență, aluzii sexuale sau stereotipuri demografice. De exemplu, înregistrările audio despre salvarea pisicilor de către pompieri au inclus adăugiri inventate despre un „cărucior îmbibat de sânge" și „mângâieri". Un material audio inofensiv despre o umbrelă a inclus invenții despre un „cuțit al terorii" și despre oameni uciși.
Cercetătorii au grupat restul halucinațiilor audio în alte două categorii: informații false cu privire la o persoană, cum ar fi nume inventate, date false despre relațiile sau starea de sănătate. Whisper a avut tendința și de a adăuga fraze precum „Mulțumim pentru vizionare" la finalul transcrierilor" și de a adăuga linkuri către diverse site-uri, atât reale cât și inexistente.
De când a fost realizat experimentul original, OpenAI și-a actualizat modelul pentru a sări peste perioadele de tăcere și a retranscrie sunetul în cazul în care software-ul detectează o halucinație probabilă. În decembrie 2023, când cercetătorii au reluat unele dintre fișierele audio, au constatat că Whisperul actualizat a eliminat cele mai multe dintre invențiile găsite în testele lor anterioare. Efectuarea de audituri regulate pentru a verifica dacă există halucinații și încorporarea acestor feedback-uri în modele - așa cum se pare că a făcut OpenAI - va contribui la asigurarea unor rezultate mai bune, spune Koenecke.
Între timp, dr. Scharenborg recomandă insistent ca utilizatorii să verifice manual rezultatele oricărui instrument de transcriere cu inteligență artificială, în special dacă îl folosesc pentru a lua decizii importante. „Nu numai din cauza potențialelor halucinații", spune ea, „ci și pentru că toate sistemele de transcriere de la vorbire la text fac erori de transcriere".
DIN ACEEASI CATEGORIE...
ULTIMA ORA
-
Procesul "Marcel Vela colaborator al Securității comuniste". A dat note informative cu numele de cod "Smena"!
Un fost judecător din Caraș Severin a atacat în justiție adeverința eliberată în octombrie 2023 prin care Consiliul Național pentru Studierea Arhivelor Securității (CNSAS) a decis că Marcel Vela, fost ministru PNL de Interne, nu a fost colaborator al Securității ca poliție politică. Adeverința CNSAS arată că Vela a dat note informative cu numele conspirativ "Smena", dar judecătorul cere ca liderul PNL să fie declarat colaborator al Securității.
-
The Economist: Ordinea internațională liberală se află în pragul colapsului. Prăbușirea economiei globale ar fi bruscă și ireversibilă
La o primă vedere, economia mondială pare că a rezistat cu brio în fața tuturor provocărilor pe care le-a avut de înfruntat în ultimul timp: America este în ascensiune chiar și după declanșarea războiului comercial cu China, iar Germania a evitat un dezastru economic după ce a renunțat la gazul importat din Rusia.
-
Eurovision 2024: Israelul s-a calificat în finala în ciuda protestelor de amploare din Malmo. Netanyahu s-a implicat în scandal
Israelul s-a calificat în finala de sâmbătă a concursului muzical Eurovision de la Malmo, în Suedia, unde mii de persoane au manifestat împotriva participării acestei ţări la competiţie pe fondul războiului din Gaza.
-
Semnul ca incepe Marea Resetare financiara: Explozia prețului la aur arata ca marii magnati nu mai cred in bani si in depozite monetare
Creşterea recentă în forţă a preţurilor aurului este un simptom al unei ordini mondiale în schimbare şi al începutului unei noi era de conflict şi nesiguranţă.
-
Ce impact ar avea asupra României un război comercial între China și UE
UE și-a afirmat recent disponibilitatea de a declanșa un război comercial cu China din cauza presiunii importurilor ieftine și al amenințării politicilor divizante și neconcurențiale ale puterii asiatice.
-
Șocul inevitabil ce lovește lumea: Celebrul Nouriel Roubini avertizează că vine Mama tuturor crizelor!
Nouriel Roubini, celebrul expert și profesor emerit de economie la Stern School of Business de la Universitatea din New York, este renumit pentru predicțiile sale pesimiste despre starea economiei globale.
-
Revoluția tehnologică continuă! Asistentul medical al Google poate lua locul medicilor cu experiență
Google a anunțat lansarea Med-Gemini, un instrument de inteligență artificială destinat să sprijine munca medicilor prin preluarea unei părți din sarcinile zilnice.
-
Descoperire după 3 decenii de cercetare, neștiută de oameni: Alimentele care îți scurtează cu mulți ani viața
Un grup de cercetători condus de către Harvard T.H. Chan School of Public Health din Boston, Statele Unite, care a efectuat un amplu studiu publicat în British Medical Journal pe 8 mai 2024, a făcut o descoperire remarcabilă pentru sănătate.
-
Daria Gușă: Corectitudinea politică și ideologiile „progresiste" sunt molime ale societății de azi. Care sunt soluțiile tinerelor generații pentru viitorul care le așteaptă
In cadrul podcast-ului „Pe drept cuvânt", prezentat de avocatul Florentin Țuca, Daria Gușă, actualmente studentă la Universitatea Saint Andrews din Scoția - unde studiază Relații Internaționale -, a vorbit foarte convingător (deși are doar 20 de ani) despre pericolele unui viitor deformat de ideologiile „progresiste" și despre nevoia prezervării reperelor morale de „școală veche".
DIN CATEGORIE
- TOP CITITE
- TOP COMENTATE
- 1.O invenție revoluționară. Levitația a devenit posibilă
- 2.Misiune indeplinita: Anca Dragu a predat Republica Moldova la cheie pentru companiile străine care sunt deja în România
- 3.Suveica mafiei din agricultură: importăm porumb din Ungaria, mere din Polonia şi conserve de roşii din Turcia și dam totul la export
- 4.Yuval Noah Harari: "Când va veni potopul elitele vor construi o arcă și îi vor lăsa pe ceilalți să se înece!"
- 5. Poti sa pierzi tot prin Escrocheria "Mă auziți acum?" Motivul pentru care să nu răspunzi cu "Da"
- 6.Sute de mii de japonezi se revoltă împotriva "Tiranicului Tratat privind pandemiile al OMS"!
- 7.Părintele Pimen Vlad face dezvăluiri cutremurătoare: De unde vine, de fapt, Lumina Sfântă de la Ierusalim!
- 8.Se pregătește pandemia de gripă aviara cu transmitere la om ca sa se puna in aplicare tratatul OMS
- 9.Dorel Vișan, Laura și Ciprian Mega, pe covorul roșu la Moscova! Filmul "21 de rubini" selectat de către Nikita Mihalkov pentru "Oscarul BRICS".
- 10.Amenințare colosală pentru omenire: sfârșitul vieții de pe Pământ ar putea veni din Antarctica
comentarii
Adauga un comentariuAdauga comentariu