Modelele AI pot suferi de „halucinații" auditive. Aplicațiile de transcriere sunt induse în eroare de accentele diferite și de tulburările de limbaj
Postat la: 27.04.2024 |
Până acum, tendința programelor de inteligență artificială de a inventa ocazional lucruri sau de a avea „halucinații" a fost bine documentată. Roboții de chat au generat informații medicale eronate, au inventat cazuri juridice false și au fabricat citate. Acum, un nou studiu a descoperit că modelele de inteligență artificială nu numai că văd lucruri, dar și aud lucruri, scrie revista Science.
Whisper de la OpenAI, un model de inteligență artificială antrenat să transcrie înregistrări audio, a inventat propoziții în aproximativ 1,4% din transcrierile înregistrărilor audio testate. În mod deconcertant, o mare parte din propozițiile fabricate conțineau texte ofensatoare sau potențial dăunătoare.
„Medicii folosesc instrumente de conversie a vorbirii în text pentru a transcrie notițele pacienților", spune Allison Koenecke, informatician la Universitatea Cornell și autor principal al studiului. „Dacă Whisper inventează niște transcrieri care nu sunt spuse, despre cum un pacient a omorât pe cineva și, de asemenea, sau îl îndeamnă să ia un medicament care este complet inventat, imaginați-vă cât de grave pot fi consecințele."
Studiul subliniază provocările cu care se confruntă instrumentele de transcriere: diversitatea tiparelor de vorbire din întreaga lume, precum și disponibilitatea limitată a datelor de instruire, spune Odette Scharenborg, tehnolog la Universitatea de Tehnologie din Delft, care nu a fost implicată în studiu. „Niciun sistem de conversie a vorbirii în text nu este încă capabil să modeleze la un nivel bun toată această variabilitate a articulației și a pronunției", spune ea.
Roboții de chat generativi se bazează pe modele de limbaj de mari dimensiuni (LLM), care primesc solicitări de text și produc rezultate prin prezicerea cuvintelor probabile pe baza modelelor învățate în urma antrenamentului pe miliarde de pagini de text din cărți și pagini web. Sistemele de transcriere combină aceste modele lingvistice cu modele audio care învață reprezentări ale tiparelor de vorbire.
Modelele mari de inteligență artificială funcționează bine: Transcrierile lor sunt mai precise decât alte instrumente de conversie a vorbirii în text care se bazează pe modele lingvistice de dimensiuni reduse. Dar Koenecke a vrut să analizeze mai atent. „Chiar dacă performanța pare mai bună decât media, avem aceste cazuri limită în cadrul textului în sine pe care ne temem că oamenii le-ar putea rata dacă presupun că Whisper transcrie totul cu fidelitate", spune ea.
Echipa lui Koenecke a oferit lui Whisper aproximativ 20 de ore de înregistrări audio de la vorbitori cu și fără afazie, o tulburare de limbaj în care oamenii au tendința de a vorbi încet și cu mai multe pauze. Segmentele audio conțineau dialoguri conversaționale pe teme precum povești personale și relatări de basm. În rulările efectuate în aprilie și mai 2023 pe o versiune anterioară a Whisper, cercetătorii au constatat că 1,7% din segmentele audio de la vorbitori cu afazie și 1,2% din segmentele audio de la persoane fără afazie au dus la transcrieri cu unele texte fabricate.
Aproximativ 40% dintre segmentele fabricate au fost dăunătoare sau îngrijorătoare într-un anumit fel. Aproximativ jumătate dintre aceste secvențe îngrijorătoare făceau referire la acte de violență, aluzii sexuale sau stereotipuri demografice. De exemplu, înregistrările audio despre salvarea pisicilor de către pompieri au inclus adăugiri inventate despre un „cărucior îmbibat de sânge" și „mângâieri". Un material audio inofensiv despre o umbrelă a inclus invenții despre un „cuțit al terorii" și despre oameni uciși.
Cercetătorii au grupat restul halucinațiilor audio în alte două categorii: informații false cu privire la o persoană, cum ar fi nume inventate, date false despre relațiile sau starea de sănătate. Whisper a avut tendința și de a adăuga fraze precum „Mulțumim pentru vizionare" la finalul transcrierilor" și de a adăuga linkuri către diverse site-uri, atât reale cât și inexistente.
De când a fost realizat experimentul original, OpenAI și-a actualizat modelul pentru a sări peste perioadele de tăcere și a retranscrie sunetul în cazul în care software-ul detectează o halucinație probabilă. În decembrie 2023, când cercetătorii au reluat unele dintre fișierele audio, au constatat că Whisperul actualizat a eliminat cele mai multe dintre invențiile găsite în testele lor anterioare. Efectuarea de audituri regulate pentru a verifica dacă există halucinații și încorporarea acestor feedback-uri în modele - așa cum se pare că a făcut OpenAI - va contribui la asigurarea unor rezultate mai bune, spune Koenecke.
Între timp, dr. Scharenborg recomandă insistent ca utilizatorii să verifice manual rezultatele oricărui instrument de transcriere cu inteligență artificială, în special dacă îl folosesc pentru a lua decizii importante. „Nu numai din cauza potențialelor halucinații", spune ea, „ci și pentru că toate sistemele de transcriere de la vorbire la text fac erori de transcriere".
DIN ACEEASI CATEGORIE...
-
Pedeapsă cu închisoarea pentru doi părinți care și-au lăsat copiii în camera de hotel și s-au dus la petreceri. Cel mai mic, un bebeluș de șase luni, a fost testat pozitiv la cocaină
Un cuplu britanic care și-a lasat cei trei copii mici singuri intr-un hotel din Spania pentru a ieși „la petrecere ...
-
De ce 165.000 de milionari în dolari fug din țările lor? Destinația nr. 1 din lume care îi atrage ca un magnet
O noua analiza a firmei de cercetare New World Wealth arata ca in anul 2026 am putea asista la migrația a 165.000 de mil ...
-
Cum a câștigat familia Trump 2,3 miliarde de dolari din criptomonede, în timp ce investitorii au pierdut sume uriașe
Familia Trump a caștigat 2,3 miliarde de dolari din tranzacții cu criptomonede, anunța Reuters, dupa ce a studiat mii de ...
-
Spania marchează o premieră energetică: Un motor uriaș pe hidrogen a alimentat rețeaua națională de energie electrică
Un motor gigant alimentat cu hidrogen a alimentat cu succes rețeaua naționala de energie electrica a Spaniei, intr-o ini ...
-
Lumea are primul ei trilionar: Averea lui Elon Musk se ridică la 1.100 de miliarde de dolari
Elon Musk tocmai a devenit primul „trillionar” din istoria lumii. Acțiunile SpaceX au inceput sa fie tranzac ...
-
Simptomul specific celor care mor subit: Apare cu câteva luni înainte și ar putea fi un semnal de alarmă care să salveze vieți
Moartea subita cardiaca este una dintre cele mai dramatice urgențe medicale, deoarece apare fara avertisment aparent și ...
-
Rușii instruiesc tinere pentru a seduce soldații ucraineni. Cine cade în capcană sfârșește într-un mod cumplit
Serviciile secrete rusești au inceput sa vaneze adolescente pe internet. Le ademenesc cu bani, iar apoi le pun sa le int ...
-
Misterul din Atlantic îi neliniștește pe oamenii de știință: Fenomenul 'găurii de răcire' ar putea preceda unul dintre cele mai grave scenarii climatice
În sudul Groenlandei și Islandei exista o regiune uriașa a Oceanului Atlantic care sfideaza tendința globala de in ...
-
Planul „StormWall” - Cercetătorii propun un sistem capabil să apere Pământul de furtunile solare
O echipa de cercetatori din Statele Unite propune dezvoltarea unui sistem capabil sa reduca impactul furtunilor solare p ...
-
Avertismentul oamenilor de știință: O substanță chimică „eternă” se acumulează pe Pământ
Substanțele chimice introduse pentru a contribui la refacerea și protejarea stratului de ozon al Pamantului ar putea fi ...
-
Gafă de proporții în armata rusă: documente secrete, parole și ordine operative, publicate din greșeală pe 'Organizația dracului'
Militari din Regimentul 143 Garda Motorizata al armatei ruse au publicat, timp de aproape un an, documente interne, ordi ...
-
Documente declasificate: laboratoare biologice finanțate de SUA, inclusiv în Ucraina. Rusia reacționează vehement
Kirill Dmitriev, reprezentantul special al presedintelui Rusiei pentru investitii si cooperare economica internationala ...
-
Controale ANPC de amploare în București și Ilfov. Pesticide și nereguli la peste jumătate din legumele verificate
Reprezentanții Autoritații Naționale pentru Protecția Consumatorilor (ANPC) anunța ca, din 200 de tone de legume verific ...
-
Inflația a explodat la aproape 11%, iar puterea de cumpărare s-a prăbușit. Analist economic: "Suta de lei valorează acum 70"
Romania economica se intoarce vertiginos in timp, iar buzunarele cetațenilor deconteaza direct deciziile politice recent ...
-
România este efectiv pe marginea prăpastiei: un blocaj legislativ devastator pentru buget
Pe fondul unui climat politic tensionat, economia Romaniei se confrunta cu un blocaj major cauzat de disfuncționalitați ...
-
Procurorii au pus sechestru pe o casă şi două terenuri deţinute de influencerul Makaveli, acuzat de evaziune fiscală
Procurorii au pus sechestru pe o casa si doua terenuri detinute de influencerul Alexandru Zidaru, cunoscut ca Makaveli. ...
-
Fenomenul care schimbă vremea la nivel global și-a făcut apariția: El Niño a început și se va intensifica
Meteorologii americani au confirmat: El Niño a inceput și se va intensifica. Seceta in Asia, recolte in pericol, ...
-
Medicamentele viitorului, fabricate pe orbită: Industria farmaceutică intră în cursa spațială
Industria farmaceutica ar putea intra intr-o noua era, odata cu extinderea producției de medicamente in spațiu, pe orbit ...
-
Tabla magnetică sau flipchart: ce e mai eficient pentru prezentări interactive? Top produse în 2026 pentru spații de lucru moderne
O prezentare buna nu se bazeaza doar pe slide-uri sau pe discursul celui care vorbește. Conteaza și felul in care ideile ...
-
O confuzie privind denumirea unei proteine a dus la o eroare în alegerea anticorpilor, afectând sute de lucrări științifice
Sute de oameni de știința care studiaza cancerul și imbatranirea au comis o greșeala ușor de evitat, dar semnificativa, ...
-
Descoperire uluitoare: Conștiința ta apare dintr-o vastă rețea „invizibilă”, sugerează un studiu revoluționar
De decenii, neuroștiința a cartografiat harta conștiinței. A identificat neuroni, a cartografiat regiunile creieru ...
-
Fenomen fără precedent: a început să plouă în Antarctica, iar temperaturile ating valori record
Peninsula Antarctica a inregistrat la inceputul lunii iunie temperaturi neobișnuit de ridicate, cu valori care au depași ...
-
Un studiu inedit explică ce se întâmplă în creierul celor care asistă la un concert live
Deși in prezent beneficiem de viniluri hi-fi, de sisteme audio rezidențiale capabile sa concureze cu acustica din cinema ...
-
Facturile la curent și gaze au devenit o povară uriașă pentru români. Cât alocă aceștia din venituri doar pe energie
Concluzie ingrijoratoare a unei analize realizate de Asociația Energia Inteligenta (AEI): facturile la energie ii sarace ...
-
Un livrator de mâncare a aprins rețelele de socializare, după ce a recunoscut că gustă din toate comenzile
Un filmuleț postat pe internet a starnit din nou discuții despre cat de sigura este mancarea pe care o comandam acasa. T ...
-
Îngrijorări mari legate de confidențialitate: cum poți fi văzut, chiar și prin pereți, din cauza semnalului WiFi
Cercetatorii din Germania avertizeaza ca rețelele WiFi obișnuite ar putea deveni o noua forma puternica de supraveghere ...
-
Sfaturi pentru a învinge anemia și a-ți recăpăta pofta de viață
Te privești in oglinda dimineața și observi ca pielea ta și-a pierdut stralucirea naturala, lasand in loc o paloare ingr ...
-
PUBLICARE DISPOZITIV HOTĂRÂRE JUDECĂTOREASCĂ: Dosar nr. 21151/3/2020 – Tribunalul București, Secția a V-a Civilă
În conformitate cu Sentința Civila pronunțata in data de 21.04.2021 de catre Tribunalul București, Secția a V-a Ci ...
-
Piesa de rezistenta din garderoba masculina pe care o ignori in fiecare dimineata
Vara bate la usa si, odata cu ea, vine si dilema vesnica a barbatilor practici: ce pui pe tine cand vrei sa arati bine f ...
-
Start într-un război total sau joc de negociere? Ce se ascunde în spatele noilor atacuri dintre SUA și Iran
Valul de atacuri lansat miercuri dimineața de Corpul Gardienilor Revoluției Islamice asupra bazelor americane din regiun ...
comentarii
Adauga un comentariuAdauga comentariu