Halucinațiile AI devin din ce în ce mai grave. Și nu, nu vor dispărea prea curând
Postat la: 12.05.2025 |
Deși OpenAI, Google și alți giganți tehnologici au lansat în ultimele luni actualizări menite să îmbunătățească capacitatea chatboturilor de a raționa și a răspunde mai precis, testele recente arată că aceste versiuni noi sunt adesea mai puțin fiabile decât cele anterioare.
Vinovate sunt așa-numitele „halucinații", erori de conținut în care modelele oferă informații false, irelevante sau complet inventate. Și, potrivit unor analize independente, nu doar că problema persistă, dar pare să se agraveze. Un raport tehnic publicat de OpenAI a scos la iveală faptul că cele mai noi modele de limbaj, o3 și o4-mini, lansate în aprilie 2025, înregistrează rate de halucinație mult mai mari decât versiunea anterioară, o1, din 2024.
În sarcini precum rezumarea informațiilor publice despre persoane, modelul o3 a halucinat în 33% din cazuri, iar o4-mini în 48%. Spre comparație, o1 avea o rată de eroare de doar 16%. Nici ceilalți jucători din industrie nu stau mai bine. Un clasament realizat de compania Vectara, care monitorizează acuratețea modelelor AI în diverse sarcini, arată că mai multe modele „de raționament", inclusiv DeepSeek-R1, dezvoltat de compania DeepSeek, au înregistrat creșteri în două cifre ale ratei de halucinație față de versiunile anterioare.
OpenAI susține că procesul de raționament nu este în sine cauza acestor erori. „Halucinațiile nu sunt neapărat mai frecvente în modelele de raționament, însă lucrăm activ pentru a reduce ratele ridicate observate la o3 și o4-mini", a declarat un purtător de cuvânt al companiei. Problema nu este doar una tehnică, ci are implicații directe pentru utilizarea practică a acestor tehnologii. Un chatbot care oferă constant informații false nu este un asistent de cercetare util.
Un „paralegal virtual" care citează cazuri inexistente poate compromite un proces. Un agent de relații cu clienții care transmite politici expirate poate afecta reputația unei companii. Clasamentul Vectara evaluează modelele în funcție de consistența lor factuală în sarcini de rezumare a unor documente. Potrivit lui Forrest Sheng Bao, cercetător la Vectara, ratele de halucinație sunt „aproape identice" între modelele de raționament și cele care nu folosesc astfel de tehnici, cel puțin în cazul sistemelor dezvoltate de OpenAI și Google. Google nu a oferit comentarii suplimentare.
Emily Bender, lingvist computațional la Universitatea din Washington, atrage atenția că aceste teste nu reflectă acuratețea modelelor în alte tipuri de sarcini. Mai mult, termenul „halucinație" este considerat problematic. „Induce ideea că aceste erori sunt anomalii ce pot fi eliminate și umanizează excesiv mașinile, când spunem că halucinează, sugerăm că percep realitatea, ceea ce nu e cazul", declară Bender.
Și Arvind Narayanan, expert în AI la Universitatea Princeton, avertizează că problema este mai complexă. Modelele pot greși și din alte motive, precum utilizarea unor surse nesigure sau învechite. Suplimentarea datelor de antrenament și a puterii de calcul nu a dus automat la creșterea acurateței. Narayanan sugerează că, în unele cazuri, folosirea AI e justificată doar dacă verificarea răspunsurilor e mai rapidă decât cercetarea de la zero. Dar pentru multe aplicații critice, cea mai sigură soluție ar putea fi pur și simplu să nu ne bazăm deloc pe chatboturi pentru informații factuale.
DIN ACEEASI CATEGORIE...
-
Cum a apărut campania "Invazia peștilor-iepure/ peștilor-balon" pe plajele grecești
Hai sa rezolvam campania "Invazia peștilor-iepure/ peștilor-balon pe plajele grecești"- pentru ca m-am plictisit sa rasp ...
-
Aerul din bucatarie stie lucruri pe care tu le ignori
Bucataria ta respira - si nu intotdeauna bine. Mirosurile de gatit, aburii, grasimea in suspensie: toate acestea se depu ...
-
Alertă pentru cei care merg la plajă: o bacterie periculoasă se extinde în Europa
Sezonul estival incepe cu noi avertismente pentru turiști. Specialiștii spun ca temperaturile tot mai ridicate ale apei ...
-
Valul de caniculă extremă din Europa va ajunge și în România. În Spania, temperaturile depășesc deja 45 de grade
Europa se confrunta cu un nou episod de canicula extrema, care provoaca victime și pune sub presiune autoritațile din ma ...
-
Axios: Netanyahu a fost „isteric" din cauza acordului SUA-Iran ce privește Libanul
Guvernul israelian este ingrijorat ca acordul dintre SUA și Iran ar putea legitima influența Iranului in Liban și ar put ...
-
Andreea Bănică, experiență violentă în aeroportul Otopeni: „Am primit și un ghiozdan în ceafă"
Înainte de a pleca intr-o escapada de cateva zile, Andreea Banica a avut parte de o serie de incidente neplacute p ...
-
Mircea Dinescu, pamflet după ce Guvernul Veștea a picat: "Meseria de sforar, pe care Bolojan a uitat s-o impoziteze, face o concurență neloială păienjenilor"
Mircea Dinescu a publicat un pamflet pe Facebook, dupa ce Guvernul propus de Adrian Vestea nu a reusit sa primeasca votu ...
-
Trenduri noi în echiparea laboratoarelor: lame de microscop avansate, consumabile smart și automatizare pentru un laborator performant
Presiunea de a obține rezultate mai rapide, mai precise și mai ușor de urmarit schimba felul in care arata un laborator ...
-
Fenomenul care dogorește Europa: Ce este "blocajul omega" și de ce aduce temperaturi extreme
Valul de caldura intens care cuprinde Europa de Vest si care a dus deja la peste 40 de decese numai in Franta este alime ...
-
Ce nu îți spune niciun ghid urban despre scuterul electric la sat
Dimineața pleci la camp, la pranz treci pe la vecin sa iei niște oua, dupa-amiaza faci un drum pana la magazinul din cen ...
-
Momentul bizar care a declanșat era „farfuriilor zburătoare". Ce a văzut pe cer experimentatul pilot Kenneth Arnold
Acum aproape opt decenii se dadea startul „erei" OZN-urilor. Extratereștrii și „farfuriile zburatoare" au de ...
-
Marea întoarcere: Turiștii canadieni, în frunte cu cei din Gen Z, revin în forță în SUA
Milioane de turiști canadieni au revenit in forța in Statele Unite in ultimele luni, dupa un ingheț de peste un an și ju ...
-
Ce nu trebuie să spui niciodată când ești oprit de poliție în trafic. Întrebarea aparent banală a polițistului care poate influența dosarul
Puțini șoferi raman complet relaxați atunci cand sunt opriți de poliție in trafic. În astfel de momente, agenții l ...
-
Nu face minuni, dar e ieftin și înlocuiește cu succes pâinea albă - Alimentul pe care persoanele cu glicemie mare ar trebui să-l consume zilnic
Cand vine vorba despre glicemie, soluțiile spectaculoase sunt rare. Cele utile sunt, de multe ori, banale. Unul dintre c ...
-
„Burevestnik", arma care îi îngrijorează pe experți. Rusia a creat prima rachetă de croazieră propulsată de un reactor nuclear deschis
Doi cercetatori de la Massachusetts Institute of Technology (MIT) susțin ca au reușit sa descifreze principiul de funcți ...
-
PNL își exclude „puciștii". 18 lideri și parlamentari, dați afară după susținerea Guvernului. Cătălin Predoiu, Adrian Veștea și Hubert Thuma, pe listă
Partidul Național Liberal se pregatește pentru una dintre cele mai ample serii de excluderi din ultimii ani. Noua conduc ...
-
A mers pe mâna lui Trump și a pierdut. Benjamin Netanyahu trage ponoasele după acordul dintre Washington și Iran
Timp de zece ani, premierul Benjamin Netanyahu a jucat totul pe o singura carte: Donald Trump. A pariat ca, braț la braț ...
-
Fenomen astronomic rar, vizibil cu ochiul liber: Marte se întâlnește cu Pleiadele
Cei care privesc cerul inainte de rasaritul Soarelui vor putea vedea, in aceasta saptamana, o apropiere spectaculoasa in ...
-
Peștele toxic care bagă Grecia în alertă. A fost observat tot mai aproape de plajele frecventate de turiști și Crucea Roșie lansează avertismente
Autoritațile din Grecia urmaresc cu ingrijorare extinderea rapida a unei specii invazive care a ajuns tot mai aproape de ...
-
Care sunt cele mai bune aplicații de cazinou pe mobil
Descopera criteriile importante pentru alegerea unei aplicații de casino mobil și afla ce ofera principalele platforme d ...
-
Moment istoric în Port Bazinul Nou Galaţi. Prima navă a acostat după 38 de ani
Port Bazinul Nou Galati a marcat un moment considerat istoric pentru infrastructura portuara a orasului, odata cu acosta ...
-
Premierul britanic Keir Starmer a demisionat: instabilitate fără precedent în istoria modernă a țării
Premierul britanic Keir Starmer a demisionat, scrie presa britanica. El a spus ca a discutat deja cu regele. Starmer est ...
-
Daily Express: Zelenski amenință să extindă conflictul cu Rusia printr-un atac asupra Belarus
Declarația lui Volodimir Zelenski privind un posibil atac asupra Republicii Belarus poate duce la o escaladare a conflic ...
-
Anunț major de la Teheran după negocieri: Iranul spune că restricțiile asupra exporturilor de petrol au fost eliminate
Iranul a transmis luni primele semnale privind rezultatele discuțiilor diplomatice purtate in ultimele zile, iar mesajul ...
-
ANAF declanșează una dintre cele mai mari vânzări de bunuri din ultimii ani: mii de vagoane, locomotive și proprietăți ale CFR Marfă, scoase la licitație
Autoritațile fiscale au demarat o ampla operațiune de valorificare a activelor aflate sub sechestru ale CFR Marfa, intr- ...
-
Credibilitatea lui Trump primeste inca o lovitură: Iranul afirmă că nu mai redeschide Strâmtoarea Ormuz până nu va fi pace în Liban
Agentia iraniana de presa Tasnim a relatat duminica, citand o sursa apropiata echipei de negociere, ca Iranul nu intenti ...
-
Decizie istorică pentru ortodocși: De teama lui Donald Trump, Recep Tayyip Erdogan a ordonat redeschiderea Seminarului Teologic Halki
Presedintele Turciei, Recep Tayyip Erdogan, a ordonat duminica reluarea discutiilor privind redeschiderea Seminarului Te ...
-
„Fiica" misterioasă: Postarea criptică a lui Trump devenită virală pe rețelele sociale
Președintele Donald Trump este cunoscut deja pentru rafale de postari pe rețeaua sa sociala, la ceas de seara, pe subiec ...
-
Noul Air Force One. Trump: "Casă Albă zburătoare la un nivel de lux pe care nimeni nu l-a mai văzut până acum"
Președintele Donald Trump a dezvaluit un nou avion Boeing 747-8 pentru Air Force One, pe care guvernul din Qatar i l-a d ...
-
Virusul care poate persista în creier luni sau chiar ani după infecție. Ce au descoperit oamenii de știință
Virusul Ebola poate supraviețui neobservat in organism luni sau chiar ani dupa infecția inițiala, ceea ce poate favoriza ...
comentarii
Adauga un comentariuAdauga comentariu