Halucinațiile AI devin din ce în ce mai grave. Și nu, nu vor dispărea prea curând
Postat la: 12.05.2025 | Scris de: ZIUA NEWS
Deși OpenAI, Google și alți giganți tehnologici au lansat în ultimele luni actualizări menite să îmbunătățească capacitatea chatboturilor de a raționa și a răspunde mai precis, testele recente arată că aceste versiuni noi sunt adesea mai puțin fiabile decât cele anterioare.
Vinovate sunt așa-numitele „halucinații", erori de conținut în care modelele oferă informații false, irelevante sau complet inventate. Și, potrivit unor analize independente, nu doar că problema persistă, dar pare să se agraveze. Un raport tehnic publicat de OpenAI a scos la iveală faptul că cele mai noi modele de limbaj, o3 și o4-mini, lansate în aprilie 2025, înregistrează rate de halucinație mult mai mari decât versiunea anterioară, o1, din 2024.
În sarcini precum rezumarea informațiilor publice despre persoane, modelul o3 a halucinat în 33% din cazuri, iar o4-mini în 48%. Spre comparație, o1 avea o rată de eroare de doar 16%. Nici ceilalți jucători din industrie nu stau mai bine. Un clasament realizat de compania Vectara, care monitorizează acuratețea modelelor AI în diverse sarcini, arată că mai multe modele „de raționament", inclusiv DeepSeek-R1, dezvoltat de compania DeepSeek, au înregistrat creșteri în două cifre ale ratei de halucinație față de versiunile anterioare.
OpenAI susține că procesul de raționament nu este în sine cauza acestor erori. „Halucinațiile nu sunt neapărat mai frecvente în modelele de raționament, însă lucrăm activ pentru a reduce ratele ridicate observate la o3 și o4-mini", a declarat un purtător de cuvânt al companiei. Problema nu este doar una tehnică, ci are implicații directe pentru utilizarea practică a acestor tehnologii. Un chatbot care oferă constant informații false nu este un asistent de cercetare util.
Un „paralegal virtual" care citează cazuri inexistente poate compromite un proces. Un agent de relații cu clienții care transmite politici expirate poate afecta reputația unei companii. Clasamentul Vectara evaluează modelele în funcție de consistența lor factuală în sarcini de rezumare a unor documente. Potrivit lui Forrest Sheng Bao, cercetător la Vectara, ratele de halucinație sunt „aproape identice" între modelele de raționament și cele care nu folosesc astfel de tehnici, cel puțin în cazul sistemelor dezvoltate de OpenAI și Google. Google nu a oferit comentarii suplimentare.
Emily Bender, lingvist computațional la Universitatea din Washington, atrage atenția că aceste teste nu reflectă acuratețea modelelor în alte tipuri de sarcini. Mai mult, termenul „halucinație" este considerat problematic. „Induce ideea că aceste erori sunt anomalii ce pot fi eliminate și umanizează excesiv mașinile, când spunem că halucinează, sugerăm că percep realitatea, ceea ce nu e cazul", declară Bender.
Și Arvind Narayanan, expert în AI la Universitatea Princeton, avertizează că problema este mai complexă. Modelele pot greși și din alte motive, precum utilizarea unor surse nesigure sau învechite. Suplimentarea datelor de antrenament și a puterii de calcul nu a dus automat la creșterea acurateței. Narayanan sugerează că, în unele cazuri, folosirea AI e justificată doar dacă verificarea răspunsurilor e mai rapidă decât cercetarea de la zero. Dar pentru multe aplicații critice, cea mai sigură soluție ar putea fi pur și simplu să nu ne bazăm deloc pe chatboturi pentru informații factuale.
DIN ACEEASI CATEGORIE...
-
Voi știți de ce mănâncă românii pește de Anul Nou? Ce spune o tradiție moștenită din generație în generație și pe care mulți o cred reală
Romanii se asigura ca pun in aplicare toate obiceiurile transmise din generație in generație de sarbatori, fiindca sunt ...
-
Un nou mister sub Bermuda: O structură gigantică sfidează explicațiile geologilor
O descoperire sub Bermuda scoate la iveala o structura masiva, unica pe Pamant, care ar putea explica de ce insula &bdqu ...
-
Experții avertizează: 5 lucruri pe care nu trebuie să le împărtășiți niciodată cu ChatGPT. Ce pași să urmați dacă deja le-ați partajat
Tot mai mulți oameni folosesc ChatGPT și alte chatbot-uri AI precum Gemini, Copilot și Claude in viața de zi cu zi. Un s ...
-
Diferența cheie dintre o răceală și super-gripa care face ravagii în Europa: 10 simptome care le diferențiază
Diferența cheie dintre super-gripa și raceala consta in apariția brusca și severitatea simptomelor, esențiala pentru pro ...
-
Fost director SIE: România este pregătită pentru război, sărăcie și garanții de miliarde, în timp ce atenția publică este deliberat deturnată
Generalul (r) Silviu Predoiu lanseaza un avertisment dur privind direcția in care este impinsa Romania, intr-un context ...
-
Congresul SUA analizează reguli stricte pentru exportul de ADN sintetic către China și Rusia
Un grup bipartizan de parlamentari americani a propus reguli noi care ar obliga firmele din SUA sa ceara licența inainte ...
-
Cazul care uimește Italia: un fugar care evadase dintr-o închisoare s-a camuflat într-o statuie falsă
Un barbat in varsta de 38 de ani a fost arestat sambata in sudul Italiei, dupa ce primarul orașului l-a vazut pozand ca ...
-
Domeniul în care Inteligența Artificială a preluat aproape complet controlul: Intervenția umană este limitată
Depozitele aflate in centrul lanțurilor globale de aprovizionare se transforma rapid in operațiuni extrem de inteligente ...
-
"Execuție" șocantă în parcare: Șofer român ucisă pe loc de un alt conațional, în Italia. Autopsia confirmă - nu a avut nicio șansă
Detalii noi ies la iveala in cazul camionagiu roman ucis pe 12 octombrie intr-o parcare pentru TIR-uri din zona Bolzano ...
-
Reforma otrăvurilor din alimente: RF Kennedy Jr. va publica ghidul care va interzice alimentele ultraprocesate
RF Kennedy Jr. a vorbit recent despre impactul obezitații și al alimentației asupra sanatații publice, evidențiind totod ...
-
Pur și simplu șoc! Oamenii de știință au găsit cum sa rescrie trecutul quantic care sa influențeze viitorul - fenomenul deja-vu
Dar despre aceasta parte a fizicii cuantice aproape ca nu veți gasi informații, pentru ca toata lumea scrie și vorbește ...
-
Despre pace nici nu mai poate fi vorba. Războiul este mai aproape ca oricând.
Dupa ce UE a decis practic confiscarea activelor Rusiei in valoare de 210 miliarde euro printr-o procedura speciala (pe ...
-
Elon Musk, cel mai bogat om din lume, dezvăluie că opinia sa despre Dumnezeu s-a schimbat
Elon Musk, in varsta de 54 de ani, proprietarul companiilor Tesla, SpaceX și X, este conform Indexului Bloomberg Billion ...
-
RCA pentru trotinete este obligatorie, dar prețurile nu au fost stabilite și nimeni nu vinde asemenea asigurări. Totuși, amenzile mari există
Situație tipic romaneasca pe piața asigurarilor din Romania, de data asta insa cu noi efecte, avand in vedere faptul ca ...
-
Putin îl ridiculizează pe Trump, nu acceptă planul: Refuză banii, el vrea ceva special pentru Rusia
Vladimir Putin nu accepta planul administrației americane pentru pace cu Ucraina propus de Donald Trump, chiar daca este ...
-
Revoluție pe drumurile României. 400 de camere radar fixe vor „patrula” non-stop traficul național. În ce județe vor fi montate și când intră în vigoare
CNAIR a deschis una dintre cele mai ample licitații din ultimii an. Este vorba despre instalarea a 400 de camere video f ...
-
Pastila ieftină prezentată drept „Ozempicul alcoolului" este deja disponibilă pe piață. Cum reduce pofta de a bea: "A funcționat instant pentru mine"
O pastila ieftina este prezentata drept „Ozempicul alcoolului" datorita capacitații sale de a reduce pofta de a co ...
-
Oamenii de știință de la Universitatea Stanford au explicat cum vaccinurile Covid pot provoca leziuni cardiace: anchetă în SUA după decese suspecte
Oamenii de știința de la Universitatea Stanford au dezvaluit cum vaccinurile Covid mRNA pot provoca leziuni celulelor in ...
-
Teleportarea cuantică a ieșit din laborator. S-a realizat prima teleportare cuantică pe internet
Ce parea pana recent un experiment imposibil a fost demonstrat in condiții reale. O echipa de cercetatori din Statele Un ...
-
Se introduce limitarea plăților cash: Noile norme vor intra în vigoare în România de la 1 ianuarie 2027
Romanii vor trebui sa se obișnuiasca cu o noua regula privind plațile in numerar. Uniunea Europeana a decis impunerea un ...
-
Rusia lansează acuzații grave: România şi Polonia s-ar fi implicat în transportul componentelor unei "bombe murdare" pentru Ucraina
Seful trupelor ruse de aparare radiologica, chimica si biologica (NBC), Aleksei Rtiscev, a acuzat Romania si Polonia ca ...
-
Presa europeană anunță spargerea bulei imobiliare din România: tranzacții în picaj, credite tot mai puține și taxe record din 2026
Presa economica europeana titreaza ca „bula imobiliara din Romania s-a spart", dupa ce pe finalul anului s-a inreg ...
-
Editura Nemira lansează un experiment AI care arată cum i-ar putea afecta pe adolescenți noua programă pentru pentru limba și literatura română propusă de MEC
Romania așteapta deja de peste 16 o noua propunere de programa pentru limba romana. Saptamana trecuta, Ministerul Educaț ...
-
Final de an de coșmar pentru România: Prețurile efectiv au bubuit, iar inflația se menține la cote înalte
Rata anuala a inflatiei a stagnat la 9,8% in luna noiembrie a acestui an, in conditiile in care serviciile s-au scumpit ...
-
Soțul unei foste Miss e acuzat că și-a ucis și tranșat soția într-un mod odios. Detalii din anchetă
Soțul unei foste finaliste la Miss Elveția a fost acuzat de uciderea acesteia, dupa o crima macabra care a șocat intreag ...
-
Judecătorii din CSM sesizează Inspecția Judiciară, după documentarul Recorder: Acuză o campanie de destabilizare a puterii judecătoreşti
Sectia pentru judecatori a Consiliului Superior al Magistraturii a decis sesizarea Inspectiei Judiciare pentru efectuare ...
-
Metoda prin care românii sunt păcăliți de AI să plătească mai mult atunci când cumpără pe internet
Comerțul pe internet trece printr-o transformare majora, odata cu implementarea tehnologiilor bazate pe Inteligența Arti ...
-
Avertisment medical major: grupa ta de sânge îți poate crește riscul de AVC. Cine intră în zona de pericol
Un studiu recent evidențiaza o conexiune intre grupa de sange și riscul de accident vascular cerebral, aratand ca anumit ...
-
El este principalul suspect în uciderea lui Charlie Kirk: A apărut pentru prima oară în instanță
Suspectul in cazul uciderii lui Charlie Kirk apare in instanța, in timp ce judecatorul decide asupra accesului media și ...
-
Tratament revoluționar pentru diabet: O chinezoaică de 25 de ani este prima pacientă din lume care a obținut independența față de injecțiile cu insulină
În urma unui tratament revoluționar dezvoltat de cercetatorii chinezi, o femeie de 25 de ani care avea diabet de t ...
comentarii
Adauga un comentariuAdauga comentariu