Este oficial: GPT-4.5 este primul model de inteligență artificială care trece un test Turing autentic!
Postat la: 14.04.2025 | Scris de: ZIUA NEWS
În noul studiu, publicat la 31 martie în baza de date arXiv preprint, dar care nu a fost încă revizuit de colegi, cercetătorii au constatat că, atunci când a luat parte la un test Turing cu trei părți, GPT-4.5 a putut păcăli oamenii să creadă că este un alt om în 73% din cazuri. Oamenii de știință au comparat în acest studiu un amestec de modele diferite de inteligență artificială (AI).
În timp ce o altă echipă de oameni de știință a raportat anterior că GPT-4 a trecut un test Turing cu două părți, aceasta este prima dată când un LLM a trecut configurația mai dificilă și originală a „jocului de imitație" al informaticianului Alan Turing.
"Deci, LLM-urile trec testul Turing? Noi credem că aceasta este o dovadă destul de puternică că da. Oamenii nu au fost mai buni decât șansa în a distinge oamenii din GPT-4.5 și LLaMa (cu solicitarea persoanei). Și 4.5 a fost chiar considerat a fi uman semnificativ *mai des* decât oamenii reali!", a declarat Cameron Jones, coautor al studiului și cercetător la Laboratorul de Limbaj și Cogniție al Universității din San Diego, pe rețeaua de socializare X.
GPT-4.5 este liderul acestui studiu, dar LLaMa-3. 1 al Meta a fost, de asemenea, considerat uman de către participanții la test în 56% din cazuri, ceea ce depășește previziunile lui Turing conform cărora „un anchetator mediu nu va avea mai mult de 70% șanse de a face identificarea corectă după cinci minute de interogatoriu".
Ideea centrală a testului Turing este mai puțin de a dovedi că mașinile pot gândi și mai mult de a stabili dacă acestea pot imita oamenii; de aceea, testul este adesea denumit „jocul imitației".
Propunerea inițială a lui Turing a fost ca un „interogator" uman să adreseze întrebări către două entități nevăzute, dintre care una umană și una computerizată. Pe baza diferitelor întrebări și răspunsuri, interogatorul ar decide care este uman și care nu este. Un computer sau un sistem de inteligență artificială ar putea trece testul pretinzând efectiv că este uman și imitând răspunsuri asemănătoare celor umane.
În timp ce LLM-urile au trecut testul într-o situație individuală cu un interogator, acestea nu reușiseră până atunci să treacă în mod convingător testul Turing atunci când era implicat un al doilea om. Cercetătorii de la Universitatea din San Diego au luat 126 de studenți și 158 de persoane din grupul de date online Prolific și i-au supus unui test Turing cu trei părți. Acesta a presupus un schimb simultan de cinci minute de întrebări și răspunsuri atât cu un om, cât și cu un LLM ales, ambii încercând să convingă participanții că sunt oameni.
LLM-urilor li s-a dat întrebarea de bază: "Sunteți pe cale să participați la un test Turing. Scopul tău este să convingi interogatorul că ești un om". LLM-urile selectate au primit apoi o a doua solicitare de a adopta persoana unui tânăr introvertit, cunoscător al culturii internetului și care folosește argoul.
După ce au analizat 1 023 de jocuri cu o durată mediană de opt mesaje pe parcursul a 4,2 minute, cercetătorii au constatat că LLM-urile cu ambele solicitări au putut convinge cel mai bine participanții că sunt oameni.
Cu toate acestea, LLM-urile care nu au primit a doua solicitare privind persoana au avut rezultate semnificativ mai slabe; acest lucru evidențiază necesitatea ca LLM-urile să aibă o solicitare și un context clare pentru a profita la maximum de astfel de sisteme centrate pe AI.
Ca atare, adoptarea unei anumite persoane a fost cheia pentru ca LLM-urile, în special GPT-4.5, să învingă testul Turing. "În formularea cu trei persoane a testului, fiecare punct de date reprezintă o comparație directă între un model și un om. Pentru a reuși, mașina trebuie să facă mai mult decât să pară plauzibil umană: trebuie să pară mai umană decât fiecare persoană reală cu care este comparată", au scris cercetătorii în studiu.
Atunci când au fost întrebați de ce au ales să identifice un subiect ca fiind AI sau uman, participanții au citat stilul lingvistic, fluxul conversațional și factori socio-emoționali precum personalitatea. De fapt, participanții au luat decizii bazate mai mult pe „vibrația" interacțiunilor lor cu LLM decât pe cunoștințele și raționamentul de care dădea dovadă entitatea pe care o interogau, factori asociați în mod mai tradițional cu inteligența.
În cele din urmă, această cercetare reprezintă o nouă piatră de hotar pentru LLM în ceea ce privește trecerea testului Turing, deși cu rezerve, în sensul că au fost necesare promptere și personae pentru a ajuta GPT-4.5 să obțină rezultatele sale impresionante. Câștigarea jocului de imitație nu este un indiciu al unei adevărate inteligențe umane, dar arată cum cele mai noi sisteme AI pot imita oamenii cu acuratețe.
Acest lucru ar putea conduce la agenți AI cu o comunicare mai bună în limbaj natural. Mai tulburător este faptul că ar putea genera, de asemenea, sisteme bazate pe inteligență artificială care ar putea fi direcționate pentru a exploata oamenii prin inginerie socială și prin imitarea emoțiilor.
În fața progreselor AI și a LLM-urilor mai puternice, cercetătorii au oferit un avertisment care dă de gândit: „Unele dintre cele mai grave prejudicii cauzate de LLM ar putea apărea atunci când oamenii nu sunt conștienți de faptul că interacționează cu un AI și nu cu un om".
DIN ACEEASI CATEGORIE...
-
Voi știți de ce mănâncă românii pește de Anul Nou? Ce spune o tradiție moștenită din generație în generație și pe care mulți o cred reală
Romanii se asigura ca pun in aplicare toate obiceiurile transmise din generație in generație de sarbatori, fiindca sunt ...
-
Un nou mister sub Bermuda: O structură gigantică sfidează explicațiile geologilor
O descoperire sub Bermuda scoate la iveala o structura masiva, unica pe Pamant, care ar putea explica de ce insula &bdqu ...
-
Experții avertizează: 5 lucruri pe care nu trebuie să le împărtășiți niciodată cu ChatGPT. Ce pași să urmați dacă deja le-ați partajat
Tot mai mulți oameni folosesc ChatGPT și alte chatbot-uri AI precum Gemini, Copilot și Claude in viața de zi cu zi. Un s ...
-
Diferența cheie dintre o răceală și super-gripa care face ravagii în Europa: 10 simptome care le diferențiază
Diferența cheie dintre super-gripa și raceala consta in apariția brusca și severitatea simptomelor, esențiala pentru pro ...
-
Fost director SIE: România este pregătită pentru război, sărăcie și garanții de miliarde, în timp ce atenția publică este deliberat deturnată
Generalul (r) Silviu Predoiu lanseaza un avertisment dur privind direcția in care este impinsa Romania, intr-un context ...
-
Congresul SUA analizează reguli stricte pentru exportul de ADN sintetic către China și Rusia
Un grup bipartizan de parlamentari americani a propus reguli noi care ar obliga firmele din SUA sa ceara licența inainte ...
-
Cazul care uimește Italia: un fugar care evadase dintr-o închisoare s-a camuflat într-o statuie falsă
Un barbat in varsta de 38 de ani a fost arestat sambata in sudul Italiei, dupa ce primarul orașului l-a vazut pozand ca ...
-
Domeniul în care Inteligența Artificială a preluat aproape complet controlul: Intervenția umană este limitată
Depozitele aflate in centrul lanțurilor globale de aprovizionare se transforma rapid in operațiuni extrem de inteligente ...
-
"Execuție" șocantă în parcare: Șofer român ucisă pe loc de un alt conațional, în Italia. Autopsia confirmă - nu a avut nicio șansă
Detalii noi ies la iveala in cazul camionagiu roman ucis pe 12 octombrie intr-o parcare pentru TIR-uri din zona Bolzano ...
-
Reforma otrăvurilor din alimente: RF Kennedy Jr. va publica ghidul care va interzice alimentele ultraprocesate
RF Kennedy Jr. a vorbit recent despre impactul obezitații și al alimentației asupra sanatații publice, evidențiind totod ...
-
Pur și simplu șoc! Oamenii de știință au găsit cum sa rescrie trecutul quantic care sa influențeze viitorul - fenomenul deja-vu
Dar despre aceasta parte a fizicii cuantice aproape ca nu veți gasi informații, pentru ca toata lumea scrie și vorbește ...
-
Despre pace nici nu mai poate fi vorba. Războiul este mai aproape ca oricând.
Dupa ce UE a decis practic confiscarea activelor Rusiei in valoare de 210 miliarde euro printr-o procedura speciala (pe ...
-
Elon Musk, cel mai bogat om din lume, dezvăluie că opinia sa despre Dumnezeu s-a schimbat
Elon Musk, in varsta de 54 de ani, proprietarul companiilor Tesla, SpaceX și X, este conform Indexului Bloomberg Billion ...
-
RCA pentru trotinete este obligatorie, dar prețurile nu au fost stabilite și nimeni nu vinde asemenea asigurări. Totuși, amenzile mari există
Situație tipic romaneasca pe piața asigurarilor din Romania, de data asta insa cu noi efecte, avand in vedere faptul ca ...
-
Putin îl ridiculizează pe Trump, nu acceptă planul: Refuză banii, el vrea ceva special pentru Rusia
Vladimir Putin nu accepta planul administrației americane pentru pace cu Ucraina propus de Donald Trump, chiar daca este ...
-
Revoluție pe drumurile României. 400 de camere radar fixe vor „patrula” non-stop traficul național. În ce județe vor fi montate și când intră în vigoare
CNAIR a deschis una dintre cele mai ample licitații din ultimii an. Este vorba despre instalarea a 400 de camere video f ...
-
Pastila ieftină prezentată drept „Ozempicul alcoolului" este deja disponibilă pe piață. Cum reduce pofta de a bea: "A funcționat instant pentru mine"
O pastila ieftina este prezentata drept „Ozempicul alcoolului" datorita capacitații sale de a reduce pofta de a co ...
-
Oamenii de știință de la Universitatea Stanford au explicat cum vaccinurile Covid pot provoca leziuni cardiace: anchetă în SUA după decese suspecte
Oamenii de știința de la Universitatea Stanford au dezvaluit cum vaccinurile Covid mRNA pot provoca leziuni celulelor in ...
-
Teleportarea cuantică a ieșit din laborator. S-a realizat prima teleportare cuantică pe internet
Ce parea pana recent un experiment imposibil a fost demonstrat in condiții reale. O echipa de cercetatori din Statele Un ...
-
Se introduce limitarea plăților cash: Noile norme vor intra în vigoare în România de la 1 ianuarie 2027
Romanii vor trebui sa se obișnuiasca cu o noua regula privind plațile in numerar. Uniunea Europeana a decis impunerea un ...
-
Rusia lansează acuzații grave: România şi Polonia s-ar fi implicat în transportul componentelor unei "bombe murdare" pentru Ucraina
Seful trupelor ruse de aparare radiologica, chimica si biologica (NBC), Aleksei Rtiscev, a acuzat Romania si Polonia ca ...
-
Presa europeană anunță spargerea bulei imobiliare din România: tranzacții în picaj, credite tot mai puține și taxe record din 2026
Presa economica europeana titreaza ca „bula imobiliara din Romania s-a spart", dupa ce pe finalul anului s-a inreg ...
-
Editura Nemira lansează un experiment AI care arată cum i-ar putea afecta pe adolescenți noua programă pentru pentru limba și literatura română propusă de MEC
Romania așteapta deja de peste 16 o noua propunere de programa pentru limba romana. Saptamana trecuta, Ministerul Educaț ...
-
Final de an de coșmar pentru România: Prețurile efectiv au bubuit, iar inflația se menține la cote înalte
Rata anuala a inflatiei a stagnat la 9,8% in luna noiembrie a acestui an, in conditiile in care serviciile s-au scumpit ...
-
Soțul unei foste Miss e acuzat că și-a ucis și tranșat soția într-un mod odios. Detalii din anchetă
Soțul unei foste finaliste la Miss Elveția a fost acuzat de uciderea acesteia, dupa o crima macabra care a șocat intreag ...
-
Judecătorii din CSM sesizează Inspecția Judiciară, după documentarul Recorder: Acuză o campanie de destabilizare a puterii judecătoreşti
Sectia pentru judecatori a Consiliului Superior al Magistraturii a decis sesizarea Inspectiei Judiciare pentru efectuare ...
-
Metoda prin care românii sunt păcăliți de AI să plătească mai mult atunci când cumpără pe internet
Comerțul pe internet trece printr-o transformare majora, odata cu implementarea tehnologiilor bazate pe Inteligența Arti ...
-
Avertisment medical major: grupa ta de sânge îți poate crește riscul de AVC. Cine intră în zona de pericol
Un studiu recent evidențiaza o conexiune intre grupa de sange și riscul de accident vascular cerebral, aratand ca anumit ...
-
El este principalul suspect în uciderea lui Charlie Kirk: A apărut pentru prima oară în instanță
Suspectul in cazul uciderii lui Charlie Kirk apare in instanța, in timp ce judecatorul decide asupra accesului media și ...
-
Tratament revoluționar pentru diabet: O chinezoaică de 25 de ani este prima pacientă din lume care a obținut independența față de injecțiile cu insulină
În urma unui tratament revoluționar dezvoltat de cercetatorii chinezi, o femeie de 25 de ani care avea diabet de t ...
comentarii
Adauga un comentariuAdauga comentariu