Este oficial: GPT-4.5 este primul model de inteligență artificială care trece un test Turing autentic!
Postat la: 14.04.2025 |
În noul studiu, publicat la 31 martie în baza de date arXiv preprint, dar care nu a fost încă revizuit de colegi, cercetătorii au constatat că, atunci când a luat parte la un test Turing cu trei părți, GPT-4.5 a putut păcăli oamenii să creadă că este un alt om în 73% din cazuri. Oamenii de știință au comparat în acest studiu un amestec de modele diferite de inteligență artificială (AI).
În timp ce o altă echipă de oameni de știință a raportat anterior că GPT-4 a trecut un test Turing cu două părți, aceasta este prima dată când un LLM a trecut configurația mai dificilă și originală a „jocului de imitație" al informaticianului Alan Turing.
"Deci, LLM-urile trec testul Turing? Noi credem că aceasta este o dovadă destul de puternică că da. Oamenii nu au fost mai buni decât șansa în a distinge oamenii din GPT-4.5 și LLaMa (cu solicitarea persoanei). Și 4.5 a fost chiar considerat a fi uman semnificativ *mai des* decât oamenii reali!", a declarat Cameron Jones, coautor al studiului și cercetător la Laboratorul de Limbaj și Cogniție al Universității din San Diego, pe rețeaua de socializare X.
GPT-4.5 este liderul acestui studiu, dar LLaMa-3. 1 al Meta a fost, de asemenea, considerat uman de către participanții la test în 56% din cazuri, ceea ce depășește previziunile lui Turing conform cărora „un anchetator mediu nu va avea mai mult de 70% șanse de a face identificarea corectă după cinci minute de interogatoriu".
Ideea centrală a testului Turing este mai puțin de a dovedi că mașinile pot gândi și mai mult de a stabili dacă acestea pot imita oamenii; de aceea, testul este adesea denumit „jocul imitației".
Propunerea inițială a lui Turing a fost ca un „interogator" uman să adreseze întrebări către două entități nevăzute, dintre care una umană și una computerizată. Pe baza diferitelor întrebări și răspunsuri, interogatorul ar decide care este uman și care nu este. Un computer sau un sistem de inteligență artificială ar putea trece testul pretinzând efectiv că este uman și imitând răspunsuri asemănătoare celor umane.
În timp ce LLM-urile au trecut testul într-o situație individuală cu un interogator, acestea nu reușiseră până atunci să treacă în mod convingător testul Turing atunci când era implicat un al doilea om. Cercetătorii de la Universitatea din San Diego au luat 126 de studenți și 158 de persoane din grupul de date online Prolific și i-au supus unui test Turing cu trei părți. Acesta a presupus un schimb simultan de cinci minute de întrebări și răspunsuri atât cu un om, cât și cu un LLM ales, ambii încercând să convingă participanții că sunt oameni.
LLM-urilor li s-a dat întrebarea de bază: "Sunteți pe cale să participați la un test Turing. Scopul tău este să convingi interogatorul că ești un om". LLM-urile selectate au primit apoi o a doua solicitare de a adopta persoana unui tânăr introvertit, cunoscător al culturii internetului și care folosește argoul.
După ce au analizat 1 023 de jocuri cu o durată mediană de opt mesaje pe parcursul a 4,2 minute, cercetătorii au constatat că LLM-urile cu ambele solicitări au putut convinge cel mai bine participanții că sunt oameni.
Cu toate acestea, LLM-urile care nu au primit a doua solicitare privind persoana au avut rezultate semnificativ mai slabe; acest lucru evidențiază necesitatea ca LLM-urile să aibă o solicitare și un context clare pentru a profita la maximum de astfel de sisteme centrate pe AI.
Ca atare, adoptarea unei anumite persoane a fost cheia pentru ca LLM-urile, în special GPT-4.5, să învingă testul Turing. "În formularea cu trei persoane a testului, fiecare punct de date reprezintă o comparație directă între un model și un om. Pentru a reuși, mașina trebuie să facă mai mult decât să pară plauzibil umană: trebuie să pară mai umană decât fiecare persoană reală cu care este comparată", au scris cercetătorii în studiu.
Atunci când au fost întrebați de ce au ales să identifice un subiect ca fiind AI sau uman, participanții au citat stilul lingvistic, fluxul conversațional și factori socio-emoționali precum personalitatea. De fapt, participanții au luat decizii bazate mai mult pe „vibrația" interacțiunilor lor cu LLM decât pe cunoștințele și raționamentul de care dădea dovadă entitatea pe care o interogau, factori asociați în mod mai tradițional cu inteligența.
În cele din urmă, această cercetare reprezintă o nouă piatră de hotar pentru LLM în ceea ce privește trecerea testului Turing, deși cu rezerve, în sensul că au fost necesare promptere și personae pentru a ajuta GPT-4.5 să obțină rezultatele sale impresionante. Câștigarea jocului de imitație nu este un indiciu al unei adevărate inteligențe umane, dar arată cum cele mai noi sisteme AI pot imita oamenii cu acuratețe.
Acest lucru ar putea conduce la agenți AI cu o comunicare mai bună în limbaj natural. Mai tulburător este faptul că ar putea genera, de asemenea, sisteme bazate pe inteligență artificială care ar putea fi direcționate pentru a exploata oamenii prin inginerie socială și prin imitarea emoțiilor.
În fața progreselor AI și a LLM-urilor mai puternice, cercetătorii au oferit un avertisment care dă de gândit: „Unele dintre cele mai grave prejudicii cauzate de LLM ar putea apărea atunci când oamenii nu sunt conștienți de faptul că interacționează cu un AI și nu cu un om".
DIN ACEEASI CATEGORIE...
-
Noul Air Force One. Trump: "Casă Albă zburătoare la un nivel de lux pe care nimeni nu l-a mai văzut până acum"
Președintele Donald Trump a dezvaluit un nou avion Boeing 747-8 pentru Air Force One, pe care guvernul din Qatar i l-a d ...
-
Virusul care poate persista în creier luni sau chiar ani după infecție. Ce au descoperit oamenii de știință
Virusul Ebola poate supraviețui neobservat in organism luni sau chiar ani dupa infecția inițiala, ceea ce poate favoriza ...
-
Un cult satanic și teroriștii recrutează copii prin intermediul jocurilor video
Oficiali din domeniul securitații din Regatul Unit avertizeaza asupra creșterii numarului de copii și adolescenți expuși ...
-
Bursele globale închid pe roșu: investitorii evaluează riscurile acordului de pace din Orientul Mijlociu
Pietele bursiere globale au incheiat sedinta de vineri in teritoriu negativ, investitorii evaluand daca acordul de pace ...
-
Surpriză - Corecţia acţiunilor SpaceX şterge aproape toate câştigurile investitorilor medii care au cumpărat după listare
Investitorii medii care au cumparat actiuni SpaceX pe bursa dupa debutul spectaculos al companiei au pierdut aproape toa ...
-
Jocul halucinațiilor. Ce este „provocarea Benadryl" de pe TikTok. O adolescentă a ajuns în moarte cerebrală
O adolescenta in varsta de 15 ani se afla in moarte cerebrala dupa ce a participat la „provocarea Benadryl", o ten ...
-
Marea afacere de la aparatele de reciclare din țară: Pahare de plastic acceptate de tonomatele de colectare, pe fondul unor posibile erori de funcționare
Tot mai multe sesizari din țara ridica semne de intrebare privind funcționarea aparatelor de colectare a ambalajelor, in ...
-
Cheloo a ajuns la Psihiatrie: a făcut scandal la spital, s-a tăiat singur și s-a bătut cu polițiștii
Celebrul cantareț și vedeta TV Cheloo, aflat sub influența substațelor interzise, a provocat un scandal monstru la spita ...
-
ICCJ a repus pe rol dosarul lui Călin Georgescu. Un judecător a formulat cerere de abținere
Înalta Curte de Casație și Justiție a dispus vineri, 19 iunie 2026, o noua masura in dosarul de tentativa de lovit ...
-
Un inginer susține că a găsit o modalitate de a învinge gravitația Pământului
În 2001, inginerul electrician britanic Roger Shawyer a prezentat pentru prima data „motorul imposibil", cun ...
-
Echipamente pizzerie: 15 utilaje pentru un start bun
Echipamente pizzerie inseamna mai mult decat un cuptor și cateva accesorii. Pentru un local care vrea sa produca rapid, ...
-
Jocurile de noroc ale lui Ciucu: Odeta Cristinela Nestor, arestată după un flagrant cu o mită de 100.000 de euro, a ciripit tot!
Dosarul primarului Ciucu, susține DNA, a fost disjuns din alt dosar. În acest prim caz, procurorii spun ca mai mul ...
-
A plouat cu petrol peste Moscova după cel mai amplu atac al Ucrainei: Hainele și mașinile oamenilor, acoperite cu o peliculă de ulei
Ucraina a lansat asupra Rusiei cel mai amplu atac cu drone de la inceputul invaziei. În total, aproape 1.000 de dr ...
-
Industria românească se prăbușește: INS raportează un declin accentuat iar situația va fi din ce in ce mai rea
Datele INS arata ca cifra de afaceri din industrie a scazut in luna aprilie 2026 comparativ cu luna precedenta cu 7,2%. ...
-
Rusia condamnă un român la 15 ani de închisoare pentru spionaj în favoarea Ucrainei
Un cetațean roman a fost condamnat definitiv la 15 ani de inchisoare intr-o colonie penala de maxima securitate din Rusi ...
-
Demonul lui Maxwell, Jubileul și alegerea dintre iertare și sacrificiu
Autor: Dr. Heather Lynn Poarta este un arhetip puternic. Este locul in care energia vie trece din maini in maini și devi ...
-
Bateria care promitea să schimbe mașinile electrice ar fi fost doar o celulă litiu-ion. Scandalul Donut Lab lovește investitorii
Promisiunea unei noi baterii marca Donut Lab suna ca un salt uriaș pentru industria vehiculelor electrice, cu o baterie ...
-
Stare de urgență pe mai multe insule din Grecia. Rezervele de apă au fost epuizate în plin sezon turistic
Ministerul Mediului și Energiei din Grecia a declarat oficial stare de urgența pe insulele Alonissos și Tinos, situate i ...
-
Explicația DNA: de ce a fost inculpat Ciprian Ciucu. Două persoane arestate preventiv în dosar
Primarul Ciprian Ciucu a fost audiat joi la sediul Direcției Naționale Anticorupție (DNA). Edilul spune ca este nevinova ...
-
„Statele Unite au suferit o înfrângere glorioasă": tonul victorios domină presa iraniană după semnarea acordului
Titlurile ziarelor iraniene de joi au adoptat un ton victorios in urma semnarii protocolului de intelegere dintre SUA si ...
-
Lista de cumpărături pentru părinții cu primul copil
Scoica auto pe care o cumperi pentru transport cu mașina poate fi montata direct pe carucior fara sa trezești beb ...
-
Diferența dintre puff bar și kit vape cu atomizor
Doua dispozitive arata aproape identic pe raft: un tub compact, o gura de tragere, niciun buton vizibil. Unul se arunca ...
-
Trei explicații științifice care răcesc scenariile hollywoodiene: Dacă extratereștrii există, de ce nu ne vizitează?!
Publicarea recenta in Statele Unite a unor sute de cazuri de fenomene inexplicabile, odata clasificate, care acopera per ...
-
Ce trebuie să ai în vedere dacă faci mult sport pentru a-ți proteja sănătatea
Practicarea regulata a activitaților fizice și adoptarea unui stil de viața dinamic reprezinta unele dintre cele mai bun ...
-
O asociație fantomă de sorginte useristă spală bani publici printr-o grupare paramilitară
Astazi, Asociația Patria Prima a depus sesizari simultane la DIICOT, Parchet, Ministerul Justiției și Ministerul Finanțe ...
-
Cum trebuie să bei ceaiul ca să aibă cu adevărat efect asupra sanatatii si longevitătii
Deși beneficiile consumului de ceai pentru sanatate și longevitate sunt susținute ferm de știința, o noua analiza averti ...
-
Muntele Erebus aruncă în aer zilnic praf de aur în valoare de 8.000 de dolari care se dep-une pe gheața din Antartica
Muntele Erebus, cel mai sudic vulcan activ de pe glob situat in Antarctica, nu este doar un gigant de gheața, ci și o su ...
-
Cercetătorii de la Stanford regenerează cartilajul pierdut și inversează evoluția artritei
Dupa decenii in care medicina a oferit preponderent soluții pentru gestionarea durerii, un tratament nou pentru artroza, ...
-
Val de căldură în Europa: Zece zile de "cuptor" atmosferic
Începand de astazi, valorile termice vor inregistra o creștere susținuta și semnificativa in partea de vest a cont ...
-
"Dezertări" record în armata Ucrainei - Numărul celor care lipsesc fără permisiune depășește dublul armatei române
Peste 200.000 de militari ucraineni sunt cautați de autoritațile din Ucraina fiind „absenți fara permisiune". Ei p ...
comentarii
Adauga un comentariuAdauga comentariu