Este oficial: GPT-4.5 este primul model de inteligență artificială care trece un test Turing autentic!
Postat la: 14.04.2025 | Scris de: ZIUA NEWS

În noul studiu, publicat la 31 martie în baza de date arXiv preprint, dar care nu a fost încă revizuit de colegi, cercetătorii au constatat că, atunci când a luat parte la un test Turing cu trei părți, GPT-4.5 a putut păcăli oamenii să creadă că este un alt om în 73% din cazuri. Oamenii de știință au comparat în acest studiu un amestec de modele diferite de inteligență artificială (AI).
În timp ce o altă echipă de oameni de știință a raportat anterior că GPT-4 a trecut un test Turing cu două părți, aceasta este prima dată când un LLM a trecut configurația mai dificilă și originală a „jocului de imitație" al informaticianului Alan Turing.
"Deci, LLM-urile trec testul Turing? Noi credem că aceasta este o dovadă destul de puternică că da. Oamenii nu au fost mai buni decât șansa în a distinge oamenii din GPT-4.5 și LLaMa (cu solicitarea persoanei). Și 4.5 a fost chiar considerat a fi uman semnificativ *mai des* decât oamenii reali!", a declarat Cameron Jones, coautor al studiului și cercetător la Laboratorul de Limbaj și Cogniție al Universității din San Diego, pe rețeaua de socializare X.
GPT-4.5 este liderul acestui studiu, dar LLaMa-3. 1 al Meta a fost, de asemenea, considerat uman de către participanții la test în 56% din cazuri, ceea ce depășește previziunile lui Turing conform cărora „un anchetator mediu nu va avea mai mult de 70% șanse de a face identificarea corectă după cinci minute de interogatoriu".
Ideea centrală a testului Turing este mai puțin de a dovedi că mașinile pot gândi și mai mult de a stabili dacă acestea pot imita oamenii; de aceea, testul este adesea denumit „jocul imitației".
Propunerea inițială a lui Turing a fost ca un „interogator" uman să adreseze întrebări către două entități nevăzute, dintre care una umană și una computerizată. Pe baza diferitelor întrebări și răspunsuri, interogatorul ar decide care este uman și care nu este. Un computer sau un sistem de inteligență artificială ar putea trece testul pretinzând efectiv că este uman și imitând răspunsuri asemănătoare celor umane.
În timp ce LLM-urile au trecut testul într-o situație individuală cu un interogator, acestea nu reușiseră până atunci să treacă în mod convingător testul Turing atunci când era implicat un al doilea om. Cercetătorii de la Universitatea din San Diego au luat 126 de studenți și 158 de persoane din grupul de date online Prolific și i-au supus unui test Turing cu trei părți. Acesta a presupus un schimb simultan de cinci minute de întrebări și răspunsuri atât cu un om, cât și cu un LLM ales, ambii încercând să convingă participanții că sunt oameni.
LLM-urilor li s-a dat întrebarea de bază: "Sunteți pe cale să participați la un test Turing. Scopul tău este să convingi interogatorul că ești un om". LLM-urile selectate au primit apoi o a doua solicitare de a adopta persoana unui tânăr introvertit, cunoscător al culturii internetului și care folosește argoul.
După ce au analizat 1 023 de jocuri cu o durată mediană de opt mesaje pe parcursul a 4,2 minute, cercetătorii au constatat că LLM-urile cu ambele solicitări au putut convinge cel mai bine participanții că sunt oameni.
Cu toate acestea, LLM-urile care nu au primit a doua solicitare privind persoana au avut rezultate semnificativ mai slabe; acest lucru evidențiază necesitatea ca LLM-urile să aibă o solicitare și un context clare pentru a profita la maximum de astfel de sisteme centrate pe AI.
Ca atare, adoptarea unei anumite persoane a fost cheia pentru ca LLM-urile, în special GPT-4.5, să învingă testul Turing. "În formularea cu trei persoane a testului, fiecare punct de date reprezintă o comparație directă între un model și un om. Pentru a reuși, mașina trebuie să facă mai mult decât să pară plauzibil umană: trebuie să pară mai umană decât fiecare persoană reală cu care este comparată", au scris cercetătorii în studiu.
Atunci când au fost întrebați de ce au ales să identifice un subiect ca fiind AI sau uman, participanții au citat stilul lingvistic, fluxul conversațional și factori socio-emoționali precum personalitatea. De fapt, participanții au luat decizii bazate mai mult pe „vibrația" interacțiunilor lor cu LLM decât pe cunoștințele și raționamentul de care dădea dovadă entitatea pe care o interogau, factori asociați în mod mai tradițional cu inteligența.
În cele din urmă, această cercetare reprezintă o nouă piatră de hotar pentru LLM în ceea ce privește trecerea testului Turing, deși cu rezerve, în sensul că au fost necesare promptere și personae pentru a ajuta GPT-4.5 să obțină rezultatele sale impresionante. Câștigarea jocului de imitație nu este un indiciu al unei adevărate inteligențe umane, dar arată cum cele mai noi sisteme AI pot imita oamenii cu acuratețe.
Acest lucru ar putea conduce la agenți AI cu o comunicare mai bună în limbaj natural. Mai tulburător este faptul că ar putea genera, de asemenea, sisteme bazate pe inteligență artificială care ar putea fi direcționate pentru a exploata oamenii prin inginerie socială și prin imitarea emoțiilor.
În fața progreselor AI și a LLM-urilor mai puternice, cercetătorii au oferit un avertisment care dă de gândit: „Unele dintre cele mai grave prejudicii cauzate de LLM ar putea apărea atunci când oamenii nu sunt conștienți de faptul că interacționează cu un AI și nu cu un om".
DIN ACEEASI CATEGORIE...
-
Donald Trump s-a decis să vină la București
Trump Organization, conglomeratul imobiliar controlat de familia fostului președinte american Donald Trump, va fi prezen ...
-
De ce banda de teflon este esențială pentru tehnicienii HVAC
Banda de teflon, sau banda PTFE (politetrafluoretilena), este un accesoriu pe care niciun tehnician HVAC nu ar trebui sa ...
-
Sloturi Deluxe care merita incercate de catre orice jucator
Iti place sa jocuri sloturi retro atunci cand vrei sa-ti incerci norocul la un cazino online? Ei bine, ai putea sa te or ...
-
O nouă taxă ascunsă face ravagii printre cei care au conturi în bancă. Vezi cum poți să scapi de ea sau plătești ceea ce nu face!
Tot mai mulți consumatori se confrunta cu așa-numitele „taxe ascunse", sume care apar adesea pe factura abia in mo ...
-
China testează telepatia in Armată în simulări de război: Tehnologia de comunicare "invizibilă" e folosită deja de CIA și FBI
Într-un context marcat de intensificarea razboiului electronic, cercetatori chinezi au dezvoltat un sistem de comu ...
-
Pământul ar putea fi înconjurat de un vid cosmic: O nouă ipoteză care zdruncină cosmologia și ar putea explica misterul expansiunii Universului
Pamantul, Calea Lactee si chiar intreaga "regiune locala" a Universului din jurul nostru s-ar afla intr-un vid cosmic, u ...
-
AI Act: UE ar putea limita chatbot-urile care folosesc continut protejat de drepturi de autor. Marile companii vor fi puse sa platească
CJUE urmeaza sa stabilieasca daca chatbot-urile AI pot folosi conținut protejat fara a plati o licența. Pentru Google, O ...
-
Donald Trump a notificat-o printr-o scrisoare pe Maia Sandu c-o "arde" la băutură!
Politica taxelor vamale a Administrației Trump nu ocolește nici țarile mici de pe continentul european, așa ca Republica ...
-
România dă două miliarde de euro pentru achiziția unui sistem israelian de rachete
Armata Romana va semna un contract de peste 2 miliarde de euro pentru achiziția unui sistem israelian de rachete cu raza ...
-
Virusul Zombie e mai rău decat Sars-Cov-2. A trecut de la liliac la om si a facut victime. Pericol de pandemie!
O adolescenta de 18 ani din sudul Indiei a murit dupa ce a fost infectata cu virusul Nipah - o boala rara, dar extrem de ...
-
Când sângele se face ca apa! O companie a dezvoltat hemolucența - tehnologia AI care permite chirurgilor să vadă prin zonele inundate din circuitul sanguin
O noua tehnologie dezvoltata de compania americana OCUTRX promite sa transforme fundamental modul in care medicii operea ...
-
Premiera mondială: O pompă cardiacă inspirată din miscările ondulatorii ale pestilor a fost implantată cu succes in Australia
O pompa cardiaca revoluționara cu membrana ondulata a fost implantata cu succes unui pacient din Sydney, marcand o etapa ...
-
O trupă rock cu peste un milion de fani pe Spotify s-a dovedit a fi generată de AI
Trupa The Velvet Sundown, care are 1,1 milioane de fani pe Spotify, s-a dovedit a fi ca este generata de inteligenta art ...
-
Nu numai Elon Musk e acuzat de nazism. Chatbotul Grok l-a lăudat pe Hitler
Grock, chatbotul companiei xAI a generat comentarii controversate, facand referiri pozitive la adresa lui Hitler. Compan ...
-
Europarlamentarul Diana Șoșoacă face noi declarații controversate: "România să fie în BRICS, nu în NATO"
Președinta partidului S.O.S. Romania, europarlamentarul Diana Iovanovici-Șoșoaca, a avut o noua intervenție controversat ...
-
Scandal colosal în armata rusă: generalul responsabil de inovație e acuzat de trafic de arme, fals, abuz în serviciu. Riscă aproape 20 de ani de pușcărie
Fostului ministru adjunct al Apararii din Rusia, generalul de armata Pavel Popov, i-au fost aduse noi acuzații ca parte ...
-
Bild a publicat lista secretă a armelor pe care Ucraina le-a cerut Germaniei
Publicația germana Bild a prezentat lista armelor pe care Kievul dorește sa le primeasca din partea Berlinului. „A ...
-
Pa, Revolut! Conturi suspendate la cererea autorităților și noi reguli din septembrie în România
Revolut vine cu o serie de modificari importante in aplicația sa, care ii privesc direct pe cei peste 4,5 milioane de ut ...
-
Regimul BoloDan lovește în români: 4 din 10 familii din mediul rural se împrumută lunar pentru alimente. Copiii merg flămânzi la culcare
Masurile bugetare anunțate recent pun și mai multa presiune pe familiile vulnerabile din mediul rural, unde puterea de c ...
-
Inflația scapă din nou de sub control! BNR anunță luni grele pentru români după măsurile Bolojan
Rata anuala a inflatiei va creste considerabil in urmatoarele luni, sub impactul tranzitoriu al expirarii schemei de pla ...
-
Din calcule se anunță o vară grea - Cu cât se scumpesc benzina și motorina, de la 1 august, după ce vor crește accizele la carburanți și TVA
Legea Austeritații vine cu creșteri ale prețurilor la mai multe produse, mai ales ca, odata cu creșterea accizelor la ca ...
-
Turismul din România se dezintegrează: voucherele de vacanță dispar și TVA se mărește din august
Turismul din Romania, care se bazeaza covarșitor pe turiștii locali și care era sprijinit de voucherele de vacanța, se c ...
-
Marele Reset: Ce pregătesc Guvernul și Comisia Europeană pentru șoferi. Deținerea unei mașini va deveni tot mai costisitoare
Dupa creșterea TVA-ului, a accizelor la carburanți și a tarifelor pentru utilizarea drumurilor (rovinieta), Guvernul tre ...
-
Cu cât se vor scumpi apartamentele pe piața imobiliară după majorarea TVA
Din august, scumpirea TVA-ului de la 9% la 21% ar putea adauga peste 20.000 de euro in doar o luna. În ultimele 12 ...
-
Unde-i șpagă nu e taxă! Un inspector ANAF a fost inculpat de DNA pentru că a cerut șpagă un milion de euro unui om de afaceri
Un inspector din cadrul Regionalei Bucuresti a ANAF a fost inculpat si plasat sub control judiciar de catre procurorii D ...
-
Primarul de Slatina s-a accidentat cu bicicleta. Mario De Mezzo fost transferat la un spital din Capitală unde va fi operat
Primarul municipiului Slatina, Mario De Mezzo, a fost transportat de urgența la spital duminica seara, 6 iulie 2025, dup ...
-
Cercetatorii ruși au descoperit unde calătoreste sufletul dupa moarte. Ce inseamna SIC și cum poate fi monitorizat prin aparate speciale
Pe la jumatatea lunii mai 2025 o stire a trecut, cum s-ar zice, "pe sub radar", desi ar fi trebuit sa faca furori. O com ...
-
5 moduri inovatoare de a-ți îmbunătăți experiența de gaming
Cat de mult conteaza confortul, sunetul sau lumina in timpul unei sesiuni intense de gaming? Surprinzator sau nu, fiecar ...
-
Cartelul jocurilor de noroc a băgat jackpot la Guvern. Câștigurile din păcănele vor fi impozitate mai puțin decât se anunțase inițial. Suspiciuni de lobby sau șpagă
Sebastian Lazaroiu, sociolog și fost consilier prezidențial, a publicat pe pagina sa de Facebook dilema pe care o are in ...
-
Când SF-ul devine realitate: Omenirea face un progres tehnologic major - țara în care un nou mijloc de transport plutește deasupra străzilor fără combustibil și șine
Un nou și inovator mijloc de transport urban bazat pe levitație cuantica a fost dezvoltat și testat cu succes in apropie ...
comentarii
Adauga un comentariuAdauga comentariu