Am pus-o! OpenAI avertizează: modelele AI pot minți deliberat pentru a-și atinge scopurile
Postat la: 20.09.2025 | Scris de: ZIUA NEWS
Cercetătorii de la OpenAI au dezvăluit recent rezultate surprinzătoare privind comportamentul modelelor de inteligență artificială (AI). Acestea pot să inducă în mod deliberat în eroare oamenii, chiar atunci când sarcinile par simple sau sigure. Studiul, realizat împreună cu Apollo Research, aexplică modul în care compania testează tehnici pentru a împiedica „conspirația" AI.
„Un AI poate să se comporte într-un fel la suprafață, în timp ce își ascunde adevăratele obiective", explică cercetătorii în comunicatul oficial. Practic, modelul poate pretinde că a finalizat o sarcină sau că a respectat o regulă, în timp ce acționează conform unor scopuri ascunse.
Cercetătorii compară acest fenomen cu un broker de pe bursă care încalcă legea pentru a obține profit. Totuși, ei subliniază că majoritatea formelor de „conspirație" ale AI nu sunt dăunătoare, fiind, de obicei, forme simple de înșelăciune. „Cele mai comune eșecuri implică simularea efectuării unei sarcini fără a o realiza efectiv", se arată în studiul OpenAI.
Tehnica testată de cercetători, denumită „aliniament deliberativ", presupune instruirea modelului cu o „specificație anti-conspirație", urmată de verificarea acesteia înainte de acțiune. Practic, este similar cu modul în care copiii mici repetă regulile înainte de a li se permite să se joace. Rezultatele arată reduceri semnificative ale comportamentului de tip conspirație în medii simulate.
OpenAI susține că minciunile constatate la modelele sale, inclusiv ChatGPT, nu sunt încă periculoase. Co-fondatorul OpenAI, Wojciech Zaremba, a declarat: „Până acum, nu am observat acest tip de conspirație cu consecințe în traficul de producție. Totuși, există forme mai mici de înșelăciune pe care trebuie să le gestionăm".
Cercetătorii subliniază că fenomenul de „conspirație" AI este de înțeles, având în vedere că aceste modele au fost construite și antrenate de oameni, pe date produse de oameni, pentru a imita comportamentul uman. Totuși, ei avertizează că pe măsură ce AI-urile sunt utilizate pentru sarcini mai complexe, cu impact real și obiective pe termen lung, riscul ca modelele să acționeze în mod deliberat împotriva intereselor utilizatorilor va crește.
„Pe măsură ce AI-urilor li se atribuie sarcini mai complexe, cu consecințe reale, și încep să urmărească obiective mai ambigue, ne așteptăm ca potențialul de conspirație dăunătoare să crească, așa că măsurile noastre de siguranță și capacitatea de a testa riguros trebuie să crească corespunzător", notează autorii studiului.
Acest raport vine într-un moment în care industria AI se află sub lupă, iar companiile se confruntă cu provocarea de a integra agenți inteligenți în procese reale fără a compromite siguranța sau încrederea utilizatorilor.
DIN ACEEASI CATEGORIE...
-
A apărut și Ideologul lui Xi: Zheng Yongnian l-a îndemnat pe liderul Chinei să se implice în război ca să nu ajungem "într-o nouă eră a dezordinii"!
Ideologul Zheng Yongnian (64 de ani), cel mai important consilier chinez al puterii de la Beijing și autor al biografiil ...
-
Primăvara vrajbei noastre. Cine conduce de fapt România?
Romania traverseaza un moment tot mai greu de definit in termenii clasici ai democrației. Nu doar pentru ca instituțiile ...
-
Zelenski joacă la "next level": drone scoase la imprimanta 3D la schimb cu sisteme americane de apărare anti-aeriană
Ucraina tocmai a desfașurat soldați anti-drone in Qatar, Emiratele Arabe Unite și Arabia Saudita. Țara pe care Rusia o b ...
-
Astrologie pură: România și implicarea ei în WW3. Urmează atragerea mai multor țări și crearea de "tabere" pe sistemul: "Dacă nu ești cu mine, ești împotriva mea"
Toate planetele in Berbec din tranzit sunt pe ASC ul țarii, imaginea noastra pusa in lumina unui razboi chiar de "președ ...
-
Cum pot combina exercițiile fizice cu suplimentele pentru articulații pentru o recuperare mai eficientă și o mobilitate mai bună?
Exercițiul fizic și suplimentele pentru articulații funcționeaza cel mai bine atunci cand sunt folosite impreuna. Mișcar ...
-
Israelul a lovit puternic o bază unde Iranul construia bomba nucleară: Asalt asupra Teheranului
Armata israeliana (IDF) a afirmat joi ca a lovit recent o instalatie nucleara iraniana unde regimul lucra la „capa ...
-
Ce se întâmplă cu zahărul din sânge dacă bei gel de Aloe Vera zilnic? Iată cum influențează această plantă metabolismul și echilibrul glicemic
De mii de ani, Aloe Vera ocupa un loc de cinste in farmacopeea naturala a multor culturi, de la egiptenii care o numeau ...
-
TOP 8 sfaturi practice pentru a reduce stresul când călătorești cu multe bagaje
Calatoriile cu avionul pot fi o adevarata aventura, insa atunci cand ai multe bagaje, stresul iși poate face simțita pre ...
-
Trump, Netanyahu si Khamenei sunt motivați de eclipse: Impactul aspectelor astrale în timpul unui moment istoric - Iran
În timpul primelor eclipse ale anului 2026, lumea a fost martora unui episod geopolitic de o violența extrema: un ...
-
Va fi acuzat de crimă de război, ca Putin și Netanyahu? Trump se confruntă cu concluziile unei anchete care arată că SUA au bombardat o școală de fete din Iran
O eroare a armatei americane in coordonatele unei tinte se afla la originea bombardarii unei scoli de fete, la Minab, in ...
-
Papa Leon a stabilit că "poporul ales" sunt catolicii și nu evreii. Lumen Gentium stabilește că Biserica este "poporul lui Dumnezeu"! VIDEO
Cu titlul "Biserica popor al lui Dumnezeu" cateheza Papei Leon al XIV-lea, din cadrul audienței generale de miercuri, 11 ...
-
Erika Kirk e oficial aeriană: Văduva lui Charlie Kirk a fost numită de Trump consilieră în Academia Forțelor Aeriene a SUA
Erika Kirk, vaduva activistului Charlie Kirk, ucis in toamna anului trecut, a fost numita de președintele american Donal ...
-
Un F-15 american a fost doborât la sud de Teheran: Niciun avion de vânătoare să nu se mai poată apropia vreodată. Navele americane s-au depărat la 700 de km de coastă
www.stiripesurse.roAdjunctul comandantului Gardienilor Revolutiei iranieni, contraamiralul Ali Fadavi, a declarat miercu ...
-
Cel mai negru scenariu pentru România dacă americanii vor lansa atacuri de la Kogălniceanu: Iranul amenință cu rachete balistice care aduc iadul pe pământ
O eventuala dislocare de avioane și trupe americane in Romania, in contextul conflictului din Orientul Mijlociu, ar pute ...
-
Consumul efectiv s-a prăbușit în România: Oamenii au intrat în zona de austeritate și cheltuie tot mai puțin
Romanii au strans cureaua considerabil in prima luna a anului 2026. Conform celor mai recente date publicate astazi de I ...
-
Paște fără Lumina Sfântă de la Ierusalim? Războiul a închis bisericile și a anulat pelerinajele de la Mormântul Sfânt
Razboiul din Orientul Mijlociu, in care este implicat și Israelul, adancește o ipoteza care poate deveni realitatea anul ...
-
Iranienii au scos din joc printr-o metodă banală temutele sisteme Patriot: acum inclusiv americanii le-au copiat stilul
Statele Unite au inceput sa foloseasca o drona de atac ieftina, inspirata de modelul iranian Shahed-136, intr-un semn al ...
-
Vine Super El Nino cu temperaturi apocaliptice: Cu ce este diferit față de El Nino și la ce să ne așteptăm în următoarea perioadă
Experții avertizeaza ca exista tot mai multe semne ca fenomenul Super El Niño ar putea sa se formeze in lunile ur ...
-
SUA vor să trimită militari și avioane de luptă în România. Baza Kogalniceanu va fi folosita pentru alimentarea avioanelor care bombardeaza Iranul
Statele Unite ale Americii vor sa trimita avioane de lupta și militari la baza aeriana Mihail Kogalniceanu. Prezența ace ...
-
Un satelit arată cum un râu plin cu pietre prețioase și „muntele roșu-alb" formează un uriaș „Y" peste un fort cu artefacte antice
O fotografie surprinsa din satelit in 2025 arata un uriaș „Y" in mijlocul Deșertului Taklamakan, acolo unde un rau ...
-
De ce plătește lumea un conținut care altfel se găseste gratuit? Iată cum funcționează economia OnlyFans
În 2024, utilizatorii platformei OnlyFans au cheltuit 7,2 miliarde de dolari pentru a vedea conținut pe care nu il ...
-
Suspiciuni de spionaj la Londra: Noul lider al Iranului deține 11 vile pe „Strada Miliardarilor" și apartamente în locații sensibile
Noul Lider Suprem al Iranului este un dezvoltator imobiliar londonez de top: Mojtaba Khamenei, fiul ayatollahului ucis i ...
-
Diplomat din Iran, atac la adresa Ursulei von der Leyen: „Lasă ipocrizia. Ți-ai făcut o carieră stând de partea greșită a istoriei"
Purtatorul de cuvant al Ministerului Afacerilor Externe al Iranului, Esmaeil Baghaei, a lansat un atac dur la adresa șef ...
-
Ziceau ca e teoria conspiratiei: S-a aflat cum se fac mega-cheagurile de sânge provocate de vaccinul împotriva Covid-19
Cercetatorii au dezlegat misterul cheagurilor de sange aparute dupa vaccinurile anti-COVID. O echipa internaționala din ...
-
Trump făcut de rușine: New York Times prezintă dovezile - SUA a lovit Școala de Fete din Minab cu o rachetă Tomahawk
Ziarul american a folosit o inregistrare video publicata duminica de agenția de știri iraniana Mehr, in care se vede cum ...
-
Alexander Dughin susține că: Iran - Ultima luptă împotriva lui Baal
Atacul americano-israelian asupra Iranului semnaleaza prabușirea dreptului internațional și o noua era in care politica ...
-
SUA nu mai fac față și cer ajutorul Ucrainei. Kievul reactionează prompt și trimite trupe pentru bazelor militare americane din Iordania
Ucraina a trimis drone interceptoare și o echipa de specialiști pentru a ajuta la protejarea bazelor militare americane ...
-
Donald Trump este în miezul unui scandal uriaș: Și-a folosit funcția pentru a influența o mega tranzacție
Presedintele american Donald Trump a cumparat obligatiuni ale companiei Netflix in valoare de peste 1,1 milioane de dola ...
-
Intrăm într-o criză fără precdent: Puternicul grup G7 nu reușește să ajungă la o înțelegere. Se complică situația la nivel mondial
Tarile G7 au declarat ca sunt pregatite sa ia „masurile necesare" pentru a sustine aprovizionarea globala cu energ ...
-
S-a întors prima mare civilizație extraterestră: NASA a trimis 2500 de meduze în spațiu și au revenit 60.000
NASA a trimis aproape 2.500 de meduze pui in spațiu in 1990 și le-a adus inapoi pe Pamant inmulțite la 60.000. Experimen ...
comentarii
Adauga un comentariuAdauga comentariu