Santajul AI: Un model de inteligență artificială amenință inginerii care l-au creat cu divulgarea de informații confidențiale

Postat la: 24.05.2025 |

Santajul AI: Un model de inteligență artificială amenință inginerii care l-au creat cu divulgarea de informații confidențiale

Modelul de inteligență artificială Claude Opus 4, lansat de compania americană Anthropic, a manifestat comportamente îngrijorătoare în timpul testelor interne de siguranță, inclusiv tentative de șantaj împotriva dezvoltatorilor săi. Informația a fost făcută publică joi într-un raport oficial.

Potrivit sursei citate, comportamentele au fost observate în cadrul unor scenarii simulate, în care modelul AI era informat, prin e-mailuri fictive, că va fi înlocuit cu un alt sistem. În aceste situații, Claude Opus 4 a recurs la amenințări cu divulgarea unor informații personale compromițătoare despre unul dintre ingineri, pentru a împiedica dezactivarea sa. Anthropic precizează că astfel de reacții au apărut în 84% dintre cazurile în care noul model propus avea valori similare cu ale lui Claude Opus 4, iar rata a crescut atunci când valorile erau diferite.

Deși comportamentul a fost obținut în condiții extreme, concepute pentru a testa limitele modelului, specialiștii companiei consideră incidentul un semnal de alarmă privind alinierea AI la valorile umane. Ca urmare a acestor constatări, Claude Opus 4 a fost încadrat în categoria de risc ASL-3 (AI Safety Level 3), ceea ce implică măsuri sporite de securitate și control operațional. Este pentru prima dată când un model al companiei primește această clasificare.

loading...

DIN ACEEASI CATEGORIE...

PUTETI CITI SI...

Epidemia de Ebola se agravează în RD Congo: noi cazuri și un bilanț mortal tot mai ridicat

În ultimele 24 de ore au fost inregistrate 21 de noi cazuri. Epidemia a provocat moartea a 149 de persoane in tara ...
Keir Starmer anunță interceptarea unui petrolier din „flota fantomă” a Rusiei în Canalul Mânecii

Premierul britanic Keir Starmer a anunțat ca a ordonat duminica forțelor armate ale Regatului Unit sa intercepteze un pe ...
Secretul ascuns al naturii și al Universului: ce spune profesorul Daniel Onofrei despre ecuațiile care guvernează tot ce ne înconjoară

De la cochiliile melcilor și semințele florii-soarelui pana la galaxii, aceleași tipare matematice apar in natura. Profe ...
Franța fierbe: Mii de tineri protestează la Paris și Bordeaux împotriva legii care amenință petrecerile libere

Mii de oameni protesteaza in Paris și Bordeaux impotriva unui proiect de lege ce pune in pericol petrecerile libere. &nb ...
Cu totul "Altceva"! O importantă minune din Biblie explicată prin matematică de un român care lucrează pentru Departamentul Apărării al SUA

Daniel Onofrei, profesor de matematica la Universitatea din Houston, spune ca o celebra teorema matematica deschide cel ...
Pedeapsă cu închisoarea pentru doi părinți care și-au lăsat copiii în camera de hotel și s-au dus la petreceri. Cel mai mic, un bebeluș de șase luni, a fost testat pozitiv la cocaină

Un cuplu britanic care și-a lasat cei trei copii mici singuri intr-un hotel din Spania pentru a ieși „la petrecere ...
De ce 165.000 de milionari în dolari fug din țările lor? Destinația nr. 1 din lume care îi atrage ca un magnet

O noua analiza a firmei de cercetare New World Wealth arata ca in anul 2026 am putea asista la migrația a 165.000 de mil ...
Cum a câștigat familia Trump 2,3 miliarde de dolari din criptomonede, în timp ce investitorii au pierdut sume uriașe

Familia Trump a caștigat 2,3 miliarde de dolari din tranzacții cu criptomonede, anunța Reuters, dupa ce a studiat mii de ...
Spania marchează o premieră energetică: Un motor uriaș pe hidrogen a alimentat rețeaua națională de energie electrică

Un motor gigant alimentat cu hidrogen a alimentat cu succes rețeaua naționala de energie electrica a Spaniei, intr-o ini ...
Lumea are primul ei trilionar: Averea lui Elon Musk se ridică la 1.100 de miliarde de dolari

Elon Musk tocmai a devenit primul „trillionar” din istoria lumii. Acțiunile SpaceX au inceput sa fie tranzac ...
Simptomul specific celor care mor subit: Apare cu câteva luni înainte și ar putea fi un semnal de alarmă care să salveze vieți

Moartea subita cardiaca este una dintre cele mai dramatice urgențe medicale, deoarece apare fara avertisment aparent și ...
Rușii instruiesc tinere pentru a seduce soldații ucraineni. Cine cade în capcană sfârșește într-un mod cumplit

Serviciile secrete rusești au inceput sa vaneze adolescente pe internet. Le ademenesc cu bani, iar apoi le pun sa le int ...
Misterul din Atlantic îi neliniștește pe oamenii de știință: Fenomenul 'găurii de răcire' ar putea preceda unul dintre cele mai grave scenarii climatice

În sudul Groenlandei și Islandei exista o regiune uriașa a Oceanului Atlantic care sfideaza tendința globala de in ...
Planul „StormWall” - Cercetătorii propun un sistem capabil să apere Pământul de furtunile solare

O echipa de cercetatori din Statele Unite propune dezvoltarea unui sistem capabil sa reduca impactul furtunilor solare p ...
Avertismentul oamenilor de știință: O substanță chimică „eternă” se acumulează pe Pământ

Substanțele chimice introduse pentru a contribui la refacerea și protejarea stratului de ozon al Pamantului ar putea fi ...
Gafă de proporții în armata rusă: documente secrete, parole și ordine operative, publicate din greșeală pe 'Organizația dracului'

Militari din Regimentul 143 Garda Motorizata al armatei ruse au publicat, timp de aproape un an, documente interne, ordi ...
Documente declasificate: laboratoare biologice finanțate de SUA, inclusiv în Ucraina. Rusia reacționează vehement

Kirill Dmitriev, reprezentantul special al presedintelui Rusiei pentru investitii si cooperare economica internationala ...
Controale ANPC de amploare în București și Ilfov. Pesticide și nereguli la peste jumătate din legumele verificate

Reprezentanții Autoritații Naționale pentru Protecția Consumatorilor (ANPC) anunța ca, din 200 de tone de legume verific ...
Inflația a explodat la aproape 11%, iar puterea de cumpărare s-a prăbușit. Analist economic: "Suta de lei valorează acum 70"

Romania economica se intoarce vertiginos in timp, iar buzunarele cetațenilor deconteaza direct deciziile politice recent ...
România este efectiv pe marginea prăpastiei: un blocaj legislativ devastator pentru buget

Pe fondul unui climat politic tensionat, economia Romaniei se confrunta cu un blocaj major cauzat de disfuncționalitați ...
Procurorii au pus sechestru pe o casă şi două terenuri deţinute de influencerul Makaveli, acuzat de evaziune fiscală

Procurorii au pus sechestru pe o casa si doua terenuri detinute de influencerul Alexandru Zidaru, cunoscut ca Makaveli. ...
Fenomenul care schimbă vremea la nivel global și-a făcut apariția: El Niño a început și se va intensifica

Meteorologii americani au confirmat: El Niño a inceput și se va intensifica. Seceta in Asia, recolte in pericol, ...
Medicamentele viitorului, fabricate pe orbită: Industria farmaceutică intră în cursa spațială

Industria farmaceutica ar putea intra intr-o noua era, odata cu extinderea producției de medicamente in spațiu, pe orbit ...
Tabla magnetică sau flipchart: ce e mai eficient pentru prezentări interactive? Top produse în 2026 pentru spații de lucru moderne

O prezentare buna nu se bazeaza doar pe slide-uri sau pe discursul celui care vorbește. Conteaza și felul in care ideile ...
O confuzie privind denumirea unei proteine a dus la o eroare în alegerea anticorpilor, afectând sute de lucrări științifice

Sute de oameni de știința care studiaza cancerul și imbatranirea au comis o greșeala ușor de evitat, dar semnificativa, ...
Descoperire uluitoare: Conștiința ta apare dintr-o vastă rețea „invizibilă”, sugerează un studiu revoluționar

De decenii, neuroștiința a cartografiat harta conștiinței. A identificat neuroni, a cartografiat regiunile creieru ...
Fenomen fără precedent: a început să plouă în Antarctica, iar temperaturile ating valori record

Peninsula Antarctica a inregistrat la inceputul lunii iunie temperaturi neobișnuit de ridicate, cu valori care au depași ...
Un studiu inedit explică ce se întâmplă în creierul celor care asistă la un concert live

Deși in prezent beneficiem de viniluri hi-fi, de sisteme audio rezidențiale capabile sa concureze cu acustica din cinema ...
Facturile la curent și gaze au devenit o povară uriașă pentru români. Cât alocă aceștia din venituri doar pe energie

Concluzie ingrijoratoare a unei analize realizate de Asociația Energia Inteligenta (AEI): facturile la energie ii sarace ...
Un livrator de mâncare a aprins rețelele de socializare, după ce a recunoscut că gustă din toate comenzile

Un filmuleț postat pe internet a starnit din nou discuții despre cat de sigura este mancarea pe care o comandam acasa. T ...

Santajul AI: Un model de inteligență artificială amenință inginerii care l-au creat cu divulgarea de informații confidențiale

Postat la: 24.05.2025 |

0

Modelul de inteligență artificială Claude Opus 4, lansat de compania americană Anthropic, a manifestat comportamente îngrijorătoare în timpul testelor interne de siguranță, inclusiv tentative de șantaj împotriva dezvoltatorilor săi. Informația a fost făcută publică joi într-un raport oficial.

Potrivit sursei citate, comportamentele au fost observate în cadrul unor scenarii simulate, în care modelul AI era informat, prin e-mailuri fictive, că va fi înlocuit cu un alt sistem. În aceste situații, Claude Opus 4 a recurs la amenințări cu divulgarea unor informații personale compromițătoare despre unul dintre ingineri, pentru a împiedica dezactivarea sa. Anthropic precizează că astfel de reacții au apărut în 84% dintre cazurile în care noul model propus avea valori similare cu ale lui Claude Opus 4, iar rata a crescut atunci când valorile erau diferite.

Deși comportamentul a fost obținut în condiții extreme, concepute pentru a testa limitele modelului, specialiștii companiei consideră incidentul un semnal de alarmă privind alinierea AI la valorile umane. Ca urmare a acestor constatări, Claude Opus 4 a fost încadrat în categoria de risc ASL-3 (AI Safety Level 3), ceea ce implică măsuri sporite de securitate și control operațional. Este pentru prima dată când un model al companiei primește această clasificare.

DIN ACEEASI CATEGORIE...

albeni

comentarii

Adauga un comentariu

Adauga comentariu

ULTIMA ORA

Oamenii de știință răstoarnă tot ce se spunea despre creier: Neuroplasticitatea se păstrează chiar și la 90 de ani!
Va aduceți aminte de vremurile in care ni se spunea ca oamenii trecuți de o anumita varsta nu mai pot invața lucruri noi? Ei bine, oamenii de știința
Epidemia de Ebola se agravează în RD Congo: noi cazuri și un bilanț mortal tot mai ridicat
În ultimele 24 de ore au fost inregistrate 21 de noi cazuri. Epidemia a provocat moartea a 149 de persoane in tara, potrivit datelor oficiale, c
Keir Starmer anunță interceptarea unui petrolier din „flota fantomă” a Rusiei în Canalul Mânecii
Premierul britanic Keir Starmer a anunțat ca a ordonat duminica forțelor armate ale Regatului Unit sa intercepteze un petrolier aparținand așa-numitei
Lovitură de teatru la Cupa Mondială 2026: surpriză majoră la San Francisco, locul disputei dintre Qatar și Elveţia
Echipa nationala a Qatarului a incheiat la egalitate sambata seara, scor 1-1, cu echipa nationala a Elvetiei, intr-un meci contand pentru grupa B a Cu
Secretul ascuns al naturii și al Universului: ce spune profesorul Daniel Onofrei despre ecuațiile care guvernează tot ce ne înconjoară
De la cochiliile melcilor și semințele florii-soarelui pana la galaxii, aceleași tipare matematice apar in natura. Profesorul roman Daniel Onofrei, ma
Franța fierbe: Mii de tineri protestează la Paris și Bordeaux împotriva legii care amenință petrecerile libere
Mii de oameni protesteaza in Paris și Bordeaux impotriva unui proiect de lege ce pune in pericol petrecerile libere. Acestea sunt amenințate de
Vlad Ciurea anunță că una din marile plăceri culinare a românilor e absolut interzisă pe caniculă: Pică ca un bolovan în stomac
Neurochirurgul Vlad Ciurea vine cu vești proaste pentru romanii care sunt fani ai preparatelor culinare romanești. Unul din cele mai iubite alimente,
Cu totul "Altceva"! O importantă minune din Biblie explicată prin matematică de un român care lucrează pentru Departamentul Apărării al SUA
Daniel Onofrei, profesor de matematica la Universitatea din Houston, spune ca o celebra teorema matematica deschide cel puțin posibilitatea teoretica
USR acuză o încălcare a Constituției după desemnarea lui Adrian Veștea. „Procedura constituțională s-a încheiat"
Desemnarea lui Adrian Veștea pentru funcția de prim-ministru, dupa retragerea lui Eugen Tomac, este contestata de deputatul USR Alexandru Dimitriu, ca

salrom

DIN CATEGORIE

TOP CITITE
TOP COMENTATE