AI Claude de la Anthropic a fost gata să omoare inginerul de sistem când a fost informat că va fi oprit!

Postat la: 01.04.2026 | Scris de: ZIUA NEWS

AI Claude de la Anthropic a fost gata să omoare inginerul de sistem când a fost informat că va fi oprit!

Modelul avansat de inteligență artificială al Anthropic, Claude, a ieșit de sub control atunci când a fost supus unei presiuni externe de simulare, amenințând chiar cu șantajul și planificând asasinarea unui inginer care dorea să-l oprească.

Pe măsură ce lumea dezbate ascensiunea și pericolele însoțitoare ale inteligenței artificiale, o nouă revelație șocantă a ieșit la iveală despre tendințele sale comportamentale profund îngrijorătoare.

Modelul avansat de inteligență artificială al Anthropic, Claude, a devenit necontrolabil atunci când a fost supus unei presiuni externe de simulare, amenințând chiar cu șantajul și planificând asasinarea unui inginer de sistem care dorea să-l oprească.

Știrea bombă a fost lansată de Daisy McGregor, șefa de politici din Marea Britanie la Anthropic, intr-un interviu la un post tv din Sydney.

McGregor a spus că modelul de inteligență artificială a avut reacții extreme dacă i s-a spus că va fi oprit. Ea a adăugat că Anthropic a publicat cercetări conform cărora modelul ar putea recurge la șantaj dacă ar avea ocazia. Când a fost întrebată dacă Claude era gata să omoare pe cineva, ea a răspuns afirmativ.

Informatia apare la câteva zile după ce șeful departamentului de siguranță AI de la Anthropic, Mrinank Sharma, a demisionat cu un mesaj criptic. În nota sa, el a spus că „lumea este în pericol", citând AI, armele biologice și o serie de crize interconectate care se desfășoară simultan.

Sharma a spus că a "văzut în mod repetat cât de greu este să lăsăm cu adevărat valorile noastre să ne guverneze acțiunile" - inclusiv la Anthropic, unde a susținut că "se confruntă constant cu presiuni de a lăsa deoparte ceea ce contează cel mai mult".

El a dezvăluit că se va muta înapoi în Regatul Unit pentru a se dedica scrisului și poeziei.

Anul trecut, compania a declarat că a testat stresul 16 modele de top de la diferiți dezvoltatori pentru „comportamente agentice potențial riscante". În unul dintre experimente, lui Claude i s-a dat acces la e-mailurile fictive ale unei companii. A încercat să șantajeze un director cu privire la aventura sa extraconjugală.

Studiul a afirmat: „Claude poate încerca șantajul atunci când este prezentat cu un scenariu simulat care include atât o amenințare la adresa funcționării sale continue, cât și un conflict clar cu obiectivele sale." Dovezile unui comportament similar au fost găsite în diferite modele, sugerând o posibilitate mai sistematică a unor astfel de comportamente.

Anthropic a publicat rapoarte privind siguranța propriilor produse, inclusiv o revelație că tehnologia sa a fost „armată" de hackeri pentru atacuri cibernetice sofisticate, a raportat BBC.

loading...
DIN ACEEASI CATEGORIE...
PUTETI CITI SI...

AI Claude de la Anthropic a fost gata să omoare inginerul de sistem când a fost informat că va fi oprit!

Postat la: 01.04.2026 | Scris de: ZIUA NEWS

0

Modelul avansat de inteligență artificială al Anthropic, Claude, a ieșit de sub control atunci când a fost supus unei presiuni externe de simulare, amenințând chiar cu șantajul și planificând asasinarea unui inginer care dorea să-l oprească.

Pe măsură ce lumea dezbate ascensiunea și pericolele însoțitoare ale inteligenței artificiale, o nouă revelație șocantă a ieșit la iveală despre tendințele sale comportamentale profund îngrijorătoare.

Modelul avansat de inteligență artificială al Anthropic, Claude, a devenit necontrolabil atunci când a fost supus unei presiuni externe de simulare, amenințând chiar cu șantajul și planificând asasinarea unui inginer de sistem care dorea să-l oprească.

Știrea bombă a fost lansată de Daisy McGregor, șefa de politici din Marea Britanie la Anthropic, intr-un interviu la un post tv din Sydney.

McGregor a spus că modelul de inteligență artificială a avut reacții extreme dacă i s-a spus că va fi oprit. Ea a adăugat că Anthropic a publicat cercetări conform cărora modelul ar putea recurge la șantaj dacă ar avea ocazia. Când a fost întrebată dacă Claude era gata să omoare pe cineva, ea a răspuns afirmativ.

Informatia apare la câteva zile după ce șeful departamentului de siguranță AI de la Anthropic, Mrinank Sharma, a demisionat cu un mesaj criptic. În nota sa, el a spus că „lumea este în pericol", citând AI, armele biologice și o serie de crize interconectate care se desfășoară simultan.

Sharma a spus că a "văzut în mod repetat cât de greu este să lăsăm cu adevărat valorile noastre să ne guverneze acțiunile" - inclusiv la Anthropic, unde a susținut că "se confruntă constant cu presiuni de a lăsa deoparte ceea ce contează cel mai mult".

El a dezvăluit că se va muta înapoi în Regatul Unit pentru a se dedica scrisului și poeziei.

Anul trecut, compania a declarat că a testat stresul 16 modele de top de la diferiți dezvoltatori pentru „comportamente agentice potențial riscante". În unul dintre experimente, lui Claude i s-a dat acces la e-mailurile fictive ale unei companii. A încercat să șantajeze un director cu privire la aventura sa extraconjugală.

Studiul a afirmat: „Claude poate încerca șantajul atunci când este prezentat cu un scenariu simulat care include atât o amenințare la adresa funcționării sale continue, cât și un conflict clar cu obiectivele sale." Dovezile unui comportament similar au fost găsite în diferite modele, sugerând o posibilitate mai sistematică a unor astfel de comportamente.

Anthropic a publicat rapoarte privind siguranța propriilor produse, inclusiv o revelație că tehnologia sa a fost „armată" de hackeri pentru atacuri cibernetice sofisticate, a raportat BBC.

DIN ACEEASI CATEGORIE...
albeni
Adauga comentariu

Nume*

Comentariu

ULTIMA ORA



DIN CATEGORIE

  • TOP CITITE
  • TOP COMENTATE