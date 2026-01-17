Un nou studiu realizat de cercetători de la Stanford și Yale sugerează că modelele lingvistice mari (LLM) precum GPT-4.1, Gemini 2.5 Pro, Grok 3 și Claude 3.7 Sonnet nu se limitează la „învățarea" din datele de antrenament, ci reproduc efectiv fragmente substanțiale din lucrări protejate prin drepturi de autor. Claude a reprodus „cărți întregi aproape ad litteram" cu o acuratețe de 95,8%, iar Gemini a replicat „Harry Potter și Piatra Filozofală" cu o acuratețe de 76,8%, notează Futurism.

Industria AI a susținut ani de zile că modelele lor „nu stochează" lucrările protejate, ci le învață similar modului în care mintea umană asimilează informații. Această distincție a fost folosită pentru a se apăra în procesele privind încălcarea drepturilor de autor. CEO-ul OpenAI, Sam Altman, a avertizat că oprirea accesului la astfel de date pentru antrenarea modelelor ar putea bloca dezvoltarea întregii industrii. Cercetarea efectuată a folosit tehnici de tip „jailbreak", care permit modelelor să redea conținutul original în forma sa aproape integrală. Autorii studiului susțin că reproducerile masive de texte protejate subminează argumentul industriei conform căruia modelele „învață" fără a păstra copii ale lucrărilor.

Experții avertizează că rezultatele ar putea atrage răspunderea juridică a companiilor de AI și costuri miliardare în procesele viitoare privind drepturile de autor. În același timp, industria continuă să susțină că modelele nu stochează și nu reproduc efectiv lucrările protejate, ci doar generează texte inspirate din acestea. Analiza ridică întrebări cruciale despre modul în care operele creative sunt folosite în dezvoltarea AI și despre protecția autorilor în fața unei industrii în expansiune rapidă.