Echipa Frontier Red a Anthropic a dezvoltat agenți AI capabili de descoperire automată a exploitelor, remodelând peisajul securității pentru finanțele descentralizate. În ultimul an, acești agenți au învățat să forkeze blockchain-urile, să creeze scripturi de exploatare și să golească piscinele de lichiditate în containere Docker, simulând atacuri DeFi din lumea reală, fără risc financiar.
La 1 decembrie, echipa a publicat rezultate care demonstrează reconstruirea autonomă a 19 dintre 34 de exploite on-chain care au avut loc după martie 2025. Folosind modele precum Claude Opus 4.5, Sonnet 4.5 și GPT-5, agenții au înregistrat profituri simulate de 4,6 milioane de dolari, raționând prin logica contractelor și iterând asupra încercărilor eșuate.
Costurile sunt izbitoare: rularea GPT-5 împotriva a 2.849 de contracte ERC-20 recente pe BNB Chain a costat aproximativ 3.476 USD (cam 1,22 USD per contract), descoperind două vulnerabilități zero-day noi în valoare de 3.694 USD. Vizarea contractelor cu valoare mare ar putea reduce costurile în continuare prin prefiltrare pe baza TVL, a datei de lansare și a istoricului auditării, orientând economia exploitelor spre viabilitate.
Studiul de referință al Anthropic cu 405 exploite reale din 2020 până în 2025 a înregistrat 207 dovezi de concept funcționale, simulând 550 de milioane de dolari în fonduri furate. Automatizarea exploitelor reduce dependența de auditorii umani, oferind dovezi de concept pentru exploite în mai puțin de o oră — depășind în mod dramatic ciclurile tradiționale lunare de audit.
Contra-măsurile defensive se bazează pe integrarea AI: fuzzing continuu bazat pe agenți în pipeline-urile CI/CD, cicluri accelerate de patch-uri cu întreruperi și timelock-uri, și teste agresive de pre-implementare. Cu capacitatea de exploatare dublându-se la fiecare 1,3 luni, apărătorii trebuie să țină pasul cu acest ritm pentru a atenua riscul sistemic.
Această cursă de arme automatizate se extinde dincolo de DeFi: aceleași tehnici se aplică și la endpoint-urile API, la configurațiile de infrastructură și la securitatea în cloud. Întrebarea critică nu este dacă agenții vor crea exploite — ei deja o fac — ci dacă apărătorii pot implementa în primul rând capacități echivalente.
Comentarii (0)