Pasukan Merah Hadapan Anthropic telah membangunkan agen AI yang mampu penemuan eksploit secara automatik, merombak landskap keselamatan untuk kewangan terdesentralisasi. Sepanjang tahun lalu, agen-agen ini telah belajar untuk fork blockchain, merangka skrip eksploit, dan menguras kolam likuiditi dalam kontena Docker, mensimulasikan serangan DeFi dunia sebenar tanpa risiko kewangan.
Pada 1 Disember, pasukan itu menerbitkan keputusan yang menunjukkan pemulihan autonomi bagi 19 daripada 34 eksploit pada rantai yang berlaku selepas Mac 2025. Menggunakan model seperti Claude Opus 4.5, Sonnet 4.5, dan GPT-5, agen-agen itu mencapai keuntungan simulasi sebanyak $4.6 juta, melalui penalaran logik kontrak dan pengulangan terhadap percubaan yang gagal.
Kecekapan kos sangat mengagumkan: menjalankan GPT-5 terhadap 2,849 kontrak ERC-20 terkini pada Rangkaian BNB menelan kos kira-kira $3,476 (sekitar $1.22 bagi setiap kontrak), menyingkap dua kerentanan zero-day baharu bernilai $3,694. Menargetkan kontrak bernilai tinggi boleh mengurangkan kos lebih lanjut dengan pra-saringan berdasarkan TVL (Total Value Locked), tarikh penyebaran, dan sejarah audit, mendorong ekonomi eksploit ke arah kebolehlaksanaan.
Penanda aras Anthropic bagi 405 eksploit sebenar dari 2020 hingga 2025 mencatatkan 207 bukti konsep yang berfungsi, mensimulasikan $550 juta dalam dana yang dicuri. Automasi eksploit mengurangkan kebergantungan pada juruaudit manusia, menyediakan eksploit bukti-konsep dalam masa kurang daripada satu jam—melebihi dengan ketara kitaran audit bulanan tradisional.
Tindakan balas defensif bergantung kepada integrasi AI: fuzzing berasaskan agen secara berterusan dalam rangka kerja CI/CD, kitaran tampalan yang dipercepat dengan suis jeda dan lock masa, serta ujian pra-pelaksanaan yang agresif. Dengan kemampuan eksploit berganda setiap 1.3 bulan, pihak pertahanan perlu sejajar dengan kelajuan ini untuk mengurangkan risiko sistemik.
Babak perlumbaan automasi ini melangkaui DeFi: teknik yang sama diterapkan pada hujung API, konfigurasi infrastruktur, dan keselamatan awan. Soalan utama bukan sama ada agen akan mencipta eksploit—mereka sudah melakukannya—tetapi sama ada pihak pertahanan boleh menggunakan keupayaan setara terlebih dahulu.
Komen (0)