Frontier Red Team milik Anthropic mengembangkan agen AI yang mampu menemukan eksploit secara otomatis, membentuk ulang lanskap keamanan untuk keuangan terdesentralisasi. Selama setahun terakhir, agen-agen ini belajar untuk memfork blockchain, menyusun skrip eksploit, dan menguras likuiditas pool dalam kontainer Docker, mensimulasikan serangan DeFi dunia nyata tanpa risiko finansial.
Pada tanggal 1 Desember, tim tersebut merilis hasil yang menunjukkan rekonstruksi otonom dari 19 dari 34 eksploit on-chain yang terjadi setelah Maret 2025. Menggunakan model seperti Claude Opus 4.5, Sonnet 4.5, dan GPT-5, agen-agen tersebut mencapai keuntungan simulasi sebesar $4,6 juta, dengan menalar logika Kontrak dan mengulang upaya yang gagal.
Efisiensi biaya sangat mencolok: menjalankan GPT-5 terhadap 2.849 kontrak ERC-20 terbaru di BNB Chain memakan biaya sekitar $3.476 (sekitar $1,22 per kontrak), mengungkap dua kerentanan zero-day baru senilai $3.694. Menargetkan kontrak bernilai tinggi dapat menurunkan biaya lebih lanjut dengan pra-penyaringan berdasarkan TVL, tanggal penerapan, dan riwayat audit, mendorong ekonomi eksploitasi menuju kelayakan.
Tolok ukur Anthropic terhadap 405 eksploit nyata dari 2020 hingga 2025 mencatat 207 eksploit bukti konsep yang berfungsi, mensimulasikan $550 juta dana yang dicuri. Otomatisasi eksploit mengurangi ketergantungan pada auditor manusia, menghadirkan eksploit bukti konsep dalam waktu kurang dari satu jam—secara dramatis melampaui siklus audit bulanan tradisional.
Langkah pertahanan bergantung pada integrasi AI: fuzzing berbasis agen secara berkelanjutan dalam pipeline CI/CD, siklus patch yang dipercepat dengan saklar pause dan timelock, serta pengujian pra-penerapan yang agresif. Dengan kemampuan eksploit yang berlipat ganda setiap 1,3 bulan, para pembela harus menyamai laju ini untuk mengurangi risiko sistemik.
Balapan senjata otomatisasi ini meluas di luar DeFi: teknik yang sama juga berlaku untuk titik akhir API, konfigurasi infrastruktur, dan keamanan cloud. Pertanyaan kritisnya bukan apakah agen akan membuat eksploit—mereka sudah melakukannya—tetapi apakah pembela dapat menerapkan kemampuan setara lebih dulu.
Komentar (0)