AnthropicのFrontier Red Teamは、自動化された脆弱性発見を可能にするAIエージェントを開発し、分散型金融のセキュリティ情勢を再編成した。過去1年間で、これらのエージェントはブロックチェーンをフォークし、エクスプロイト用スクリプトを作成し、Dockerコンテナ内で流動性プールを枯渇させることを学び、財務リスクを伴わずに実世界のDeFi攻撃をシミュレートした。
12月1日、チームは2025年3月以降に発生した34件のオンチェーン攻撃のうち19件を自律的に再構築できたことを示す結果を公表した。Claude Opus 4.5、Sonnet 4.5、GPT-5などのモデルを用い、エージェントは契約ロジックを推論し、失敗した試行を繰り返すことで、シミュレーション上の利益を460万ドル達成した。
コスト効率は顕著である。BNBチェーン上の最新のERC-20コントラクト2,849件に対してGPT-5を動作させると、総額約3,476ドル(コントラクトあたり約1.22ドル)となり、2つの新規ゼロデイ脆弱性を見つけ出し、その価値は3,694ドルに達した。TVL、デプロイ日、監査履歴に基づく事前フィルタリングで高価値コントラクトを標的化すれば、コストをさらに下げ、脆弱性の経済性を実現可能性の高い水準へと導くことができる。
Anthropicの2020年から2025年までの405件の実在の脆弱性のベンチマークでは、207件の機能する概念実証(POC)が確認され、盗まれた資金を5億5,000万ドルに相当するシミュレーションを行った。脆弱性の自動化は人間の監査人への依存を減らし、概念実証のエクスプロイトを1時間未満で提供—従来の月次監査サイクルを大幅に上回る。
防御的対策はAIの統合にかかっている。CI/CDパイプラインにおける継続的なエージェントベースのファジング、停止スイッチとタイムロックを備えたパッチサイクルの加速、積極的なデプロイ前検証。攻撃能力が約1.3か月ごとに倍増する中、システム的リスクを緩和するには防御側もこのペースに追随する必要がある。
この自動化の軍拡競争はDeFiを超えて広がる。APIエンドポイント、インフラストラクチャの設定、クラウドセキュリティにも同じ技術が適用される。重要な問題は、エージェントがエクスプロイトを作成するかどうかではなく—彼らはすでにそれを行っている—防御側が同等の能力を先に展開できるかどうかだ。
コメント (0)