8月5日、CoinbaseのBaseレイヤー2ブロックチェーンは、オンチェーンの過度なアクティビティによりアクティブシーケンサーが遅延し、33分間の生産停止を経験しました。この際、本来機能すべきフェイルオーバーが意図通りに作動しませんでした。
OPスタックのConductorモジュールは、正しくスタンバイシーケンサーへの切り替えを開始しましたが、バックアップインスタンスが完全に準備されておらず、ブロック生成に失敗したため、ネットワークはエンジニアが介入するまで停止しました。
この事故は06:07 UTCに始まり、06:40 UTCまでトランザクションの順序付けとブロックの確定が停止しました。手動による修復が行われ、チェーン再編成を引き起こすことなく通常運用が回復しました。
Baseは、障害発生中、ブロック再編成のリスクを軽減するために制御されたリーダーシップ移行を優先して行い、これがサービス中断の継続時間に影響を与えたと強調しました。
この障害は、レイヤー2ネットワークにおける中央集権的なシーケンサーノードへの運用依存性と、信頼性の高いフェイルオーバーメカニズムの重要性を浮き彫りにしました。
対応として、Baseのエンジニアは、選挙イベント前にすべてのシーケンサーノードがConductorに完全に統合されるようプロビジョニングワークフローの改善を計画しています。
また、様々な負荷シナリオ下で自動フェイルオーバーロジックを検証するための追加のテストカバレッジも実施予定であり、将来的な手動介入への依存を減らします。
Baseは新しいトークンのローンチやNFTのミントによる記録的なトラフィックがシーケンサーの負荷を悪化させ、冗長性プロトコルのギャップを露呈した可能性があります。
ポストモーテムレポートは、バックアップシーケンサーの準備状況チェックの重要性と、フェイルオーバー開始前のプロビジョニング問題を検知するための監視強化を強調しています。
エコシステム全体のレイヤー2プロジェクトは、トランザクション量が増加し続ける中、シーケンサーの耐障害性を強化しダウンタイムリスクを最小化するために同様の戦略を採用する可能性があります。
アナリストは、ネットワークの稼働率とフェイルオーバーの信頼性がロールアップソリューションの機関投資家による採用の重要な要因であり、運用の堅牢性が開発者とユーザーの信頼に影響を与えると指摘しています。
Baseの計画されたインフラ強化は、イーサリアムエコシステム内で信頼されるレイヤー2プラットフォームとしての地位を強化することを目指しています。
今後、Baseは進捗の詳細な技術アップデートを共有し、OPスタックの広範なコミュニティと協力してフェイルオーバー基準およびベストプラクティスの改善に取り組みます。
コメント (0)