2023年8月5日,Coinbase的Base第2层区块链在其活跃排序器在繁重的链上活动下落后时,发生了33分钟的生产暂停,触发了未按预期运行的故障切换。
OP Stack的Conductor模块正确启动了向备用排序器的切换,但备份实例未完全配置,因此未能生成区块,导致网络停滞,直到工程师介入。
事件始于协调世界时06:07,暂停了交易排序和区块确认,直到06:40通过人工修复恢复正常运行,且未触发链重组。
Base强调,在停机期间,团队优先进行受控的领导权过渡,以减轻区块重组的风险,这也是服务中断时间较长的原因之一。
此次停机凸显了第2层网络对集中排序节点的操作依赖性以及可靠故障切换机制的关键性需求。
为此,Base工程师计划加强预配置流程,确保所有排序节点在选举事件前完全整合到Conductor中。
将实施额外测试覆盖,以验证各种负载情况下的自动故障切换逻辑,减少未来事件对人工干预的依赖。
Base因新代币发行和NFT铸造导致的创纪录流量,可能加剧了排序器负载,暴露了冗余协议的不足。
事后报告强调备用排序器的就绪检查重要性及改善监控,以在故障切换启动前发现配置问题。
整个生态系统的第2层项目可能采纳类似策略,以增强排序器韧性、减少停机风险,尤其在交易量持续增长的情况下。
分析人士指出,网络可用性和故障切换可靠性是机构采用汇总解决方案的关键因素,运营稳健性影响开发者和用户信心。
Base计划的基础设施升级旨在巩固其作为以太坊生态系统内可靠第2层平台的地位。
展望未来,Base将分享其进展的详细技术更新,并与更广泛的OP Stack社区合作,完善故障切换标准和最佳实践。
(0)