Le 5 août, la blockchain layer-2 Base de Coinbase a subi un arrêt de production de 33 minutes lorsque son séquenceur actif a pris du retard en raison d'une forte activité on-chain, déclenchant un basculement qui n’a pas fonctionné comme prévu.
Le module Conductor de l'OP Stack a correctement initié une transition vers un séquenceur de secours, mais l'instance de secours n'était pas entièrement provisionnée et a donc échoué à produire des blocs, provoquant l'arrêt du réseau jusqu'à l'intervention des ingénieurs.
L'incident a débuté à 06:07 UTC, suspendant l'ordonnancement des transactions et les validations de blocs jusqu'à 06:40 UTC, lorsque la restauration manuelle a permis de reprendre les opérations normales sans déclencher de réorganisation de la chaîne.
Base a souligné que pendant la panne, l'équipe a privilégié une transition de leadership contrôlée pour réduire le risque de réorganisation de blocs, ce qui a contribué à la durée de l'interruption du service.
Cette panne met en évidence la dépendance opérationnelle aux nœuds séquenceurs centralisés dans les réseaux layer-2 et le besoin critique de mécanismes de basculement fiables.
En réponse, les ingénieurs de Base prévoient d'améliorer leurs flux de provisioning pour s'assurer que tous les nœuds séquenceurs soient pleinement intégrés à Conductor avant les événements d'élection.
Une couverture de tests supplémentaire sera mise en place pour valider la logique de basculement automatique sous divers scénarios de charge, réduisant la dépendance à l'intervention manuelle lors des incidents futurs.
Le trafic record de Base dû aux nouveaux lancements de tokens et aux frappes de NFT a probablement accentué la charge du séquenceur, révélant une faille dans les protocoles de redondance.
Le rapport post-mortem insiste sur l'importance des contrôles de préparation des séquenceurs de secours et l'amélioration de la surveillance pour détecter les problèmes de provisioning avant l'initiation du basculement.
Les projets layer-2 de l'écosystème pourraient adopter des stratégies similaires pour renforcer la résilience des séquenceurs et minimiser les risques d'indisponibilité, surtout avec l'augmentation continue des volumes de transactions.
Les analystes notent que la disponibilité du réseau et la fiabilité du basculement sont des facteurs clés pour l'adoption institutionnelle des solutions rollup, la robustesse opérationnelle influençant la confiance des développeurs et des utilisateurs.
Les améliorations d'infrastructure prévues par Base visent à renforcer sa position en tant que plateforme layer-2 fiable au sein de l'écosystème Ethereum.
Dans le futur, Base partagera des mises à jour techniques détaillées sur ses progrès et collaborera avec la communauté plus large de l'OP Stack pour affiner les standards et meilleures pratiques de basculement.
(0)