На 5 август блокчейнът от слой 2 на Coinbase, наречен Base, претърпя 33-минутно спиране на производството, когато неговият активен секвенсер изостана поради силна активност в мрежата, което задейства превключване за аварийно поведение, което не функционираше както беше предвидено.
Модулът Conductor на OP Stack правилно инициира преход към резервен секвенсер, но резервният екземпляр не беше напълно осигурен и затова не успя да произвежда блокове, което доведе до блокиране на мрежата, докато инженерите не се намесиха.
Инцидентът започна в 06:07 UTC, като спря нареждането на транзакциите и потвърждаването на блоковете до 06:40 UTC, когато ръчното възстановяване върна нормалната работа без да предизвика реорганизации на веригата.
Base подчерта, че по време на прекъсването екипът е приоритетно управлявал контролирания преход на лидерството, за да намали риска от реорганизация на блокове, което допринесе за продължителността на спирането на услугата.
Аварията подчерта оперативната зависимост от централизираните възли секвенсери в мрежите от слой 2 и критичната необходимост от надеждни механизми за аварийно превключване.
В отговор инжeнерите на Base планират да подобрят процесите на осигуряване, за да гарантират, че всички възли секвенсери са напълно интегрирани с Conductor преди изборните събития.
Ще бъде въведено допълнително тестване за валидиране на автоматичната логика за аварийно превключване при различни натоварвания, като се намали зависимостта от ръчна намеса при бъдещи инциденти.
Рекордният трафик на Base от нови емисии токени и NFT издаване вероятно е увеличил натоварването на секвенсера, което разкри пропуск в протоколите за излишък.
Отчето за разследването подчертава важността на проверките на готовност за резервните секвенсери и подобрения мониторинг за откриване на проблеми с осигуряването преди иницииране на аварийно превключване.
Проекти от слой 2 в цялата екосистема могат да възприемат подобни стратегии за укрепване на устойчивостта на секвенсерите и минимизиране на рисковете от прекъсвания, особено с нарастващите обеми транзакции.
Анализаторите отбелязват, че наличността на мрежата и надеждността на аварийното превключване са ключови фактори за институционалното приемане на rollup решенията, като оперативната стабилност влияе върху доверието на разработчиците и потребителите.
Планираните подобрения в инфраструктурата на Base целят да засилят позицията му като надеждна платформа от слой 2 в рамките на екосистемата Ethereum.
В перспектива Base ще споделя подробни технически актуализации за напредъка си и ще си сътрудничи с по-широката общност на OP Stack за усъвършенстване на стандартите и добрите практики за аварийно превключване.
Коментари (0)