Kzu 22, 2023 Paulo Alves
O Que Causou a Interrupção do Sequenciador Arbitrum One em 15 de Dezembro de 2023?
Em 15 de dezembro de 2023, ocorreu uma interrupção significativa na rede Arbitrum: o Sequenciador Arbitrum One experimentou uma disrupção notável. Esta análise detalhada, baseada no relatório pós-morte fornecido pela Arbitrum, mergulha na sequência de eventos, causas técnicas e resoluções empreendidas.
Thank you, Arbitrum community, for your patience and understanding during the outage on Dec 15, 2023. We recognize the impact on users with disruption in processing transactions and increased gas fees.
— Arbitrum (💙,🧡) (@arbitrum) December 21, 2023
An investigation was conducted 👇https://t.co/THWmglxLvA
🧵
O que é o Sequenciador Arbitrum One?
O Sequenciador Arbitrum One é um componente essencial da rede Arbitrum, encarregado de ordenar e agrupar transações para o blockchain Ethereum. Esse processo melhora a velocidade e eficiência das transações, reduzindo custos e latência. Como um elemento chave na solução de escalabilidade de Camada 2 da Arbitrum, o Sequenciador é vital para manter a operação suave e eficaz dentro da rede.
Como Começou a Interrupção do Sequenciador Arbitrum One e Quais Foram Seus Efeitos Imediatos?
O incidente começou nas primeiras horas do dia 15 de dezembro, quando o publicador de lotes do Arbitrum One, responsável por postar dados de transação no Ethereum, formou um backlog. Esse backlog foi devido a problemas com um cliente de consenso do Ethereum e cargas aumentadas de um alto volume de inscrições, pequenas transações que podem escalar significativamente a capacidade de processamento de transações.
Quais Foram as Razões Técnicas por Trás da Interrupção do Sequenciador Arbitrum One?
Dois problemas principais levaram à interrupção: uma falha na versão do cliente de consenso do Ethereum causando a dessincronização de um nó L1, e um aumento no volume de inscrições. Essa combinação criou um backlog que o Sequenciador não conseguiu processar efetivamente, levando à sua falha e desconexão de provedores de nó de terceiros e da frota pública RPC.
Como a Interrupção do Sequenciador Arbitrum One Afetou a Precificação de Gas L1?
A equipe da Offchain Labs, representando a Arbitrum, implantou rapidamente uma versão de desenvolvimento do software de nó no Arbitrum Sepolia para teste inicial. Após validação bem-sucedida, essa correção foi implementada no Sequenciador Arbitrum One, restaurando suas operações normais.
Como a Interrupção do Sequenciador Arbitrum One Afetou a Precificação de Gas L1?
A interrupção levou ao sistema de precificação onchain subestimar as taxas de gas devido ao backlog. À medida que o backlog foi resolvido e as operações normais foram retomadas, surgiu um déficit nas taxas devido à discrepância entre a quantia gasta para postar dados no L1 e as taxas coletadas. A Fundação Arbitrum interveio, alocando fundos para estabilizar o mecanismo de precificação, enviando transações de valor zero para um endereço de queima, reequilibrando assim os custos de transação.
Quais Medidas Foram Implementadas Após a Interrupção do Sequenciador Arbitrum One?
Após o incidente, a Arbitrum implementou várias medidas para prevenir ocorrências futuras. Estas incluíram reiniciar o cliente de consenso do Ethereum, ajustar as configurações do publicador de lotes e implantar uma nova construção de sequenciador. As principais lições aprendidas giraram em torno da importância de manter a saúde dos relays internos e atualizar regularmente as instâncias do cliente de consenso.
Qual Foi a Cronologia dos Eventos Chave Durante a Interrupção do Sequenciador Arbitrum One?
- 15 de dezembro, 00:07 AM UTC: Falha do cliente de consenso L1 devido a um bug na versão do cliente.
- 12:11 PM UTC: O publicador de lotes incapaz de acompanhar as demandas da cadeia.
- 13:40 PM UTC: Investigação do backlog; métricas subestimaram o impacto das inscrições.
- 14:36 PM UTC: Correção implantada para problema do balanceador de carga.
- 15:31 PM UTC: Relays de distribuição primários ficaram sem memória.
- 15:51 PM UTC: Início da nova construção do sequenciador.
- 16:06 PM UTC: Ajustes nas configurações do publicador de lotes.
- 16:54 PM UTC: Implantação da nova construção no sequenciador arb1.
- 17:18 PM UTC: Notificação aos provedores de nó de terceiros para reiniciar.