Uma extensa interrupção nos serviços da Amazon Web Services (AWS) causou a queda de diversos aplicativos e sites em todo o mundo nesta terça-feira. Snapchat, Duolingo e Roblox foram alguns dos afetados, juntamente com serviços bancários no Reino Unido, como Lloyds e Halifax.
O que aconteceu?
Os problemas começaram por volta das 8h no Reino Unido (horário local) e parecem estar relacionados a um problema na Amazon Web Services (AWS), que fornece infraestrutura para grande parte da internet moderna. A empresa relatou "taxas de erro aumentadas" e atrasos com "vários serviços da AWS", conforme comunicado em sua página de status.

Fonte: BBC
Qual o impacto da pane?
A AWS é a maior provedora de serviços de nuvem do mundo, permitindo que empresas aluguem computadores e servidores para executar seus aplicativos e sites. Uma falha na AWS pode afetar rapidamente grande parte da internet, derrubando sites que podem não ter nenhuma conexão aparente com a Amazon.
O site Down Detector, que rastreia reclamações sobre o funcionamento de sites e serviços online, registrou um aumento repentino e generalizado de notificações de problemas. A lista de serviços afetados inclui:
- Snapchat
- Ring
- Roblox
- Clash Royale
- Life360
- My Fitness Pal
- Xero
- Canva
- Amazon
- Amazon Web Services
- Amazon Music
- Prime Video
- Clash of Clans
- Fortnite
- Wordle
- Duolingo
- Coinbase
- HMRC (Autoridade Tributária do Reino Unido)
- Vodafone
- Playstation
- Pokémon Go
Qual a causa do problema?
A Amazon informou ter identificado uma "causa raiz potencial" para as taxas de erro das APIs do DynamoDB na região US-EAST-1. De acordo com a investigação, o problema parece estar relacionado à resolução DNS do endpoint da API do DynamoDB em US-EAST-1.
"Identificamos uma causa raiz potencial para taxas de erro para as APIs do DynamoDB na região US-EAST-1. Com base em nossa investigação, o problema parece estar relacionado à resolução DNS do endpoint da API do DynamoDB em US-EAST-1." - Amazon Web Services
Houve ataque cibernético?
Embora seja natural questionar se uma interrupção dessa magnitude é resultado de um ataque cibernético, não há indícios que sugiram essa possibilidade. Especialistas em segurança alertam que a infraestrutura da internet pode ser mais frágil do que se imagina, mas, na maioria das vezes, interrupções como essa são causadas por erros, como uma atualização mal aplicada ou um problema físico em um data center.
Próximos passos
Engenheiros da Amazon estão trabalhando para mitigar o problema e entender completamente a causa raiz. A empresa continua a publicar atualizações em sua página de status, mas ainda não há uma previsão de quando os serviços serão totalmente restaurados. A interrupção ressalta a dependência da internet moderna na infraestrutura da AWS e a importância da resiliência para evitar interrupções generalizadas. A queda de serviços importantes como Snapchat e Duolingo demonstra o impacto direto da falha no cotidiano dos usuários.
A falha da AWS também gerou preocupações sobre a concentração de serviços de nuvem em um número limitado de provedores. A dependência excessiva de um único fornecedor pode aumentar a vulnerabilidade a interrupções e outros problemas. Analistas do setor vêm alertando sobre a necessidade de diversificação e estratégias de backup para garantir a continuidade dos negócios em caso de falhas.
Ainda não se sabe o impacto financeiro total da pane, mas é certo que a interrupção causou prejuízos significativos para empresas e usuários em todo o mundo. A AWS é um pilar da economia digital e sua estabilidade é fundamental para o funcionamento da internet como a conhecemos. A resolução rápida e completa do problema é essencial para restaurar a confiança e evitar novas interrupções no futuro. A pergunta que fica é: como garantir a estabilidade da infraestrutura digital em um mundo cada vez mais dependente da nuvem?