Panne mondiale chez Amazon Web Services : des applications populaires hors service pendant plusieurs heures

Une panne majeure survenue hier chez Amazon Web Services (AWS) a provoqué une interruption massive dans le monde entier, affectant des dizaines d’applications et services numériques très populaires. Des millions d’utilisateurs, notamment de Snapchat, Fortnite, Reddit, Duolingo ou Venmo, se sont retrouvés dans l’impossibilité d’accéder à leurs comptes pendant plusieurs heures, tandis que des appareils connectés comme Alexa ou Ring sont également devenus inutilisables.

post-image-3
La panne a débuté aux alentours de 07h11 GMT dans le centre de données AWS d’Ashburn, en Virginie, le plus ancien et le plus grand de la firme. Selon Amazon, le problème est dû à un dysfonctionnement du système de surveillance réseau chargé de répartir la charge entre les serveurs. Cette défaillance a entraîné la chute de 113 services AWS, dont la base de données très utilisée DynamoDB. Par ailleurs, une erreur au niveau du système de noms de domaine (DNS) a empêché de nombreuses applications de communiquer avec les serveurs adéquats.

Impact sur les utilisateurs et les services

Les conséquences ont été ressenties à l’échelle mondiale : plus de 4 millions de signalements de panne ont été enregistrés sur des plateformes comme Downdetector. Outre les réseaux sociaux et les services de jeux en ligne, des plateformes financières et des outils de productivité ont également été touchés. Par exemple, des banques telles que Lloyds et Halifax ainsi que la plateforme de cryptomonnaies Coinbase ont rencontré des problèmes de connexion.

Processus de rétablissement

Amazon a réussi à remettre en ligne la majorité des services en l’espace de trois heures, en limitant temporairement les nouvelles requêtes serveur et en déployant des mesures de réparation. Cependant, la remise à niveau complète a pris plusieurs heures supplémentaires en raison d’un retard dans le traitement des données.

Cette panne met en lumière la forte dépendance de l’infrastructure numérique mondiale à un petit nombre de grands fournisseurs cloud. Les experts alertent sur les risques liés à cette centralisation et appellent à développer une architecture plus résiliente, avec davantage de redondance et des options de basculement (failover). Ils recommandent aux entreprises de diversifier leurs services sur plusieurs plateformes cloud afin de limiter les risques futurs.
Back to top button
Close
Close