Lundi 20 octobre, une panne massive d’Amazon Web Services (AWS) a semé la pagaille sur Internet. Des applications mondialement utilisées, comme Airbnb, Snapchat, Reddit, Roblox ou encore Brawl Stars, se sont retrouvées à l’arrêt pendant plusieurs heures, paralysant une partie de l’économie numérique. L’incident, survenu aux États-Unis, illustre la dépendance mondiale à l’infrastructure cloud du géant américain.
Une erreur DNS transformée en crise globale
Tout a commencé par ce que les ingénieurs d’AWS pensaient être une panne courante, une « erreur DNS » (Domain Name System). Ce système de noms de domaine, qui traduit les adresses web en adresses IP, est l’un des piliers invisibles d’Internet. Lorsqu’il tombe en panne, les serveurs deviennent inaccessibles, rendant impossible la communication entre les applications et leurs bases de données. Selon Amazon, cette erreur aurait perturbé la capacité du réseau à diriger correctement le trafic entre les utilisateurs et les serveurs. Les causes possibles vont de la maintenance technique à une défaillance logicielle ou humaine. Dans de rares cas, une cyberattaque peut aussi provoquer ce type d’incident. En milieu de journée, AWS assurait avoir « entièrement résolu le problème DNS » et affirmait que « la plupart des services fonctionnaient de nouveau normalement ». Mais la trêve a été de courte durée, car quelques heures plus tard, de nouvelles perturbations touchaient les États-Unis, paralysant cette fois le jeu Battlefield, la compagnie aérienne Delta et le service de paiement Venmo.
Une défaillance dans la tour de contrôle du cloud mondial
L’origine profonde de la panne s’est révélée bien plus grave que prévu. Les équipes d’Amazon ont identifié un dysfonctionnement au sein d’un sous-système interne chargé de surveiller les répartiteurs de charge réseau, autrement dit la tour de contrôle d’AWS. Cette défaillance a désorganisé la circulation du trafic sur l’un de ses centres névralgiques : la région US-East-1, située dans le nord de la Virginie. Ce centre, le plus ancien et le plus important du réseau AWS, reste un passage obligé pour certaines opérations fondamentales, malgré la segmentation du cloud mondial en une quarantaine de régions censées fonctionner de manière autonome. L’incident a révélé que cette architecture distribuée n’était pas aussi indépendante qu’annoncée.
Une dépendance mondiale de plus en plus risquée
Cette panne a mis en lumière une réalité inquiétante : la dépendance planétaire à quelques fournisseurs de cloud américains. AWS, qui concentre environ 30 % du marché mondial, domine le secteur devant Microsoft Azure (20 %) et Google Cloud (13 %), formant le trio surnommé le « Big Three ». En Europe, des acteurs comme OVHcloud tentent de résister, mais peinent à rivaliser avec la puissance d’investissement des géants américains capables de construire des centres de données à grande échelle. L’épisode du 20 octobre renforce donc l’appel à une souveraineté numérique européenne, alors que des millions d’entreprises, de plateformes et de services publics reposent désormais sur une poignée d’infrastructures situées outre-Atlantique.