Mardi, une panne a touché le service S3 d’Amazon Web Storage situé aux USA au nord de la Virginie. Le problème a duré quelques heures avant d’être résolu et a causé des ralentissements sur une partie du web. La raison de cette panne est désormais connue.

Les équipes d’Amazon tentaient de résoudre un problème qui causait des ralentissements dans le système de facturation. C’est à ce moment que les choses se sont mal passées.

« Un membre habilité de l’équipe S3 suivant une stratégie établie a exécuté une commande qui devait supprimer un petit nombre de serveurs d’un des sous-systèmes du S3 utilisé par le système de facturation. Malheureusement, l’une des commandes a été entrée de manière incorrecte et un plus grand nombre de serveurs que prévu a été supprimé, » explique Amazon dans un communiqué.

Des changements en vue

Les serveurs supprimés par inadvertance supportaient deux autres sous-système du Simple Storage Service, celui indexant les objets S3 et celui allouant l’espace de stockage aux nouveaux objets. AWS a dû redémarrer ces sous-systèmes, rendant tout le service S3 inopérant. Ce qui a rendu inaccessible des milliers de sites.

« Nous sommes en train de mettre en place plusieurs changements après cet événement », a annoncé le géant du cloud. De nouveaux dispositifs de sécurité vont faire leur apparition, notamment pour éviter la suppression inopinée de serveurs par une simple commande mal saisie.