Quand le cloud Amazon tousse c’est tout internet qui est malade, et comme qui dirait « c’est le ciel qui nous tombe sur la tête » …
Trêve de plaisanterie, vous avez sûrement remarqué que le 28 Janvier au soir certaines pages web incluant 54 des 100 premiers sites marchands étaient indisponibles et ceci pendant 4 heures, les pertes étant estimés à environ 150 millions de dollars. Le point commun entre ces sites ? Le service de stockage Amazon Simple Storage Service (AWS S3) touché par des perturbations. Ces derniers jours plusieurs rumeurs ont circulé parlant d’attaque DDos, de virus et j’en passe …
Au final la vrai raison est tout autre et bien connu dans notre domaine, une erreur humaine et plus particulièrement une erreur de typo sur une commande. Celle-ci aurait du supprimer une petite quantité de serveurs en rapport avec un soucis de lenteur du système de facturation, mais au final une grande quantité de serveurs fut supprimée dont deux sous systèmes de gestion d’S3, d’où les problèmes de corruptions et de perte d’accès.
©thousandeyes.com
Le redémarrage ne s’est évidemment pas passé comme prévu avec quelque serveurs avec de gros uptimes rencontrant des problèmes de lenteur du aux safety checks d’intégrité au démarrage. Pour couronner le tout les services gérant les tableaux de bord (SHD) clients ont aussi été impactés, impossible donc de se rendre compte des problèmes, les checks étant tous au vert …