Une panne continue de Cloudflare a mis hors service bon nombre de ses produits, notamment le tableau de bord de l’entreprise et les interfaces de programmation d’applications (API) associées que les clients utilisent pour gérer et lire les configurations de services.
La liste complète des services dont les fonctionnalités sont totalement ou partiellement impactées comprend le tableau de bord Cloudflare, l’API Cloudflare, Logpush, la posture des appareils WARP/Zero Trust, l’API Stream, l’API Workers et le système de notification d’alerte.
« Ce problème affecte tous les services qui dépendent de notre infrastructure API, notamment les alertes, la fonctionnalité de tableau de bord, Zero Trust, WARP, Cloudflared, Waiting Room, Gateway, Stream, Magic WAN, API Shield, Pages, Workers », a déclaré Cloudflare.
« Les clients utilisant les API Dashboard/Cloudflare sont concernés car les requêtes peuvent échouer et/ou des erreurs peuvent s’afficher. »
Les clients rencontrent actuellement des problèmes lorsqu’ils tentent de se connecter à leurs comptes et voient des erreurs d’authentification « Code : 10 000 » et des erreurs de serveur interne lorsqu’ils tentent d’accéder au compte. Tableau de bord Cloudflare.
Cloudflare indique que les problèmes de service n’affectent pas la livraison des fichiers mis en cache via les fonctionnalités de sécurité Cloudflare CDN ou Cloudflare Edge.
Panne de courant du centre de données derrière des problèmes de tableau de bord et d’API
Deux heures après le début de la panne, la société a révélé que les problèmes persistants étaient dus à des pannes de courant dans plusieurs centres de données.
« Cloudflare évalue une perte d’alimentation affectant les centres de données tout en basculant simultanément les services. Nous continuerons à fournir des mises à jour régulières jusqu’à ce que le problème soit résolu, merci de votre patience pendant que nous travaillons à atténuer le problème », a mis à jour le rapport d’incident. dit.
Il s’agit de la deuxième panne majeure qui frappe Cloudflare depuis le début de la semaine, la première mettant hors service plusieurs produits, notamment les sites et services Cloudflare (accès, purge du cache CDN, tableau de bord, images, pages, tourniquet, salle d’attente, WARP). , Travailleurs KV) le lundi 30 octobre.
Comme l’a expliqué l’entreprise dans un autopsie publiée deux jours plus tard, la panne de lundi a été causée par une mauvaise configuration de l’outil utilisé pour déployer une nouvelle version de Workers KV.
Workers KV est « utilisé à la fois par les clients et les équipes Cloudflare pour gérer les données de configuration, les recherches de routage, les ensembles d’actifs statiques, les jetons d’authentification et d’autres données nécessitant un accès à faible latence », ont déclaré Matt Silverlock et Kris Evans de Cloudflare.
« Au cours de cet incident, KV a renvoyé ce qu’il pensait être un code d’état HTTP 401 (non autorisé) valide au lieu de la ou des paires clé-valeur demandées en raison d’un bug dans un nouvel outil de déploiement utilisé par KV. »
Ceci est une histoire en développement…