Les services cloud et les serveurs hébergés par Google et Oracle au Royaume-Uni ont été mis hors ligne en raison de problèmes de refroidissement alors que le pays connaît une vague de chaleur record.
Lorsque le mercure a atteint 40,3 ° C (104,5 ° F) dans l’est de l’Angleterre, le plus élevé jamais enregistré par un pays non habitué à ces conditions, les centres de données n’ont pas pu supporter la chaleur. Les machines sélectionnées ont été mises hors tension pour éviter des dommages à long terme, entraînant l’indisponibilité de certaines ressources, services et machines virtuelles, supprimant des sites Web malchanceux, etc.
Plusieurs ressources Oracle Cloud Infrastructure sont hors ligne, y compris la mise en réseau, le stockage et le calcul fournis par ses serveurs dans le sud du Royaume-Uni. Les systèmes de refroidissement ont été blâmés et les techniciens ont éteint l’équipement dans le but d’éviter que le matériel ne brûle, selon un état mettre à jour de Team Oracle.
« En raison des températures non saisonnières dans la région, un sous-ensemble d’infrastructures de refroidissement dans le centre de données du sud du Royaume-Uni (Londres) a rencontré un problème », a déclaré Oracle mardi à 1638 UTC. « Par conséquent, certains clients peuvent ne pas être en mesure d’accéder aux ressources Oracle Cloud Infrastructure hébergées dans la région ou de les utiliser.
« Les équipes de service concernées ont été engagées et travaillent à restaurer l’infrastructure affectée à un état sain, mais par mesure de précaution, nous sommes en train d’identifier une infrastructure de service qui peut être mise hors tension en toute sécurité pour éviter d’autres pannes matérielles. Cette mesure est prise dans le but de limiter le potentiel d’impact à long terme sur nos clients. »
On nous dit qu’au moins une partie de l’infrastructure de refroidissement d’Oracle est tombée en panne vers l’heure du déjeuner, heure du Royaume-Uni.
Réponse à vos 5 principaux dilemmes de refroidissement liquide
Oracle n’est pas le seul géant de l’informatique à signaler des pannes liées à la température. Google Cloud dit un certain nombre de ses produits « connaissent des taux d’erreur élevés, des latences ou une indisponibilité de service » lorsqu’ils sont desservis à partir de systèmes situés dans europe-west2-a, qui est l’une de ses installations londoniennes.
Ces problèmes affectent divers services liés au stockage et au calcul, notamment BigQuery, SQL et Kubernetes. Google a reconnu le temps d’arrêt à 1615 UTC. Cette panne a, d’une part, abattu Sites Web WordPress hébergés par WP Engine au Royaume-Uni, qui étaient alimentés par Google Cloud.
« Il y a eu une panne liée au refroidissement dans l’un de nos bâtiments qui héberge la zone europe-ouest2-a pour la région europe-ouest2 », selon un Google séparé consultatif.
« Cela a provoqué une défaillance partielle de la capacité dans cette zone, entraînant des terminaisons de machines virtuelles et une perte de machines pour un petit nombre de nos clients. Nous travaillons d’arrache-pied pour remettre le refroidissement en service et créer de la capacité dans cette zone. Nous ne prévoyons pas d’impact supplémentaire dans la zone europe-west2-a et les machines virtuelles en cours d’exécution ne devraient pas être affectées.
« Afin d’éviter d’endommager les machines et une panne prolongée, nous avons mis hors tension une partie de la zone et limitons les lancements préemptibles de GCE. Nous constatons un impact régional pour une petite proportion des volumes de disques persistants nouvellement lancés et nous travaillons à restaurer la redondance pour les périphériques de disques persistants répliqués concernés. »
Le registre a demandé à Oracle et Google de commenter davantage.
Les températures extrêmes ont également allumer des feux dans certaines parties de l’Angleterre, affectant le trafic autoroutier, les services ferroviaires et l’électricité, l’aéroport de Luton étant également temporairement fermé en raison de la fonte des pistes. Nous vous ferons savoir si d’autres services Internet sont également concernés. ®
Mise à jour pour ajouter
Nous avons publié un suivi ici, dans lequel nous évaluons les conséquences des pannes liées au refroidissement.