- Status Closed
- Percent Complete
- Task Type Incident
- Category Datacenter MAR01
- Assigned To No-one
- Severity Critical
-
Due Date
Undecided
- Private
FS#139 - Incident groupe froid MAR01
Il y a actuellement un incident sur les groupes froid du datacentre MAR01.
La température dans les salles d’hébergement est anormalement élevée.
Nous sommes en contact avec les équipes d’astreinte.
Cette nuit, à 22h, le datacentre de Jaguar Network situé à Marseille (MAR01 chez nous) a eu un incident majeur sur les groupes froid de climatisation.
La température dans les salles est montée rapidement à un seuil très élevé (60 à 65° dans les salles serveurs) malgré le déclenchement des astreintes techniques sur site.
À 0h43 CEST, l'électricité a été coupée dans les salles serveurs pour éviter d'endommager le matériel et le risque d'incendie.
Le datacenter est en blackout total depuis, faute d'énergie.
Les réparations sur la climatisation sont en cours.
Nous n'avons pas d'ETA à cet instant, mais nous espérons un redémarrage progressif de l'alimentation en énergie du datacentre d'ici quelques heures.
Vous pouvez suivre l'évolution de la situation sur Twitter :
https://twitter.com/dynamixhost ;
https://twitter.com/search?q=jaguar%20network
Nous vous remercions pour votre compréhension et nous nous excusons pour la gène occasionnée.
La production de froid est à nouveau assurée dans les salles IT.
Les équipes en datacentre rallument progressivement les baies et les équipements dans les différentes salles.
Notre réseau est à nouveau opérationnel au datacentre Jaguar Network (MAR01).
Les serveurs et les services remontent progressivement…
Nous vérifions le redémarrage des serveurs.
85 serveurs indisponibles
47 serveurs injoignables
14 serveurs injoignables
Une intervention sur site est requise pour dépanner ces machines.
L’ensemble des machines sont à présent opérationnelles.
Comme convenu, voici le compte rendu de l’incident de climatisation qui a eu lieu le 30-31 Mai 2023 au sein du datacenter MAR01 de Jaguar Network.
Il contient le descriptif de l’incident, le déroulement chronologique et le plan d’actions mis en place.