データセンターの防火システム事故により、Microsoft Azureが一時停止

ヨーロッパ北部地域の一部ユーザーに影響:

ヨーロッパにあるマイクロソフトのデータセンターで、定期メインテナンスの際に防火用の不活性ガスが放出され、この不運な出来事によって7時間の停電が発生しました。Azureのレポートページによると、ガス放出によってエアハンドラーユニット(AHU)が自動的に作業を中断したことで周囲の温度が上昇し、一部のシステムがシャットダウンしたとのことです。
この停電により9月29日の13:27から20:15までの間、ヨーロッパ北部地域のAzureユーザーはAzureクラウドの利用に問題が生じたようです。

Azureレポート

マイクロソフトはレポートで、
「消火システムのメンテナンス作業時に予期せぬ不活性ガス漏れが発生しました。現場のAHUは、消火システムが発動しガスが放出された際に、ガスを室内に封じ込めるよう自動的にシャットダウンするよう当初から設計されていました。現在はエアハンドラーユニットを含めデータセンターは問題なく再稼働していますが、ガス漏れが発生した際は周囲温度は通常の設定値よりも上昇したため、一部システムがシャットダウンしてしまいました。
今回トラブルが発生した場所にあるいくつかのシステムは、オーバーヒートを防ぐために温度監視機能が内蔵されており、自動的にシャットダウン、再起動する仕様となっています。不活性ガスは直ちに検知され、発生の35分後には、全てのAHUが回復し、周囲温度も通常の運用レベルへと復帰しました。
しかし、上記のトラブルの性質や、ガス漏れによって隔離された場所との周囲温度状態に差が生じたことなどから、いくつかのサーバーやストレージは操作通りにシャットダウンしませんでした。その結果、トラブルシューティングや復旧作業に必要以上の時間がかかりました。」
との報告をしています。

マイクロソフトは今回のトラブルについて謝罪し、ガスが発生した原因調査を含め再発防止に取り組むとの声明を出しました。
火災抑制システムによるデータセンターでのトラブルは、このケースが初めてではありません。昨年のINGのケースではガスによる影響でハードドライブが損傷し、10時間システムへの接続ができなくなりました。同様のトラブルは2015年にグラスゴー市でも発生しています。

-Data Center Dynamics
原文はこちら