AT&Tデータセンターでの障害レポート – 電源スイッチの故障か

インターネットとTVが使えない

月曜(2018年10月15日)、AT&T社のテキサス州にあるデータセンターで火災があり、ブロードバンドとテレビ回線を利用するユーザーが、同社の一部サービス(U-verseプラットフォーム)にアクセスできなくなりました。

テキサス州北西に位置するリチャードソン地域の報道官の発表によると、現地時間の午前9時48分、2つの消防団が火災の発生した「ファーマンドライブ1666」にあるデータセンターに到着し、火を消し止めました。

CBSのローカルリポーターであるMary Ann Martinez氏はニュースの一部を抜粋し「火元は電源スイッチで、プライマリとバックアップの電気システムが燃えた」とツイートしていました。

電源スイッチが火元か

当初、AT&T社の報道官は、データセンターへの落雷が火事の原因としましたが、ある会社の重役は、落雷が原因である可能性は低いと考えているようです。
CBSの地方局は午後8時にはサービスは復旧していたとしていますが、downdetector.comのデータによると、最も多くのサービスダウンが報告されていたのは午後9時48分、1377の設備でサービスが使えなかったことが分かっています。

インターネットが使えないとコメントしたユーザーの多くはダラスからで、テレビサービスが使えなくなったユーザーも同様でした。
電子機器の火災はデータンセンターの停電の原因としてよくあり、直近の18カ月だけでも、メリーランド州のジョージタウン大学、オーストラリア、ケアンズのヘルスケアセンター、メルボルンのプロバイダーが同様の理由でサービスを中断しました。

おそらく現在でも最も停電の原因としてありふれているのは、火災を止めようとする消火システムそのものが原因となるパターンでしょう。
一度火災が起こると、火の手を抑え込もうとするシステムが働き、データセンターのハード機器に大きな影響を与えてしまいます。例えば、ルーマニアにあるING Bankのデータセンターで2年前に起こった停電や、ロンドンの大学でも、昨年同様のことが発生しています。2015年にはグラスゴーの市議会のデータセンターが停電になっています。

時には、消火システムが施設内のIT機器に影響がでないよう、機械のスイッチをオフにしてしまうこともあります(セーフガードシステムが正しく実行されている、とみなすことももちろんできます)。実際に、2017年10月にマイクロソフト社Azureセンターの防火システムが作動したことで、北ヨーロッパ地域のユーザーへ影響が及ぼされたこともあります。
今年の初めにはスウェーデンにある、Nordic Stock Excahngeを含むDidiPlex facilityでも同様の被害が出ています。

– Data Center Dynamics
原文はこちら

返信を残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です