米国で一時的な航空交通規制、原因はソフトウェアの異常

米国の主要航空会社数社は、4月1日(月)に発生したソフトウェアの停止により、一時的に航空機の離陸を取りやめました。

飛行機の重量とバランスを探知し、航空計画に用いられる「AeroData」は、サーバーがオフラインになる原因不明の障害に見舞われました。Southwest、ユナイテッド航空、Jetblue、アラスカ航空、デルタ航空が影響を受け、そのうち数社では結果として事務処理にも影響が及びました。

技術的な問題は既に修正されており、キャンセルとなったフライトはありませんでしたが、約780便のフライトに延期が生じました。(詳細については、各社のフライト情報を確認することを推奨します。)

停止の原因は不明

影響を受けた航空会社の一つ、Southwest Airlines社は「午前6時5分、運行計画で使用されるデータを運送業者に提供しているベンダー(AeroData)と共に、停電中におよそ40分間実施されたグラウンドストップ(特定の空港に到着する航空機の流れを遅延・停止させる航空交通管制措置)を解除しました」と発表しました。

– Thinkstock / anyaberkut

停止の原因は不明ですが、VMwareが2017年に発行した「顧客事例集」から、AeroDataはアリゾナとコロラドに3つのデータセンターを運営していることが明らかになっています。事例集で、AeroDataは自社のサービスについて下記の通り語っています。

「AeroDataは、主要航空会社に重要なフライトデータを提供するサービスです。サービスは各航空会社のITシステムと連携はしていますが、全く別物であると認識されています。つまり、航空会社のITシステムで何らかの問題が発生した場合も、Aero Data側で顧客データやフライトデータを安全に確保し、必要に応じた提供が可能です。一方でAeroDataは、重要なフライトデータを取り扱っており、離陸前の航空機の入り口ドアが閉じる直前にパイロットが使用する最後のアプリケーションでもあります。そのため、たとえソフトウェアにわずか5分のシステムダウンが生じても、離陸を控える100以上のフライトの遅延と収益の損失が発生する可能性があります。」

「当社では、WAN高速化技術を使用して、あるデータセンターから別のデータセンターへ、 管理者が設定した[送信元アドレス、プロトコル、ポート番号、パケットサイズ、入力I/F]の情報に基づきルーティングを行えるポリシー ベース ルーティングを導入しています。この技術は、回線障害(MPLSやISP)の影響を抑えるだけでなく、帯域幅利用を最大80パーセントも改善します。AeroDataはアプリケーションのコピー作成と移行にかかる時間をデータセンター間で大幅に短縮することができます。」

同社が2017年以降にデータセンターを拡張したかどうかは明らかになっていません。

システムダウンの影響を受けやすい航空会社

AeroDataの肩を持つわけではありませんが、アプリケーションやデータセンター障害による航空会社への影響は珍しいものではありません。非常に複雑で様々なコンポーネントが絡み合っているのが実情です。

たとえば先週も、手荷物検査やチケット、チェックイン、予約の印刷を行うSabre社がITシステム障害を起こしたことで、米国全土でのフライトが遅延する事故が発生しています。

2018年には、ロンドン・ガトウィック空港でも出発口のボードシステムが停止しました。空港は大混乱に陥り、空港スタッフはホワイトボードやメガホンを使ってフライト情報を乗客に伝達することとなりました。空港のウェブサイトも同様に使用できなくなりましたが、幸いにも、実際にキャンセルされた便はありませんでした。これは、光ファイバーケーブルの故障が原因だったとみられています。

また、最も有名なのは イギリスの航空会社ブリティッシュ・エアウェイズ(BA)が、データセンターの不具合に伴う同社のサービスダウンについて、不動産会社のCBREを訴えた事件です。このトラブルでは、週末の3日間で計672便がキャンセルとなり、推定被害総額は5,800万ポンド(約80億円)にのぼるとされています。 和解に達しましたが、どのような条件交渉があったのかは判明していません。

Data Center Dynamics

原文はこちら