SNSサービスのネットワーク通信事情

Facebookは、サーバー25,000台をデータセンター事業者1社でまかなう

Facebookの1日あたりの利用者数は14億7千万人、WhatsAppは15億人、Instagramは5億人います。Facebookは、この業界ではほとんど考慮されていなかったスケーリング問題に直面しています。

「列車の前に線路を敷きながら、できるだけ早く移動しているかのようにいつも感じています。ソフトウェアチームと製品チームが、データセンターに十分なキャパシティがあるかどうか考慮する必要性に迫られることなくことなく、自分らが欲するソリューションを提供できるようになります。」Facebookのインフラおよびサイトサービス事業部VP、D・エバリー氏はDCDにこのように語りました。

エンジニアは準備万端

「Facebookの運営規模でデータセンターを運用しているとします。ソフトウェア会社の一員として素晴らしいと感じることの1つに、特定のソリューションを開発できるソフトウェアエンジニアリングに長けた人材が社内にいること、があります。それによりデータセンターと施設の運用をより効率的にできるのですから」

Facebookが頼みにしているシステムの1つにFacebook Auto-Remediation(FBAR)があります。これはハードウェアやソフトウェアの障害に対応するための自動化サービスで、完全自己修復型のデータセンターを構築する第一歩です。

「機械学習は、通常、データセンターの修復機能には当てはまるとは思っていませんが、施設の運用面で今も複数の場所で使用されています。追っかけなければならない事は非常に多くありますが、人間はもはや最も有効な「もの」ではありません」と、エバリー氏はコメントしました。

この事は同様に物流分野にも及ぶとエバリー氏は述べています。「データセンター内を移動する資材量を管理する革新をいくつか実践してきました:交換部品と補充部品、返却部品などです」

場合によっては、人を補充するのではなく、この技術を使って、例えば、「システム1つ構築して、世界中のどこのデータセンターや場所に部品があるかどうかを検索・確認します。特定のレポートを実行したり、あなたが対応している問題を別の人が追加で調べたりすることなく、そこに以前どんな問題があったかを確認することが可能です」

エバリー氏は次のように付け加えました。「物流は必ずしも多くの人が新しい技術を取り入れている分野ではありませんが、私たちにとっては大改革です。簡単に言うと、複数のデータセンターにまたがって発生する資材の取り扱いと管理です」

これによって、Facebookはサーバー25,000台をデータセンター事業者1社でまかなうことが可能になりました。前例のない比率です。「歴史的に注目されてこなかった分野で、Facebookは非常に素晴らしいことをやってきました」

「私はそれがサーバー対テクノロジーの比率を評価できるポイントだと思っています。Facebookは機械学習を利用することで、「ほとんどの人が最初は注目しない分野でこれを試してみましょう」と発信しているところです。この技術の初期性能には、本当に興奮しています」

– Data Center Dynamics
原文はこちら