複雑化するデータセンター/サーバールームの運用面での問題

ハイブリッドクラウド、IoT、HCI、、運用は複雑化の一途を辿る

現在、企業の多くは、利用するデータの性質や目的に応じて、自社のインフラ設備とともに、AWS・Azureなどの クラウド サービスや外部の ハウジング サービスなどを併用した ハイブリッドIT 環境に対しての運用を行っています。

また近年、 IoT の加速に伴う エッジコンピューティング への動き、あるいは「 ハイパーコンバージ ドインフラ(HCI)」技術を活用した、パブリック・クラウドから オンプレミス 回帰への動きも始まってきており、ITインフラの複雑性は年々高まってきています。

– Uptime Instituteレポートが明らかにした事実

Uptime Instituteが公開した2018年のGlobal Data Center Surveyレポートは、その副題に「Operators struggle with constraints, change, and complexity(データセンター運用者は制約、変更、そして複雑さに苦しんでいる)」とあるように、主に近年のデータセンターの効率化の反面システム障害発生率の上昇に関し、運用面での問題に主にフォーカスした内容となっています。
レポートは、日本を含む世界中の867のエンタープライズや事業者データセンターの運用担当者やIT担当者からの回答を元にしています。

この10年間でテクノロジーの進化や時間をかけた努力により、データセンターのエネルギー効率向上のアプローチは成功しているといわれているようです。最も一般的な設備効率の指標である PUE 値は今年の調査では過去最低を記録したとのことです。

多くの回答者は自社所有のオンプレミス設備とオフプレミスを組み合わせたハイブリッドデータセンターアプローチによって、IT運用の回復力(Resilience: レジリエンス)高まったと考えているようです。
しかし一方、過去一年間を通じて、ITのダウンタイムインシデントや深刻なサービス低下の影響を受けたという回答者は、昨年よりも増加しており、さらには過去3年間で見ると回答者のほぼ半数が、システムダウンの経験があるとの驚くべき事実があったと述べています。これについては、既に過去のDC Cafeレポートでも取り上げました。
(参照:【特集記事】Uptime Instituteの障害報告レポート(2018/11/1)

さて、システムダウンの一般的な原因としては、オンプレミスの電源障害、ネットワーク障害、ソフトウェアやITシステムのエラーなどであり、なぜこれほど多くのデータセンターがこのように脆弱であるのか?については、レポートでは以下のような要因があると述べています。

・効率的だがより複雑化:ハイブリッドITアプローチにより業界全体のPUE値は向上したが、その反面システム全体の複雑さは増している
・エッジコンピューティングの到来:これは新たに運用の複雑さを加える要因になる
・ラック実装密度の問題が増加:冷却の問題に直面しつつある現状がある
・自然環境の変化に対する漸弱性:温暖化による気温の上昇、水不足やその他の深刻な気象災害などに対する備えが不足している
・深刻化するオペレータースキル不足:適切な知識を持つデータセンターオペレーターの人材不足の問題が深刻化している

ついにDCIMがデータセンターに欠かせない存在に?

Uptimeのレポートでは同時に、「ごく一部のデータセンターで DCIM の実装が始まってきており、その多くは成功している」と業界での広範な報告を裏付ける報告もなされています。

最も成功しているデータセンターではDCIMが実装されていますが、導入が困難である可能性や、その利点が必ずしも容易に理解または測定されるとは限りません。上記の理由や、その他の理由からも、歴史的にDCIMは物議を醸しており、展開不足に陥っているテクノロジーです。

– 過去の技術ではない?54%のユーザーは何らかのDCIMを実装している

しかし、DCIMが(ついに)主流のデータセンター技術になるまでに達したようです。調査回答者の半数以上(54%)は、何らかの市販DCIMソフトウェアを導入したと回答し、11%は自社製DCIMを導入しました。 DCIM技術の成熟度を証明するものとして、これらのユーザーの75%が導入に成功したと答えている結果があるようです。

今後更に複雑化を増していくデータセンターの可用性や耐障害性を向上させるために、DCIMは欠かせない存在となってきているようです。

また、DataCenter Dynamics社が発行するDCDマガジン Issue30 October/November2018号の「Why revive the DCIM camel?:なぜDCIMラクダが復活するのか?」の記事では、スマートデータセンターの要求が、2014年前後にあった市場からの過剰期待に応えられず失速したDCIMの復活を促す、との興味深い見解も示されています。

既に市場から撤退したDCIMベンダーもいくつか存在しますが、テクノロジーの変化に対応し、着実に進化を遂げた次世代のDCIMも実績を積み重ねてきています。

スキルを持った運用者の人材不足の問題も顕著に

Uptimeのレポートに戻りますが、人的リソースの問題としては、回答者の50%以上によると、特に重要でありながら採用が困難である主要な専門分野は、「運用と管理」との結果であったようです。多くのデータセンターでは深刻なスキル不足、人材不足についての問題が顕著になってきているようです。

これらの調査結果などから、今後データセンターの管理者や運用者が取り組むべき課題は、高密度環境に対する冷却方式の検討や自然災害に対する脆弱性の強化とともに、複雑化したデータセンターの可用性を維持する為のDCIMの導入、あるいは運用・管理に関する人材教育であると言えるでしょう。

—————————————-
DC ASIAではこれらの課題を解決するソリューションを提供しています。
各ソリューションの詳細については下記リンクよりご参照ください。

・高密度ラック実装環境における冷却ソリューション
・複雑化したハイブリッドIT環境の耐障害性を向上するDCIMソリューション
・データセンター運用・管理スキルの習得をサポートするデータセンター教育プログラム

お問合せはこちらから