エヌビディア、データセンター向けの「Tesla T4 GPU」を公開 – GTC Japan 2018

富士フィルムはDGX-2を導入

エヌビディアは、日本でのGPU技術会議(GTC Japan 2018)で、次世代のディープラーニング技術として重要となる推論アクセラレータ向けの新しいデバイス「Tesla T4」を発表しました。

Source: NVIDIA

Tesla4は、Turing Tensorコア(1クロックあたり4×4行列の演算)を320個、そして2,560個のCUDAコアを搭載。FP16で65テラフロップ、INT8で130テラフロップ、INT4だと260テラフロップというピーク性能を75ワットの電気消費量で提供するといいます。
このハードウェアに加え、データセンター向けの「Nvidia TensorRTハイパースケール推論プラットフォーム」も同時に発表されましたが、ここでもリアルタイム推論のためにT4 GPUが利用されているといいます。

各社の反応

「あらゆる製品やサービスがAIに紐付けられ、AIによって向上される未来に向けて競い合っています。」と話すのはNvidiaのAccelerated Businessの副社長兼GMのIan Buck氏です。「Nvidia TensorRT Hyperscale Platformは、従来考えられてきたよりも迅速かつ効率的に、これを現実のものにするために設計されてきました。」

Microsoft社のBingおよびAI製品部門の副社長であるジョーディ・リバス氏も、
「リアルタイム推論ワークロードでエヌビディアのGPUを利用すると、Bingの高度な検索機能が向上され、画像のオブジェクト検出のレイテンシが縮小することになります。我が社は、エヌビディアの次世代推論ハードウェアおよびソフトウェアを利用し、人々がAI製品・サービスから得る恩恵を広げることを楽しみにしています。」と語りました。

Google Cloudのプロダクト・マネージャーのChris Kleban氏もまた、まもなくGoogle Cloudのプラットフォーム上で、エヌビディアのTuring Tesla T4 GPUを支援することを心待ちにしているといいます。
CisocやDell EMC、富士通、HPE、IBM、Oracle、Supermicroといったサーバーメーカーらも、T4 GPUを搭載したサーバーをリリースする計画です。

GTC Japanでの話題は

東京カンファレンスでは、他にもエヌビディアによるいくつかの基調講演がありましたが、その多くは自動運転イニシアチブに関連するものでした。中でも、NTTグループが全社的人工知能イニシアチブである”corevo”に、TensorコアGPUを搭載したNvidiaのAIプラットフォームを利用する計画であることや、富士フィルムがAI研究向けのDGX-2システムを利用することは、今回のカンファレンスにおいて特筆すべきことです。

– Data Center Dynamics
原文はこちら