エヌビディア、データセンター向けの「Tesla T4 GPU」を公開 – GTC Japan 2018

富士フィルムはDGX-2を導入

エヌビディアは、日本での GPU 技術会議(GTC Japan 2018)で、次世代の ディープラーニング 技術として重要となる推論アクセラレータ向けの新しいデバイス「Tesla T4」を発表しました。

Source: NVIDIA

Tesla4は、Turing Tensorコア(1クロックあたり4×4行列の演算)を320個、そして2,560個のCUDAコアを搭載。FP16で65 テラフロップ 、INT8で130 テラフロップ 、INT4だと260 テラフロップ というピーク性能を75ワットの電気消費量で提供するといいます。
このハードウェアに加え、データセンター向けの「Nvidia TensorRTハイパースケール推論プラットフォーム」も同時に発表されましたが、ここでもリアルタイム推論のためにT4 GPUが利用されているといいます。

各社の反応

「あらゆる製品やサービスが AI に紐付けられ、 AI によって向上される未来に向けて競い合っています。」と話すのはNvidiaのAccelerated Businessの副社長兼GMのIan Buck氏です。「Nvidia TensorRT Hyperscale Platformは、従来考えられてきたよりも迅速かつ効率的に、これを現実のものにするために設計されてきました。」

Microsoft社のBingおよびAI製品部門の副社長であるジョーディ・リバス氏も、
「リアルタイム推論ワークロードでエヌビディアの GPU を利用すると、Bingの高度な検索機能が向上され、画像のオブジェクト検出のレイテンシが縮小することになります。我が社は、エヌビディアの次世代推論ハードウェアおよびソフトウェアを利用し、人々がAI製品・サービスから得る恩恵を広げることを楽しみにしています。」と語りました。

Google Cloudのプロダクト・マネージャーのChris Kleban氏もまた、まもなくGoogle Cloudのプラットフォーム上で、エヌビディアのTuring Tesla T4 GPUを支援することを心待ちにしているといいます。
CisocやDell EMC、富士通、HPE、IBM、Oracle、Supermicroといったサーバーメーカーらも、T4 GPUを搭載したサーバーをリリースする計画です。

GTC Japanでの話題は

東京カンファレンスでは、他にもエヌビディアによるいくつかの基調講演がありましたが、その多くは自動運転イニシアチブに関連するものでした。中でも、NTTグループが全社的人工知能イニシアチブである”corevo”に、TensorコアGPUを搭載したNvidiaのAIプラットフォームを利用する計画であることや、富士フィルムがAI研究向けのDGX-2システムを利用することは、今回のカンファレンスにおいて特筆すべきことです。

– Data Center Dynamics
原文はこちら