Microsoftが、ディープ ラーニングの進展に向けてMicrosoft Cognitive Toolkitのベータをリリース

Posted: 2016/10/27 カテゴリー: Uncategorized
タグ:, , , , ,

image
Frank Seide (左) と Chris Basoglu (右) が、Microsoft Cognitive Toolkitを構築する鍵でした (写真撮影: Scott Eklund/Red Box Pictures)。

Microsoftが、Microsoft Cognitive Toolkitのアップデート バージョンをリリースしました。Microsoft Cognitive Toolkitは、音声認識、画像認識、検索関連性といった領域の進展を加速させる、CPUやNVIDIA GPUの上で動作するディープ ラーニング (深層学習) のためのシステムです。

以前はCNTK (Computational Network Toolkit) として知られていたこのツールキットは、当初は、自分の研究をより迅速かつ効率的に行うためのツールを必要としていたMicrosoftのコンピュータ科学者達によって開発されました。このツールキットは、すぐに音声認識を超えて、国際的なトップの電機メーカーやMicrosoftの旗艦製品グループといったユーザーが幅広いディープ ラーニングのタスクで依存する機能になりました。

Microsoft AI and Researchの主席研究員であり、Microsoft Cognitive Toolkitの主要なアーキテクトであるFrank Seideは、次のように述べています。「我々は、このツールキットを、研究ツールから運用環境で動作するものに変えました。」

image
Frank Seide (写真撮影: Scott Eklund/Red Box Pictures)

オープン ソース ライセンスでGitHubから入手可能なこのツールキットの最新バージョンには、開発者がこのツールキットで作業する際にPythonやC++のプログラミング言語を使えるようにする新機能が含まれています。また、この新バージョンでは、研究者が強化学習と呼ばれる種類のAI (人工知能) 作業を行えるようにしています。

最後に、このツールキットは、旧バージョンよりも優れたパフォーマンスを提供できます。また、このツールキットは、特に複数マシンにわたって巨大なデータセットを扱う際に、他のツールキットよりも高速です。この種の大規模なデプロイは、(消費者製品や専門的な機能を開発するために必要となる) 複数のGPUにわたるディープ ラーニングを行うために必要です。

また、このツールキットは、研究のブレークスルーを加速させる鍵でもあります。先週、Microsoft AI and Researchは、初めて、人間がするのと同様に会話内の単語を認識するテクノロジを開発したことを発表しました。このチームは、このマイルストーンに到達するまで時間を大幅に改善できたことが、Microsoft Cognitive Toolkitのおかげだと考えています。

Microsoft Cognitive Toolkitを開発したチームは、複数のサーバーにわかって動作できる能力が、(より巨大なデータセットを扱い始めると、パフォーマンスと精度が最適ではなくなることがある) 他のディープ ラーニング ツールキットに対する主な優位性だと言っています。Microsoft Cognitive Toolkitは、こういった計算処理のパフォーマンス低下を最小化するための、組み込みのアルゴリズムを持っています。

このツールキットの開発で主要な役割を果たした、Microsoftのパートナー エンジニアリング マネージャーであるChris Basogluは、次のように述べています。「Microsoft Cognitive Toolkitを使う主な理由の1つは、大規模なデータセットに対して、複数のGPUや複数のマシンにわたって効率的にスケールできる能力です。」

image
Chris Basoglu (写真撮影: Scott Eklund/Red Box Pictures)

Microsoft Cognitive Toolkitは、1台のノートPC、あるいは、データセンター内の一連のコンピューターを使って、比較的小規模なデータセットから非常に巨大なデータセットまでのすべてを簡単に処理できます。このツールキットは、従来型のCPUGPUを使うコンピューター上で動作できますが、ディープ ラーニングに必要となるアルゴリズムを実行するのに極めて効率的であることが証明されています。

NVIDIAのAccelerated Computing Groupのジェネラル マネージャーであるIan Buckは、次のように述べています。「Microsoft Cognitive Toolkitは、ディープ ラーニング コミュニティに進展をもたらすための、MicrosoftとNVIDIAとの間の緊密な協力を象徴しています。旧バージョンと比べて、NVIDIA DGX-1の8個のPascal GPUにまでスケールする際に、パフォーマンスがほぼ2倍に向上しています。」

Microsoft Cognitive Toolkitは、(現在プレビュー中のAzureのGPU機能を含む) 複数のGPU上で動作するように設計されています。このツールキットは、NVIDIAのハードウェアとAzureのネットワーキング機能を最高に活用するように、最適化されています。

AIの民主化とそのツール

小規模なスタートアップから主要なテクノロジ企業までの誰もが、音声理解画像認識といったことに対してディープ ラーニングを使うことの可能性があると考えている時に、このツールキットはリリースされようとしてます。

大まかに言うと、ディープ ラーニングとは、開発者や研究者が、画像や音声といった入力からパターンを認識するようにコンピューター システムに教えるために、(トレーニング セットと呼ばれる) 大量のデータを使う、AI (人工知能) のテクニックです。

たとえば、ディープ ラーニング システムに、あらゆる種類の果物と野菜の画像のトレーニング セットを与えることができます。このシステムは、このトレーニング セットを使って、果物と野菜の画像を認識するために自分で学習します。このシステムは、さらなるデータを取得するにつれて、より良くなります。このシステムは、新しい見た目が奇妙なナスや変わった形のリンゴに出会うたびに、アルゴリズムを改善し、さらに正確になります。

image
音声音響モデルのトレーニングのためにMicrosoft Cognitive Toolkitを使っているこの例では、さらなるデータをモデルに適用するにつれて、より優れた精度に収斂しています。

この種の成果は、研究のマイルストーンだけではありません。(ある程度、計算能力の大幅な向上によって加速された) ディープ ラーニングの進展のおかげで、我々は、(音声を認識し、リアルタイム通訳を提供する) Skype Translator、(あなたの声を理解し、飛行機のチケットを検索することから約束を思い出させることまで、あなたが行うすべてのことを助ける) Cortanaデジタル アシスタントといった消費者製品を持つようになりました。

MicrosoftのDistinguished EngineerであるXuedong Huangは、次のように述べています。「これは、Microsoft Cognitive Toolkitを使ったAIの民主化の一例です。」

より高度な作業のための、さらなる柔軟性

チームがこのツールキットを最初に開発した時、多くの開発者は多くのコードを書きたくないだろうと考えたと、Basogluは述べています。そこで、チームは、開発者が、追加のコーディングなしに自分のディープ ラーニング システムを構成するのを簡単にする、カスタム システムを作成しました。

しかし、このツールキットがさらに普及するにつれて、チームは、自分のPythonやC++のコードをこのツールキットのディープ ラーニング機能と組み合わせたい開発者からの声を聞きました。

また、チームは、強化学習の研究を可能にするために、このツールキットを使いたい研究者からの声も聞きました。これは、エージェントが、多数の試行錯誤を通して (部屋の中で道を探す、文を作る、といった) 何かを行う正しいやり方を学習する研究領域です。これは、システムが自分で複雑な決定を行うことができる、最終的には真のAI (人工知能) につながる研究です。このツールキットの新バージョンは、開発者にこの機能も提供します。

食品の無駄を防ぎ、より健康的な生活を送るための、Microsoft Cognitive Toolkitの利用

Microsoft Cognitive Toolkitは、最初は音声の研究者によって開発されたものではありますが、現在はより幅広い多様な目的で使われるようになりました。

冷却の専門家であるLiebherr (リープヘル) は、日常生活を簡素化するために、このツールキットを使っています。

この企業は、冷蔵庫にカメラを設置しており、単に画像を表示する以上のことをしています。冷蔵庫内の個別の食料品を認識し、その情報を自動的に在庫買い物リストに取り込みます。

将来は、このテクノロジが買い物や食事計画を助ける予定です。カメラと物体認識を使うことで、格納されている食料品の記録と監視を行うことができます。

Liebherrのeビジネス マネージャーであるAndreas Giesaは、次のように述べています。「人々は、いつでもどこからでも、何が冷蔵庫の中にまだあって、何を買い物リストに載せるべきか、分かります。」

これは、顧客が食料品を腐らせることを防ぎ、日常生活をより快適にするのを助けます。

Bing relevance (関連性) チームは、ユーザーにより良い結果を提供するために、検索語における潜在的な、つまり隠されたつながりを発見するためのより良い方法を見つける取り組みの一環として、このツールキットを使っています。

たとえば、ユーザーが「アップル パイをどう作るか?」と入力した時に、「レシピ」という語が検索クエリの中に現れていなくても、そのユーザーがレシピを探していることを自動的に理解するために、ディープ ラーニングを使ってシステムをトレーニングすることができます。このようなシステムがないと、この種のルールを手動で開発する必要があるでしょう。

Bing relevanceに取り組んでいる主席ソフトウェア開発エンジニアであるClemens Marschnerは、音声を超えて他の種類のディープ ラーニングを行っている開発者に対してもうまく機能するようにするために、Bing relevanceチームがこのツールキットの作者と非常に緊密に協力した、と述べています。このチームにとっての報酬は、このチームが迅速に結果を得るために大量の計算能力を使えるようにするシステムでした。

Marschnerは、次のように述べています。「ここまで簡単にGPUクラスターで大規模データセットにまで学習をスケールできるソリューションは、他にありません。」

また、Microsoftは、音声認識を改善するために、Microsoft Cognitive Toolkitを使い続けています。音声サービスの主席応用科学マネージャーであるYifan Gongは、WindowsやSkype Translatorを含むMicrosoft製品で、より正確な音声認識の音響モデルを開発するために、このツールキットを使っている、と述べています。

Gongは、彼のチームは、顧客により正確な結果を提供するため、LSTM (Long Short-Term Memory) と呼ばれるテクニックを含む新しいディープ ラーニング アーキテクチャを開発するために、このツールキットを頼りにしている、と述べています。

この改善は、ユーザーが (パーティー、運転中、開放的なオフィスといった) うるさい環境で音声コマンドを与えたりCortanaとやり取りしたりする時でも、ユーザーが言おうとしていることをMicrosoftのシステムがより良く理解するのを、より簡単にするでしょう。

ユーザーにとって、この種の改善の利点は明らかです。

Gongは、次のように述べています。「認識精度がより高ければ、同じことを何度も言う必要はありません。」

関連情報

コメント
  1. […] Microsoftが、ディープ ラーニングの進展に向けてMicrosoft Cognitive Toolkitのベー… […]

  2. […] Microsoftが、ディープ ラーニングの進展に向けてMicrosoft Cognitive Toolkitのベー… 2016/10/27 […]

  3. […] MicrosoftのAIスーパーコンピューターとMicrosoft Cognitive Toolkitのスケールとパワーを活用することで、Microsoft Translatorチームは10言語を同時にリリースすることができました。徐々に、追加の言語をサポートする予定です。 […]

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中