Microsoftがクラウドでのビッグ データと分析をより簡単に

Posted: 2016/03/30 カテゴリー: Uncategorized
タグ:, , , , , , , , , , , , , ,

今週、ビッグ データとデータ サイエンスのテクノロジとビジネスを探るために、数千人が参加しているサンノゼのStrata + Hadoop Worldに参加しています。我々は、このカンファレンスへの参加の一環として、ビッグ データ処理と分析をより単純でよりアクセス可能にするという我々のコミットメントを果たし続けるために、いくつかの重要な投資を発表します。

  • R Server for HDInsight (英語 / 日本語)Spark for HDInsight (英語 / 日本語) の最新バージョンによる大規模な高度な分析が、プレビューで利用可能になりました: お客様は既存のRのスキルを活用でき、大規模で実行するために現在のコードを再利用できます。R Server for HDInsightは、人気の高いスケーラブルなRアルゴリズム、既存のR関数を並列化する機能を提供します。また、ほとんどの分析に対するMapReduceで7倍のパフォーマンスを提供できる、Spark for HDInsightの最新バージョンもリリースします。これらの機能は、クラウドで以前可能だったのよりもずっと高速に、より巨大なデータセットに対する高度な分析とMLモデルを訓練、実行する機能を、お客様に提供します。
  • 人気の高いビッグ データ アプリへのより簡単にアクセスできる、すぐに使えるアプリケーション統合: お客様は、HDInsightで、コードやスクリプト作成の必要なしに、人気の高いビッグ データ アプリケーションを発見、デプロイできるようになりました。Datameer Cloudといった主要なソリューションは、コードなしのデータ準備を提供しています。AtScaleは、クラウド ベースのHadoop上のOLAP BIを提供しており、他のビッグ データ アプリケーションのエコシステムをHDInsightとともにデプロイできるようになりました。
  • 以前にパブリック プレビューとして発表していたAzure Data Catalogが、明日GA (一般提供) になります: Data Catalogは、エンタープライズ メタデータ カタログと、セルフサービスでのデータ ソースの発見のためのポータルです。ユーザーは、必要なデータの検索、理解、アクセスを試みる時間を減らし、価値を生み出すためにデータを分析する時間を増やせるようになりました。

R Server for Azure HDInsight

SQL Server 2016の一部としてR Servicesを組み込むことを発表し (英語 / 日本語)、Azure Data Lakeのパブリック プレビューのリリースを発表して以来、予測モデリング向けの最も人気の高いプログラミング言語であるRを、我々のクラウドのフル マネージドのビッグ データ サービスに持ち込むことへの、お客様の要望を耳にしてきました。100% オープンソースのR実装であるR Server for Azure HDInsightを発表できて、嬉しく思います。これは、HadoopとSparkを活用して、クラウドで最も包括的な一連のMLアルゴリズムと統計関数を実行します。我々は、これをHDInsight内で実行するワークロードとして利用可能にすることで、メモリと処理の制約を取り除き、ノートPCから巨大な複数ノードのHadoop/Sparkクラスターまで分析を拡張して、ユーザーがRの力を解き放つための障害を取り除きます。これによって、以前可能だったよりも巨大なデータセットに対してMLモデルを訓練、実行でき、より正確な予測が可能になります。また、これは、時間のかかる新規ハードウェアのインストール、設定、購買サイクルを取り除き、アイデアを本番環境に持ち込む時間を削減します。

さらなる情報については、R Server for Azure HDInsightのページ (英語 / 日本語) にアクセスしてください。

Spark for Azure HDInsightの最新バージョン

Sparkは、同じ共通の実行モデルで、メモリ内での大規模なデータ アプリケーション、バッチや対話型のクエリ、リアルタイム ストリーミング、機械学習、グラフ処理を処理する機能で知られている、最も人気の高いビッグ データ プロジェクトの1つです。Spark for Azure HDInsightが、最新のApache Spark 1.6にアップデートされ、(ストリーミングの状態管理10倍の高速化を含む) 重要なパフォーマンス改善、自動メモリ管理、新しい機械学習のアルゴリズムや機能を提供します。Spark for Azure HDInsightでは、フル マネージドのエンタープライズ対応のSparkソリューションと、さまざまなBIツールやJupyter (iPython) といった人気の高いノートブックでの説得力のある対話型のエクスペリエンスの選択肢で、お客様にさらなる価値を提供します。これによって、ビジネス アナリストやデータ サイエンティストがビッグ データに対する新たな知見を見つけるのがより簡単になります。

さらなる情報については、Spark for Azure HDInsightのページ (英語 / 日本語) にアクセスしてください。

人気の高いビッグ データ アプリへのより簡単なアクセス

また、本日、人気の高いビッグ データ アプリにより簡単にアクセスできる、すぐに使えるアプリケーション統合も発表します。これによって、お客様は、HDInsightでコードやスクリプト作成の必要なしに、人気の高いビッグ データ アプリケーションを発見、デプロイできます。このエコシステムの一環として次の2つのアプリケーションを紹介できて、嬉しく思います。コードなしのデータ準備を可能にするDatameer Cloudと、クラウド ベースのHadoop上のOLAP BIのAtScaleです。

Datameer Cloudは、あらゆるサイズ、種類、ソースのデータを統合、準備、分析、可視化、運用化するためのワンストップ ショップを提供する、フル マネージドのビッグ データ分析サービス プラットフォームです。Datameerのセルフサービス機能とエンドツーエンドのワークフローと、Microsoftの世界クラスのHadoopディストリビューションを組み合わせることで、Hadoopの知識やスキルの必要なしに、IT部門がコストの高い可能性のあるオンプレミスのHadoopインフラを実装する必要なしに、ビジネス アナリストがデータを分析して結果を生み出せるようになります。追加のハードウェア、技術スタッフや管理者のコストが必要なく、TCOを劇的に削減します。

加えて、Azure Marketplaceで、HDInsightとのすぐに使える統合を備えたAtScaleが利用可能になったことを発表します。AtScaleでは、HDInsightのデータに対してOLAPキューブを作成できます。これは、IT部門がHadoopプラットフォームの制御、セキュリティ、応答性を維持しつつ、ビジネス アナリストが好みのBIツールで知見を得る機能を提供します。

Azure Data CatalogのGA (一般提供)

Azure Data Catalogをパブリック プレビューとして発表して以来、お客様の強力な取り組みを目にしてきました。Azure Data Catalogが明日の3/30からGA (一般提供) サービス になることを発表できて、興奮しています。Data Catalogは、セルフサービスでのデータ ソースの発見を可能にする、エンタープライズ メタデータ カタログです。これによって、あらゆるコンシューマー (ビジネス アナリスト、データサイエンティスト、データ開発者) が、データ ソースを登録、強化、発見、理解、利用できます。クラウドソーシングでの注釈によって、データに詳しいユーザーが、いつでもメタデータを強化できます。これは、IT部門とデータ コンシューマーとの間の隔たりを埋め、IT部門が制御と監督を維持しつつ、コミュニティがビジネス知識を共有することを促します。

本日の発表は、ビッグ データと分析の世界での継続的な革新への我々のコミットメントを明確に示しています。我々は、今週のStrata + Hadoop Worldで、これらの開発についてさらに共有する予定です。また、Microsoftは、今週、開発者向けの主要イベントであるBuildを開催します。注目していてください。

関連情報

コメント
  1. […] Microsoftがクラウドでのビッグ データと分析をより簡単に […]

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中