執筆者: Stephen Wu (Senior Program Manager, Big Data)
このポストは、5 月 18 日に投稿された Announcing Public Preview of HDInsight HBase on Azure Data Lake Store の翻訳です。
昨年 11 月 21 日、マイクロソフトは Azure Data Lake Store の一般提供開始を発表しました (英語)。Azure Data Lake Store はビッグ データ分析用ハイパースケール クラウド ストレージで、オープンな Hadoop ファイル システム (HDFS) の規格に準拠しています。Azure Data Lake Store では、SSL や格納時に既定で暗号化するなどといったエンタープライズ クラスのセキュリティ機能が提供され、ロール ベースのアクセス制御が可能です。
そして本日、Azure Data Lake Store で HDInsight HBase のパブリック プレビューが発表されました。この機能により、列指向 NoSQL 分散型データベースの機能を、高パフォーマンスで無制限にスケーリング可能な Azure Data Lake Store で使用できるようになります。Azure Data Lake Store には容量制限がないため、ストレージ システムの制限はまったく気にする必要がありません。また、1 つのストレージ アカウントですべてのデータの格納と分析を行うことができます。
Azure Data Lake Store での HDInsight HBase の主な使用例を紹介します。
- モノのインターネット (Internet of Things) – HBase には、センサーやデバイス、装置、機器、ソーシャル メディアなどから送信される膨大な数のリアルタイム イベントを格納できます。その後 HDInsight の Hadoop を使用して、Azure Data Lake Store に格納されたデータを一括分析できます。
- Web のログ – HBase を使用して、Web のログとクリックストリーム データの格納やインデックス化を行うことができます。その後、そのデータを HDInsight の Hadoop を使用して一括分析できます。
- ソーシャル センチメント – HBase を使用して、Twitter などのソーシャル メディア上で交わされる大量のセンチメント データを書き込み、格納することができます。
詳細については、以下のドキュメントや入門ガイドをご確認ください。
Azure Data Lake Store
HDInsight HBase