IT記者会Report

オリジナルな記事や送られてきたニュースリリース、セミナーのプレゼン資料など

AWS、モダンなデータ分析をエンドツーエンドで支援する3つのサーバーレス分析サービス群を一般提供開始

  • Amazon EMR Serverless、 Amazon MSK Serverlessに加え、 Amazon Redshift Serverlessの新しいサーバーレスオプションにより、 お客様は基盤となるインフラの設定、 拡張・管理をせずに膨大なデータ量の分析が可能に
  • この新たなサーバーレス分析オプションをInformatica、 NextGen Healthcare、 Huronを含むお客様およびパートナーが採用


Amazon.com, Inc.の関連会社であるAmazon Web Services, Inc.(AWS)は本日、 基盤となるインフラストラクチャの設定や拡張・管理をすることなく、 お客様が膨大なデータをより簡単に分析できる新しいサーバーレス(※)分析サービス群を提供開始することを発表しました。 新たに提供を開始するサーバーレス分析サービスは、 基盤となるインフラを管理することなく、 オープンソースビッグデータフレームワークApache SparkおよびApache Hive)を活用した分析アプリケーションを実行できるようにするAmazon EMR、 リアルタイムデータの取り込みとストリーミングを簡素化するAmazon Managed Streaming for Apache Kafka(AmazonMSK)、 そして今回新たにクラスタを管理することなくペタバイト規模のデータに対する高速なデータウェアハウスおよび分析ワークロードを可能にするAmazon Redshiftが加わり、 3つとなります。 これらは、 ビジネスインテリジェンスサービスであるAmazon QuickSightやデータ統合サービスのAWS Glueなど、 AWSが提供するさまざまなサーバーレス分析サービスとともに、 お客様がキャパシティプランニングを気にしたり、 ピーク需要に対して過剰なプロビジョニングを行うことによって超過コストを発生させることなく、 より簡単かつコスト効果の高い方法でインフラストラクチャの最適化と膨大なデータ分析を行えるよう支援します。 Amazon EMR Serverless、 Amazon MSK Serveless、 Amazon Redshift Servelessの利用には、 先行投資や追加費用は不要で、 お客様は分析ワークロードに必要な容量に対してのみ料金を支払うことになります。

※抄訳版の注釈:「サーバーレス」とは:サーバーを管理することなく、 コードの実行、 データの管理、 アプリケーションの統合を行うための技術。 サーバーレス技術には、 オートスケーリング、 ビルトインの高可用性、 使用量に応じた課金モデルなどの特徴があり、 俊敏性の向上とコストの最適化を実現します。
参考サイト: https://aws.amazon.com/jp/serverless/

AWS データベース 兼 アナリティクス  兼 機械学習 バイスプレジデント スワミ・シヴァスブラマニアン(Swami Sivasubramanian)は、 次のように述べています。
AWSは、 データウェアハウス、 ビッグデータ処理、 リアルタイムデータ分析、 データ統合、 インタラクティブダッシュボードと可視化など、 さまざまなオプションをはじめとした、 クラウド上で最も豊富なデータ分析のためのサーバーレスオプションを提供することで、 お客様がデータの価値を最大化し、 イノベーションの推進や顧客体験の向上、 そして迅速により良い意思決定を容易に行えるよう支援します。
本日発表した新しいサーバーレスのオプションにより、 お客様は、 プロビジョニングや容量の拡張を気にすることなく、 また過剰なコストをかけることなく、 最も変動的で断続的な分析ワークロードも実行可能となるため、 組織全体におけるデータ分析活用を加速させることができます。 」

AWSのお客様は、 膨大な非構造化データを処理するためのAmazon EMR(Apache SparkやApache Hiveなどオープンソースビッグデータフレームワークを使用)、 リアルタイムのデータストリームを取り込むためのAmazon MSK、 データウェアハウス用のAmazon Redshiftなど、 組織が保有するデータから最大の価値を引き出すために、 さまざまな利用目的に応じた分析サービスから選択することが可能です。 多くのお客様は、 これらのサービスが提供するきめ細かいコントロールを高く評価していますが、 非常に変動的な、 または断続的なワークロードを持つ一部のお客様は、 アプリケーションのニーズに基づいてリソースを自動的に追加または削減することで、 AWSが基礎となるインフラストラクチャを管理することを求めています。 インフラの拡張と管理の複雑さを取り除くために、 AWSは2014年にサーバーレス、 いわゆるイベン駆動型コンピューティングの概念を導入しました。 以来、 多くのお客様が、 リアルタイムデータストリーミングのAmazon Kinesis Data Streams、 データ統合のAWS Glue、 インタラクティブダッシュボードや可視化のAmazon QuickSightなどのサーバーレス技術をAWSに採用し、 自動プロビジョニング、 オンデマンドスケーリング、 利用量に応じた従量課金などの利点を活用しています。 Amazon EMR、 Amazon MSK、 Amazon Redshift向けの新しいサーバーレスサービスにより、 AWSクラウド上で最も幅広いサーバーレスの分析ケイパビリティを提供し、 お客様のコスト削減とより多くのユーザーに分析を拡大し、 データの価値を最大化することを容易にします。
 

  • Amazon EMR Serverlessによるサーバーレス・ビッグデータ分析 :何万人ものお客様がAmazon EMRを使用して、 Apache SparkやApache Hiveなどのオープンソースフレームワークを実行し、 大規模な分散データ処理ジョブ、 インタラクティブSQLクエリ、 機械学習アプリケーションを実行しています。 Amazon EMRは、 クラウド上で最も多くのビッグデータフレームワークをサポートしており、 お客様はオンプレミスソリューションの半分以下のコストで、 ビッグデータアプリケーションやペタバイト規模のデータ分析をより迅速に実行することができます。 Amazon EMR Serverlessでは、 お客様は実行したいフレームワークを指定するだけで、 ワークロードの需要の変化に応じて、 必要なコンピュートおよびメモリリソースを自動的にプロビジョニング、 管理、 拡張することができます。 お客様は、 オープンソースフレームワークを選択し、 Amazon EMRアプリケーションプログラミングインターフェース(API)、 AWSコマンドラインインターフェース(AWS CLI)、 またはAmazon EMR Studioの統合開発環境IDE)を使用してジョブを送信するだけで、 Amazon EMR Serverlessを開始することが可能です。 Amazon EMR Serverlessは、 米国東部(ノースバージニア州)、 米国西部(オレゴン州)、 アジア太平洋(東京)、 ヨーロッパ(アイルランド)でAmazon EMRを実行しているお客様に対して本日より一般提供が開始され、 その他のAWSリージョンでも近日提供予定です。 Amazon EMR Serverlessの利用開始については、   https://aws.amazon.com/jp/emr/serverless/ をご覧ください。
  • Amazon MSK Serverlessによるサーバーレスデータストリーミング :昨今、 モノのインターネット(IoT)デバイス、 ウェブサイトのクリックストリーム、 データベースログなど、 動的なデータが継続的に生成される多くのソースからリアルタイムのデータストリームを取得・分析するために、 Apache Kafkaを採用する企業が増えています。 この新しいサーバーレスオプションにより、 Amazon MSK Serverlessがクラスタのプロビジョニング、 管理、 スケーリングを自動的に行うため、 お客様はキャパシティプランニングや予測不可能なストリーミングワークロードを気にする必要がなくなります。 Amazon MSK Serverlessは、 Amazon MSKコンソールでクラスターを作成し、 プライベートで安全なApache Kafkaエンドポイントを設定、 そして新規または既存のApache Kafkaクライアントを使用してデータのストリーミングを行うだけで利用することができます。 Amazon MSK Serverlessは、 米国東部(オハイオ州)、 米国東部(ノースバージニア州)、 米国西部(オレゴン州)、 アジア太平洋(シンガポール)、 アジア太平洋(シドニー)、 アジア太平洋(東京)、 欧州(フランクフルト)、 欧州(アイルランド)、 欧州(ストックホルム)でAmazon MSKを実行しているお客様に対して本日より一般提供が開始され、 その他のAWSリージョンでも近日提供予定です。 Amazon MSK Serverlessの利用開始については、 https://aws.amazon.com/msk/features/msk-serverless をご覧ください。
  • Amazon Redshift Serverlessによるサーバーレスデータウェアハウス :数万社のお客様が、 Amazon Redshiftで毎日2エクサバイト以上のデータをまとめて処理しています。 Amazon Redshiftは、 他のエンタープライズ向けクラウドデータウェアハウスと比較して最大3倍の価格性能比を実現しており、 お客様に低コストで高速なデータ分析を提供することができます。 Amazon Redshift Serverlessは、 データウェアハウスのインフラを管理する必要がなく、 データからインサイトをスピーディーに取得することをより一層容易にしています。 現在、 Amazon Redshiftクラスターを独自に管理しているお客様は、 アプリケーションに変更を加えることなく、 Amazon RedshiftコンソールまたはAPIを使用して、 新しいサーバーレスオプションへの移行を選択することができます。 Amazon Redshift Serverlessは、 米国東部(オハイオ州)、 米国東部(ノースバージニア州)、 米国西部(オレゴン州)、 アジア太平洋(シンガポール)、 アジア太平洋(シドニー)、 アジア太平洋(ソウル)、 アジア太平洋(東京)、 欧州(フランクフルト)、 欧州(アイルランド)、 欧州(ロンドン)および欧州(ストックホルム)でAmazon Redshiftを実行しているお客様に対して本日より一般提供が開始され、 その他のAWSリージョンでも近日提供予定となっています。 Amazon Redshift Serverlessの利用開始については、 https://aws.amazon.com/redshift/redshift-serverless をご覧ください。


Amobeeは、 テレビ、 コネクテッドTV、 デジタルメディアのすべてで視聴者を統合して成果を最適化し、 顧客の成長を促進する広告ソリューションを提供しています。 Amobeeのエンジニアリング・シニア・マネージャーであるデイビッド・オルティス(David Ortiz)氏は、 次のように述べています。
Amazon EMR は、 ワークロード要件に応じてリソースを自動的に増減できる柔軟性が魅力である一方、 頻度は低いものの負荷の高いジョブが既存のクラスターを混乱させ、 これらのジョブのためにクラスターを追加作成・管理する必要がありました。 Amazon EMR Serverlessは、 追加プロセスのオーバーヘッドなしに、 ジョブが必要とするCPUとメモリリソースを適切なサイズに調整することを可能にします。 さらに、 必要なときに必要な容量を提供することで、 ワークフローの効率化とコスト削減も実現します。 」

Apache Kylinを搭載したKyligence Cloudは、 企業のビッグデータに関するビジネスインテリジェンスと分析を促進しています。 Kyligence Cloud 共同創業者 兼 CEOのルーク・ハン(Luke Han)氏は、 次のように述べています。
「お客様が膨大な量のデータからビジネス上の重要な意思決定を行えるようにするために、 当社のプラットフォームではSparkジョブを使って大量のデータを読み込み、 処理しています。 これを大規模に行うにはコストがかかり、 運用上のオーバーヘッドが必要になります。 私たちはAmazon EMR Serverlessを採用することで、 クラスタの維持とチューニングにかかるコストと管理作業を削減することができました。 Amazon EMR Serverlessは、 ワークロード需要の変化に応じてクラスタの管理、 チューニング、 パフォーマンスの最適化といった時間のかかる作業を代行し、 複雑さを軽減します。 また、 以前のソリューションよりも低コストで利用できるため、 コスト削減分を顧客に還元することができます。 」

Glas Dataは、 農業分野でのデータ管理を簡素化しています。 Glas Data CTO 兼 創業者の ロバート・サンダース(Robert Sanders)氏は、 次のように述べています。
「私たちは、 Amazon MSKを利用してリアルタイムによるデータの取り込み、 処理、 分析、 そしてアラートの自動化をお客様に提供しています。 私たちのワークロードは非常に変動的で、 予測不可能です。 あるアクションでは、 少量の容量を必要とする少数のメッセージしか生成されず、 別のアクションでは、 はるかに多くの容量を必要とする多数のメッセージが生成されます。 このワークロードの変動性により、 どのアクションがどのタイミングで実行されるかを予測することが難しく、 予期せぬ容量の制約を避けるために、 常に容量を監視して調整する必要がありました。 Amazon MSK Serverlessは、 ワークロード要件に基づいて自動的に容量を増減するため、 システム管理のオーバーヘッドがなくなり、 メモリやストレージの制約を気にすることなく、 また過剰なコストをかけることなく、 自由にソリューション開発を行えるようになりました。 」

NextGen Healthcareは、 医療従事者とその患者の生活を向上させることを使命として、 革新的な医療技術ソリューションを提供するリーディングカンパニーです。 NextGen Healthcare アプリケーションデリバリー担当 兼 副社長 オーウェン・ザッカリアス(Owen Zacharias)氏は、 次のように述べています。
「当社のNextGen Population Healthソリューションは、 さまざまなデータソースから取得したデータを集約・変換することにより、 実用的なインサイトを直接ケアチームに提供してます。 データウェアハウスインフラの設定や管理といった手作業を減らすためにシステムを最適化することは、 私たちの成功にとって非常に重要です。 Amazon Redshift Serverlessを使用することで、 複雑なデータウェアハウス統合システムの管理が不要になりました。 Amazon Redshift Serverlessはワークロードのパフォーマンスを向上させ、 その自動スケーリング機能により、 使用した分だけ支払いながら、 最もダイナミックなワークロードにもAmazon Redshiftの俊敏性を活用できます。 さらに私たちは、 追加のワークロードをAmazon Redshift Serverlessに移行することに期待しています。 これこそまさに、 ゲームチェンジャーとなるサービスです。 」

インフォマティカは、 データの接続、 管理、 統合、 管理を行うエンドツーエンドのクラウドデータ管理プラットフォームを提供し、 企業のデータ戦略のモダナイゼーションと推進を支援しています。 インフォマティカエコシステムズ担当上級副社長であるリック・タム-ダニエルズ((Rik Tamm-Daniels)氏は、 次のように述べています。
「今日の組織は、 データとアナリティクスの拡大を模索していますが、 データサイロ、 コスト制約、 インフラ管理などの課題に直面しています。 Amazon Redshift Serverlessは、 ニーズに応じてリソースを自動的にプロビジョニングおよびスケーリングすることで、 これらの課題に対応し、 データウェアハウスインフラのセットアップや管理の必要性、 ピーク需要に合わせた過剰プロビジョニングによる過剰コストの心配なく、 簡単に分析を実行できるようにします。 AWS上のインテリジェントデータ管理クラウドとともに、 Amazon Redshift Serverlessは、 インフォマティカのお客様に、 ビジネスに不可欠な取り組みを強化するサーバーレスデータおよび分析基盤を提供する上で役立っています。 」

Rail Delivery Group(RDG)は、 英国の鉄道を運営する企業を1つのチームにまとめ、 より良い鉄道体験を提供することを目的としています。 Rail Delivery Group データ&アナリティクス責任者 トビー・エアー(Toby Ayre)氏は、 次のように述べています。
Amazon Redshift Serverlessは、 私たちのチームに高いパフォーマンスを提供し、 基盤となるデータウェアハウスを自動的に規定・管理するため、 より多くのビジネスユーザーが迅速かつ容易にデータからインサイトを得ることができます。 Amazon Redshift Serverlessは、 データウェアハウスの容量を自動的に拡張し、 当社の最も要求が高く予測不可能なワークロードにも対応できるため、 コストの削減と組織全体での分析の活用拡大を支援するものです。 」 

Huronは、 顧客と協業して、 健全な戦略の策定、 オペレーションの最適化、 デジタル変革の加速、 企業とその従業員が自らの未来を切り開くための能力強化を実現するグローバルなプロフェッショナルサービス企業です。 Huron データエンジニアのハリー・ゴラコタ(Harry Gollakota)氏は、 次のように述べています。
「私たちは、 Amazon Redshift Serverlessをデータ分析ワークフロー追加機能に加えることができ、 大変嬉しく思っています。 このサービスは、 私たちの以前のインフラのいくつかの部分をシームレスに置き換え、 そのシンプルさによって非常に使いやすくなっています。 Amazon Redshift Serverlessは、 データエンジニアリングのレイテンシーを劇的に削減し、 開発を加速させる力強い味方となっています。 Amazon Redshift Serverlessを導入することで、 データエンジニアリングのバックログを削減し、 今ではデータからインサイトを収集することに多くの時間を割くことができています。 」