Alteryx Analytics Cloud Platformとは?

Alteryx Analytics Cloud Platformについてご説明します

 

「Alteryx Analytics Cloud Platform」は、米国のAlteryx社がこれまで提供していたオンプレミス製品である「セルフデータ分析プラットフォーム」製品を元に、Cloudに適合するように開発されたSaaS製品となっています。「Alteryx」は、データの加工から、空間分析、予測分析などまで含めた高度な分析、レポーティングの自動化などを使いやすいUI上でノーコードでできる製品となっていますが、これをCloudでできるようにした製品が「Alteryx Analytics Cloud Platform」です。

元々は、2022年にAlteryx社が買収したTrifacta社の製品をベースに開発されていますが、Trifactaが提供していたETLにとどまらず、オンプレミス製品が持っている機械学習、空間分析、レポーティングなどの機能もクラウド向けにリリースしています。

Alteyrx Analytics Cloud Platform全体像

Alteryx Analytics Cloud Platformの全体図、およびラインナップとしては以下のとおりです。

  • Alteryx Analytics Cloud Platform

プラットフォームそのもので、データへの接続、ユーザー管理、ワークフローのスケジューラ機能などを持ちます。

  • Designer Cloud(Designer Experience)

オンプレミス製品のDesigner DesktopのUIをWEBアプリとして構築したETLツール。

  • Designer Cloud(Trifacta Classic)

旧Trifacta社のETLツール。プラットフォーム自体は載せ変わっているようですが、そのままTrifactaのUIでETL機能が使えます。

  • Machine Learning

機械学習、時系列予測を行う製品。オートモデリングで自動的にモデルが作成できます。

  • Auto Insights

AI機能を使ったBIツール。過去にAlteryx社が買収したHyper Anna社の開発したBIツールがベースの製品。

  • Location Intelligence

空間分析を行う製品。地図上に空間オブジェクトを配置し、分析することが可能です。

  • Reporting

GUI上でドラッグ&ドロップベースでレポーティングを行う製品。プラットフォーム付属。

  • Plans

Analytics Cloudの各製品のワークフローをオーケストレーションして順次実行していく製品。ここで作成したオーケストレーションをスケジューラで動かすことも可能です。プラットフォーム付属。

  • Cloud Execution for Desktop

Designer DesktopのワークフローをAnalytics Cloud上で実行する製品。

  • App Builder

ノーコードでアプリを作る製品。

どのようなユーザーに向いているのか

Alteyrx Analytics Cloud Platformは、クラウドのデータからクラウドデータウェアハウス(DWH)へのデータパイプライン構築、DWH内データのETL処理によるBIツールへのデータ加工、機械学習、空間分析、AIによる強力なインサイト(Auto Insights)の生成が可能です。

また、Alteyrx Analytics Cloud Platformはクラウドベースの製品となるため、クラウドのデータソースを主に使われている方に向いており、現在はオンプレミスにデータを持っているという方も、クラウドへのデータ移行のためクラウドのデータウェアハウスなどの導入を考えていらっしゃる方にも最適となります。

 

基本的にAlteyrx Analytics Cloudは、使いやすいUIによるセルフサービス可能な製品という位置づけは変わりませんが、クラウドのSaaSになったため、これまでServerの運用を行ってきたようなユーザーにとっては、さらに管理が容易な製品となっています。

 

ビッグデータを取り扱うプラットフォームとして

Alteryx Analytics Cloud Platformは、ビッグデータを取り扱うプラットフォームとして、データ処理が工夫されています。ベースとなる基盤は、Trifacta時代と同じくSpark上に構築されています。

データがSnowflakeおよびDatabricksに存在する場合は、SnowflakeおよびDatabricksをエンジンとして動作するようになっています(PushDown)。このため、クラウドDWH内のデータを不要に動かさずDWH内で処理することで、スピード面、費用面、セキュリティ面で利点があります。

そのため、Alteryx Analytics Cloudでは、データの保存先としてSnowflakeやDatabricksなどのクラウドDWHとぜひ組み合わせて使いたいところです。

 

Alteyrx Analytics Cloud Platformを導入するにあたり

Alteyrx Analytics Cloud Platformのエディションについて

Analytics Cloud Platformにはいくつかのエディションがあります。

  • Professional
  • Enterprise

大きな違いは以下のとおりです。

  • 価格
  • 最低契約ユーザー数(Professional:3、Enterprise:7)
  • スケジュール実行できるワークフローの数(Professionalが3000、Enterpriseが15,000)
  • Enterprise版のみの機能
    • 外部からのAPIが利用可能
    • SDLC(Software Development Licecycle)サポート
    • ロールベースアクセスコントロール

 

デプロイ可能なクラウドは?

基本はAWSとなります。GCPの場合、現時点ではDataPrep(Trifacta)のみ利用可能です。

対応クラウドを現在増やしているところですので、現時点でどうなりそうかなど、ご連絡いただければお答えいたします。計画としては、Amazon AWS、Microsoft Azure、Google GCPの3大クラウドへの対応予定となっているようです。

 

オンプレデータからの移行方法

オンプレのデータベース等にデータをためている場合は、DWHへの一括ロードでクラウドに一気にデータをあげることができます。また、継続的にオンプレ側でデータが生成される場合は、クラウドのオブジェクトストレージ(AWS S3、Google GCS、Azure Blob Storage)などにCSVファイルなどでアップロードし、Designer Cloudでデータ加工などを行っていきます。

なお、Designer Cloudの場合、S3であれば直接読み込みが可能ですが、それ以外の場合はDWH側で一度ロードする必要があります(Snowflakeの場合は、AWS S3、Google GCS、Azure Blob Storageいずれも定期的にロードが可能です)。

 

Designer Desktopをご利用の方向け

Designer Desktopの機能はどれくらい移植されているのか?

Designer Desktopで分析を行う際に利用できるツールは300にも及ぶと言われていますが、Designer Cloud(Designer Experience)では28ツール相当(コメントとコンテナを含む)のツールでデータ加工を行っていきます。これにより、基本的なデータ加工(ETL)処理が可能となっています。

その他の大量のツールでできることは、それぞれ別プロダクトとしてMachine Learning、Location Intelligence、Reportingなどで実装されており、Designer Cloud(Designer Experience)は、ETL(データ加工)に特化した製品となっています。

 

Designer Cloud(Designer Experiece)の使い勝手はどうか?

ブラウザで動作するように作られたDesigner Cloudですが、Trifactaで培われた技術がそのままDesigner Cloudでも利用されており、データをサンプリングする独自の技術でブラウザ上で専用アプリと遜色なく動きます。

また、ブラウザ上での動作ということで、ローカルPCのスペックに依存せず軽快に利用することが可能なのは、Desktop版と比べると利点となります。

 

クラウドプラットフォーム上でのDesigner Desktopのワークフローの実行について

オンプレミス版のDesigner Desktopのワークフローをクラウド上でスケジュール実行するような機能があります。この機能はAnalytics CloudもしくはSnowflakeの機能として予定されています。

  • Cloud Execution for Desktop
  • Snowflake Execution for Desktop

前者は、Alteryx Analytics Cloud上の機能、後者はSnowflakeの機能となります。基本的には、クラウド上にVPCを立ち上げそこでAlteryxの処理Engineが稼働するイメージとなります。

いずれにしても、Alteryx ServerのGalleryの機能とは異なりますので、一部機能に制限がございます。詳細は、Alteryx社のブログ「Cloud Execution for Desktop 」を御覧ください。

 

旧Trifacta製品はどうなっているのか?

Trifacta自体はDesigner Cloudと名称変更になっていますが、一時期Designer DesktopのUIを取り入れた「Designer Experience」が出てくるまでは、Designer CloudというとTrifactaのことを指していました。現在では、「Designer Cloud(Trifacta Classic)」という名称になっています。

GCP上に展開されたTrifactaがあることをご存知の方もいらっしゃると思いますが、これはそのまま当時のTrifactaのまま「Dataprep by Trifacta」として現在も利用可能です。

また、Trifactaはプライベートクラウドへもデプロイ可能でしたが、旧製品はそのままの状態でお使いいただけているはずです。

Trifactaは、そのままETLとして十分な機能を持っており、Designer Experienceで持っていない機能をTrifacta Classicで持っていたりしますので、使い分けは自体は有効な手段です。

 

参考URL

 

Alteryxの導入はぜひKCMEで!

セルフサービスデータ分析ツール「Alteryx」は4週間無償トライアルが可能です。

製品に対する操作方法、技術的な質問などは導入前・導入後に関わらずメールにてお答えします。また、Alteryxを用いた環境構築、開発、ヘルプデスク対応、ハンズオン、トレーニング、ワークフロー作成なども承りますので、お気軽にご相談ください。

おすすめの記事