Alteryxとはどのようなツールなのか、概要についてご紹介します
こんなことで困っていませんか?
Alteryxは以下のようなことに困っている方にオススメです。
- Excel、Accessのマクロで苦労されている方(属人化等)
- GISツールの自動化を行いたい方(スクリプトを書くより圧倒的に楽で処理速度も早いです)
- 同じフォーマットのデータ分析レポートを頻繁に書かれている方
- BIツールを使っている方
- ビッグデータなど大量のデータの分析で困っている方
おすすめする方
Alteryxは「データを取り扱う方」全般にオススメできます。
また、特に以下記載している方が導入することで大幅な効率化に繋がります。
- データサイエンティスト
- アナリスト
- リサーチャー
- ファイナンス
データ分析とは
それでは改めて、データ分析を行うためにはどのような手順を踏むのか、いわゆる分析プロセスについてまず考えてみたいと思います。
まずは分析するデータが必要です。データを取得する際、データベースに格納されていればSQLなどの知識が必要です。さらに複数のデータにまたがるようであれば、データの結合なども必要になってしまいます。この領域ではITの専門家の知識が必要であったりします。
さらに分析を進めていくと、地図にプロットしたりなど地理的な分析を行うこともあるかもしれません。そうなってくると、GISの知識が必要になってきます。GISツールは使い慣れないとなかなかわかりにくく、更にはSQLの知識が必要であったりします。この領域ではGISのスペシャリストの力を借りる必要があったりします。
一通り分析ができた後、今度は予測モデルを作って予測分析を行いたいとすれば、ここではPythonやRなどの言語の知識やそもそも機械学習モデルの知識なども必要になってきます。この領域ではデータサイエンティストの力が必要になります。
さらに作った予測モデルを展開して社内のWEB上で誰でも使えるように、ということになると再びITの専門家の知識が必要になります。
また、得られた分析結果=インサイト(洞察)を社内で可視化しようとすると、いわゆるBIツール(ビジネス・インテリジェンス)で共有、ということになるかと思います。
このように、データ分析を深く進めていくと各領域の専門家の力が必要になってきます。
Alteryx(アルタリクス・アルテリックス)とは?
データ分析を行うためには様々な要素が必要になりますが、Alteryxはデータ分析作業の課題を解決するためのソフトウェアであり、データ分析作業を圧倒的に効率化し、企業内のデータ活用を促進させるプラットフォームです。また、オンプレミス版、クラウド(SaaS)版の両方がリリースされています。
オンプレミス版
Alteryx製品の中で一番基本となる「Alteryx Designer」は一般的には「セルフサービスデータ分析ツール」といわれています。データ分析を行うために必要なものが全て入っており、ユーザーインターフェースもわかりやすく簡単なので専門家の力を借りなくても自分自身でデータ分析ができます。
おおまかにできることを3つ挙げますと、
- 「データブレンド(ETLツール)」
- 「地図・空間分析(GIS)」
- 「予測分析(機械学習モデル利用)」
となります。
これにサーバー製品(Alteryx Server)などを加えていくと、処理の自動化、データのカタログ化(Alteryx Connect)、機械学習モデルの展開と管理(Alteryx Promote)なども行うことができます。
※ETL:Extract-Transform-Load(抽出-変換-ロードの略:データを抽出、変換しDBなどに保存していくこと)
いずれもAWSやGCP、AzureなどのPublicクラウドにデプロイすることも可能です。
クラウド版
クラウド版は、Alteryx Analytics Cloudという名称で展開されているクラウドプラットフォームサービス(SaaS)となります。
基本となるのは、Designer Cloudで、Designer(オンプレミス)のクラウド版となりますが、大きな特徴はSnowflakeと組み合わせることで、Snowflake側ですべてのETL処理を行うことができることです(いわゆるIn-DB処理が可能)。
全体としては以下のように製品展開されています。
- Designer Cloud
ETL処理に特化した製品で、Designer Experienceと呼ばれるDesigner Desktopのクラウド版と、旧製品のTrifacta Classicが利用可能です。
- Auto Insights
いわゆる「BI」ツールです。
- Machine Learning
機械学習機能を提供。
- Location Intelligence
空間分析機能を提供。
その他、レポート機能やオートメーション機能なども提供されています。
以降は、オンプレミス版の説明を中心に行います。
Alteryx Designerの使い方
Alteryx Designerの使い方は、各機能アイコンをドラッグ&ドロップでキャンバスに追加していき、ワークフローを作成していく、というものになっています。
データの流れは、アイコン同士を線で接続していくことで表現し、各アイコンの機能についてはプロパティを設定することで決めていきます。また、ワークフローを実行後は、各アイコンの出口をクリックすると、そのアイコンを流れるデータがどのようなものであったかを結果ウィンドウに表示することが可能です。一般的なプログラミング言語での開発に比べると非常にデバッグは行いやすいです。
Alteryxが持っているツール(機能)は300個程度あり、そのツールを組み合わせることでデータの処理を実現していく形になります。そのため、各ツールの機能を把握することがAlteryxの使い方をマスターする上で非常に重要です。
各ツールカテゴリを解説しているページがございますので、そちらを御覧ください。
実際何ができるのか?
概念としてはこれまでご説明した内容になりますが、具体的に何ができるのかというところで「もやっ」してしまうかと思います。ここまでの説明を聞く限りは、「単なるETL?」「GISソフトができる処理もできるよね」「機械学習が使えるんだ・・・」となるかと思いますが、実際「Alteryxで何ができますか?」と聞かれると、正直なところ「なんでもできます」と答えます。
よく言われるのが、「なんでもできるだと何もわからない」と言われることが多いので、若干具体的に記載していきたいと思います。
Alteryxでの処理例
- データの結合、加工、集計などの表計算ソフトやSQLなどで行うデータ処理
- データウェアハウスの構築(ETLツール)
- 空間結合、空間検索、ポリゴンの加工などのGIS処理
- WEBのAPI(RestAPI等)を使ったデータ取得等(Google MAPs APIを使ったジオコーディング等)
- Rベースの予測モデル(機械学習モデル)を使った予測分析
- WEBスクレイピング(WEBからの情報の取得)
処理例を列挙していてもとりとめないと感じてしまうのですが、実際のところは、「プログラミング言語をアイコンベースにしたもの」と考えて頂くと近いかと思います。プログラミング言語を使ってプログラムを書けばなんでもできるとは思いますが、ニュアンス的にはそれに近いです。
その他特徴
繰り返し利用可能なワークフロー
データ処理をワークフローという形で作成すれば、ワークフローのインプットデータを新しいものに変えるだけですぐに同じ処理ができます。つまり、今月行った処理と同じ内容の処理を、来月はボタン一つで手間なくできるようになります。
豊富なデータソース
Alteryxは非常に多くのデータソースに接続することができます。ExcelやAccess(mdb)、CSVなどのメジャーなローカルファイルから、OracleやMicrosoft SQLServer、MySQLなどメジャーなデータベースは当たり前、ビッグデータ系のデータベースなどへの接続も可能です。また、GIS機能が使えることもあり、地図ファイル(SHP、TAB)なども読み込みが可能です。その他、メジャーなWEB上のサービス(Salesforce等)もデータソースにすることができます。
詳しくは、Alteryx社のホームページをご覧いただければと思います。
※2019/1/30時点で89種類が利用可能データソースとして列挙されています
インメモリ処理による高速処理
Alteryxは、データをメモリ上に展開して高速に処理しています。メモリに乗り切らない場合でも、自動的に各ツールベースで一時的にデータを書き出して処理を継続します。大量のデータを扱うビッグデータ時代には非常に適したソフトウェアとなっています。
なお、Alteryxのコアな処理部分はC++で書かれています(インターフェース周りはC#です)。Alteryx Technical Overview で確認できます。
超高速なGIS処理
空間処理はGISツールに比べて非常に高速です。また、自動化を行う際もワークフロー内にツールベースで組み込むだけですので直感的に作業できます。
スクリプトなどでGIS処理を自動化することと比較し直感的にワークフローが作成でき、さらに処理自体も高速ですので、圧倒的な効率化が望めます。
データ処理とGIS/R/Pythonを一つのワークフロー上で実行可能
GISやR、Pythonでデータを処理する際、データ加工は必須かと思います。データ加工をRやPython上で行うこともできますが、Alteryxで処理するほうが遥かに簡単です。そして、そのまま別のツールに着替えることなくRやPythonのコードに処理結果を直接流し込めます。
BIツールとの高い親和性
BIツール向けのコネクタも用意しています。特にTableau、Qlik、PowerBIについては専用のコネクタが提供されるなど親和性が高いです。
Alteryxの弱点として、レポートの機能の貧弱さが挙げられます。逆に、Alteryxで処理した結果をレポート機能が得意なBIツールで表現することでこの弱点を補うことができます。
高い拡張性
Alteryxは統計解析向けのプログラミング言語「R」や最近流行りのディープラーニングや機械学習などデータサイエンス分野で有名になった汎用プログラミング言語「Python」の機能も取り込んでいます(各々ツールアイコンとして持っています)。プログラミング言語をAlteryx内で利用できるため、コードが書ければ拡張性は無限大です(以前は「Code Free」(コード不要)と言っていましたが、最近は「Code Friendly」と言っています)。
プログラミング言語との比較
プログラミング言語でできるようなことができる、ということでプログラミング言語で開発するような案件をAlteryxで開発することも可能です。スクラッチ(一からの開発)に比べると数倍高速に開発可能です(恐らく1/3~1/2くらいの期間で開発可能です)。いわば「超高速ノーコード開発ツール」です。
デバッグも簡単です。常にデータを確認しながら開発をすることができるので、デバッグの効率も非常に高いです。
そして、設計図も必要ありません。Alteryxのワークフローが設計図になります。
低い学習コスト
プログラミング言語や同様のETLツールなどに比べると、学習コストは非常に低いです。わかりやすいインターフェースにより、プログラミング未経験者でもすぐに使いこなせるようになります(もちろんプログラミングの知識は必要ありません)。また、Alteryx社の運営するオンラインコミュニティでは様々な無償の学習コンテンツが提供されています。
作ったワークフローはアプリ形式にできます
学習コストが低いと言っても、完成したワークフローを単に使うだけの方もいらっしゃるかと思います。そのような方のために、作ったワークフローをメニュー形式でも提供できます。
※実行にはAlteryx Designerがインストールされている必要があります
無料トライアルが可能です
Alteryx Designerは4週間の無料トライアルが可能です。
こちらのURLから登録頂き、ぜひお試しください。
※トライアルには、Alteryx社への登録が必要となります
※京セラみらいエンビジョン株式会社は米Alteryx社の正規販売代理店です
学習リソース
Alteryxは日本語化が2018年に行われましたので操作動画等については英語のものがほとんどになります。弊社含め、各Alteryxの日本代理店が様々な情報を日本語で発信しておりますので、インターネットにて検索して頂くと様々な情報が得られるかと思います。
また、学習リソース等以下に記載します。
- 弊社TechBlog(Alteryxカテゴリ)
- Alteryx Community
- Weekly Challenge (毎週お題が出て解くページ。答えも掲載されています)
- その他インターネットで検索してみましょう
弊社がお手伝いできること
弊社は米Alteryx社の日本国内における正規販売代理店となります。
また、Alteryxを日本で大規模に導入する際、弊社メンバーがユーザーとして導入・運営のお手伝いをさせていただいた経験がございます。また、社内でも導入し、ユーザーとしても利用しております。そのノウハウを活かし、皆様のAlteryxの導入について以下の通りトータル的にご支援させていただくことが可能です。
- 製品の操作方法、技術的なご質問へのご回答
- ハンズオントレーニングの実施
- エキスパートサポート(有償)
- トレーニング(有償)
- ワークフローの作成請負(有償)
- 環境構築・運用(有償)
詳細につきましては営業までお問いあわせください。
価格等、お問い合わせについて
Alteryx製品の資料請求、サポート、価格についてのお問い合わせはこちらのフォームからお願いします。
おまけ
Q.「Alteryx」ってどう読むの?
A.「アルタリクス」「アルテリクス」「アルテリックス」様々な読み方で呼ばれていますが、正式名称は「アルテリックス」です(日本法人からお聞きしました)。ちなみに、社内では略して「アルタ」と呼んでいます。