Alteryxの「機械学習/Machine Learning」カテゴリのアイコンについて概要を紹介します
Alteryxのツールアイコンを簡単に紹介します。
注意
- 各ツールアイコンへの紹介リンクは詳細ページが出来次第追加します。
- 英語の資料を検索する際に、英語のツール名が有用かと思いますので、併記します。
- 「詳細カテゴリ」は弊社独自の考えのもと記載しております。また、「機能概要」についても、なるべく実戦的に記載しております。
- ツールアイコン名の日本語表記については、AlteryxDesigner本体、ヘルプなどで一定していないため、基本的にはAlteryxDesigner本体に併せています(バージョンが変更されると変わる可能性があるのでご了承ください)。
機械学習(Machine Learning)カテゴリについて
機械学習カテゴリは、Pythonベースの機械学習モデルを使った予測を行うためのアイコンカテゴリです。標準搭載の従来の「予測」カテゴリと異なり、アシスト機能、自動モデリング機能を搭載しています。なお、利用には「インテリジェンススイート」ライセンスの導入が必要となります(有料)。
なお、本機能はAlteryx Designer バージョン2020.2以降で利用可能です(一部機能は2021.1以降)。
アイコン画像 | アイコン名(日本語) | アイコン名(英語) | 詳細カテゴリ | 機能概要 | 詳細リンク |
---|---|---|---|---|---|
アシスト付きモデリング | Assisted Modeling | 最適化 | ステップバイステップもしくは自動でPythonベースの機械学習パイプラインを構築するツールです。 | ||
変換 | Transformation | ETL | データ準備(データ型の設定、欠損値処理、特徴量選択)を実施します。 | ||
分類 | Classification | 予測モデル | 分類(Classification)を行います。機械学習モデルとしてロジスティック回帰、決定木、ランダムフォレスト、XGBoostを利用できます。 | ||
回帰 | Regression | 予測モデル | 回帰(Regression)を行います。機械学習モデルとして線形回帰、決定木、ランダムフォレストを利用できます。 | ||
適合 | Fit | 予測モデル | データセットと機械学習ツールからモデルをデータに適合させます。 | ||
予測 | Predict | スコアリング | 構築した機械学習パイプラインを使用して予測を行います。 | ||
自動機械学習 | AutoML | データ抽出 | データモデルを自動的に構築します。Alteryx Designer バージョン2021.1以降で利用可能。 | ||
特徴量構築 | Build Features | テーブル結合 | 複数のデータソースを結合し、一つの特徴量のデータを作成します(結合ツールなど複数のツールを組み合わせた機能)。Alteryx Designer バージョン2021.1以降で利用可能。 | ||
データヘルス | Data Health | サマリー | データの状態を確認します。欠落値、外れ値、スパース性(ユニーク値の数)について評価します。Alteryx Designer バージョン2021.1以降で利用可能。 | ||
特徴量データ型 | Feature Types | ETL | 特徴量のデータ型を自動で決定するツールです。「変換」ツールの「データ型を設定」と同様の機能を提供します。Alteryx Designer バージョン2021.1以降で利用可能。 |
補足
Alteryx Designer バージョン2020.2で追加された機能と2021.1で追加された機能はそれぞれセットになっており、組み合わせて利用することが想定されているようです。なお、「予測」ツールは最終段で予測のために共通して使われます。
Alteryx Designer バージョン2020.2で追加された機能
- アシスト付きモデリング
- 変換
- 分類
- 回帰
- 適合
2020.2で追加された機能は、アシスト付きモデリングツールから他のツールを自動的に生成するようになっており、各ツールは単独では用いられません(各ツール間のデータはモデルという形式でやり取りを行います)。
Alteryx Designer バージョン2021.1で追加された機能
- 自動機械学習
- 特徴量データ型
- データヘルス
- 特徴量構築
2021.1で追加された機能は、それぞれ個別で利用することが想定されています。すなわち、「特徴量構築」で複数データストリームを組み合わせて一つのデータを作成し、特徴量データ型で型を決め、データヘルスで特徴量にするデータを決定し、最終的に自動機械学習でモデルの構築を行うというストーリーとなります。