Alteryxツールアイコン「複数ジョインツール」(Join Multiple Tool)をご紹介します
複数ジョインツール(Join Multiple Tool)
[ジョイン]カテゴリの[複数ジョイン]ツールについて紹介します。本記事はAlteryx Designer Version 2024内容になりますので、Version 2018の場合は以下のリンクを参考にしてください。
概要
このツールは結合ツールの複数版になります。
結合ツール同様に特定のフィールドをキーにしての結合と、レコードポジションによる結合が可能です。
設定項目
複数ジョインツールは大きく分けると「結合設定」と「出力設定」に別れます。出力設定はセレクトツールと同様の機能があります。説明はセレクトツールの項目を参照願います。
結合設定
レコードポジションで結合
レコードの位置を参照し結合します。
特定のフィールドで結合
キーとなるフィールドを指定し、その値が同じであるレコードが結合されます。フィールドはドロップダウンで選択します。フィールドの「Input_#1」「Input_#2」「Input_#3」などは複数結合ツールに接続した入力データ順で決まります。
デカルト結合
まず、「デカルト結合(直積集合)」について説明します。
テーブルAとテーブルBを結合する時に、結合条件を満たすレコードが複数あるとします。この時にテーブルAとテーブルBの条件を満たすレコードを全て結合します。
例えば、テーブルAのフィールドA、テーブルBのフィールドBを結合フィールドとして指定します。フィールドAに「test」が3つ、フィールドBに「test」が2つ存在すると、それぞれのフィールドに対してすべての結合が行われる為、3×2=6 レコードの結合結果が出力されます。
この結合方法では膨大なレコード同士の結合で発生すると多大な処理が発生してしまいます。そこで3つのオプションで抑制を行えます。
すべての多次元結合を許可する: 多次元結合は、エラーまたは警告が報告されずに行われます。ワークフローはすべて実行されます。
16を超えるレコードの多次元結合を警告する: 「結果」ウィンドウに、多次元結合が発生したという警告が報告されます。ワークフローはすべて実行されます。
16を超えるレコードの多次元結合をエラーにする: 「結果」ウィンドウで、多次元結合が発生し、ダウンストリーム処理が停止するというエラーが報告されます。ワークフローはエラーで止まります。
すべての入力から結合するレコードのみを出力する
このオプションにチェックを入れると、結合されたレコードのみ出力されます。
例としては、テーブルA、B、Cで結合する時に、特定フィールドの同じ値が「test3」のみの場合は各々のテーブルの「test3」のみが結合されて出力されます。
注意デカルト結合が発生する場合、大量のデータが作成される可能性があるため注意願います(そのために「16を超えるレコードの多次元結合をエラーにする」というオプションがあります。キーフィールドに、ユニークではないレコードが存在する場合に発生するので、よくデータを確認しましょう。
※Alteryx Version 2024.1.1時点での情報です