Alteryxツールアイコン「複数ジョインツール」(Join Multiple Tool)をご紹介します
複数ジョインツール(Join Multiple Tool)
[ジョイン]カテゴリの[複数ジョイン]ツールについて紹介します概要
このツールはジョインツールの複数版になります。
ジョインツール同様に特定のフィールドをキーにしての結合と、レコードポジションによる結合が可能です。
設定項目
複数ジョインツールは大きく分けると「結合設定」と「出力設定」に別れます。出力設定は選択ツールと同様の機能があります。説明は選択ツールの項目を参照願います。
結合設定
レコードポジションで結合
レコードの位置を参照し結合します。
特定のフィールドで結合
キーとなるフィールドを指定し、その値が同じであるレコードが結合されます。フィールドはドロップダウンで選択します。フィールドの「Input_#1」「Input_#2」「Input_#3」などは複数ジョインツールに接続した入力データ順で決まります。
デカルト結合
まず、「デカルト結合(直積集合)」について説明します。
テーブルAとテーブルBを結合する時に、結合条件を満たすレコードが複数あるとします。この時にテーブルAとテーブルBの条件を満たすレコードを全て結合します。
例えば、テーブルAのフィールドA、テーブルBのフィールドBを結合フィールドとして指定します。フィールドAに「test」が3つ、フィールドBに「test」が2つ存在すると、それぞれのフィールドに対してすべての結合が行われる為、3×2=6 レコードの結合結果が出力されます。
この結合方法では膨大なレコード同士の結合で発生すると多大な処理が発生してしまいます。そこで3つのオプションで抑制を行えます。
すべての多次元結合を許可する: 多次元結合は、エラーまたは警告が報告されずに行われます。ワークフローはすべて実行されます。
16以上のレコードの多次元結合を警告する: 「結果」ウィンドウに、多次元結合が発生したという警告が報告されます。ワークフローはすべて実行されます。
16以上のレコードの多次元結合に関するエラー: 「結果」ウィンドウで、多次元結合が発生し、ダウンストリーム処理が停止するというエラーが報告されます。ワークフローはエラーで止まります。
すべての入力から結合する結合するレコードのみ出力
このオプションにチェックを入れると、結合されたレコードのみ出力されます。
例としては、テーブルA、B、Cで結合する時に、特定フィールドの同じ値が「test3」のみの場合は各々のテーブルの「test3」のみが結合されて出力されます。
注意デカルト結合が発生する場合、大量のデータが作成される可能性があるため注意願います(そのために「16以上のレコードの多次元結合に関するエラー」というオプションがあります。キーフィールドに、ユニークではないレコードが存在する場合に発生するので、よくデータを確認しましょう。
※Alteryx Version 2018.2.5時点での情報です