【Alteryxアイコン200連発】複数ジョインツール(Join Multiple Tool)

Alteryxツールアイコン「複数ジョインツール」(Join Multiple Tool)をご紹介します

 複数ジョインツール(Join Multiple Tool

[ジョイン]カテゴリの[複数ジョイン]ツールについて紹介します

概要

このツールはジョインツールの複数版になります。

ジョインツール同様に特定のフィールドをキーにしての結合と、レコードポジションによる結合が可能です。

設定項目

複数ジョインツールは大きく分けると「結合設定」と「出力設定」に別れます。出力設定は選択ツールと同様の機能があります。説明は選択ツールの項目を参照願います。

結合設定

レコードポジションで結合

レコードの位置を参照し結合します。

特定のフィールドで結合

キーとなるフィールドを指定し、その値が同じであるレコードが結合されます。フィールドはドロップダウンで選択します。フィールドの「Input_#1」「Input_#2」「Input_#3」などは複数ジョインツールに接続した入力データ順で決まります。

デカルト結合

まず、「デカルト結合(直積集合)」について説明します。

テーブルAとテーブルBを結合する時に、結合条件を満たすレコードが複数あるとします。この時にテーブルAとテーブルBの条件を満たすレコードを全て結合します。

例えば、テーブルAのフィールドA、テーブルBのフィールドBを結合フィールドとして指定します。フィールドAに「test」が3つ、フィールドBに「test」が2つ存在すると、それぞれのフィールドに対してすべての結合が行われる為、3×2=6 レコードの結合結果が出力されます。

この結合方法では膨大なレコード同士の結合で発生すると多大な処理が発生してしまいます。そこで3つのオプションで抑制を行えます。

すべての多次元結合を許可する 多次元結合は、エラーまたは警告が報告されずに行われます。ワークフローはすべて実行されます。

16以上のレコードの多次元結合を警告する 「結果」ウィンドウに、多次元結合が発生したという警告が報告されます。ワークフローはすべて実行されます。

16以上のレコードの多次元結合に関するエラー 「結果」ウィンドウで、多次元結合が発生し、ダウンストリーム処理が停止するというエラーが報告されます。ワークフローはエラーで止まります。

すべての入力から結合する結合するレコードのみ出力

このオプションにチェックを入れると、結合されたレコードのみ出力されます。

例としては、テーブルA、B、Cで結合する時に、特定フィールドの同じ値が「test3」のみの場合は各々のテーブルの「test3」のみが結合されて出力されます。

注意デカルト結合が発生する場合、大量のデータが作成される可能性があるため注意願います(そのために「16以上のレコードの多次元結合に関するエラー」というオプションがあります。キーフィールドに、ユニークではないレコードが存在する場合に発生するので、よくデータを確認しましょう。

 

※Alteryx Version 2018.2.5時点での情報です

Alteryxの導入はぜひKCMEで!

セルフサービスデータ分析ツール「Alteryx」は2週間無償トライアルが可能です。

製品に対する操作方法、技術的な質問などは導入前・導入後に関わらずメールにてお答えします。また、Alteryxを用いた環境構築、開発、ヘルプデスク対応、ハンズオン、トレーニング、ワークフロー作成なども承りますので、お気軽にご相談ください。

おすすめの記事