【Alteryxアイコン200連発】サマライズツール(Summarize Tool)

Alteryxツールアイコン「サマライズツール」(Summarize Tool)をご紹介します

サマライズツール(Summarize Tool)

[変換]カテゴリの[サマライズ]ツールについて紹介します。

概要

このツールは集計処理を行う機能を持っています。グループ化を行いながら、合計や平均などの集計処理を行うことができます。集計方法としては、合計、カウント、最大、最小などシンプルな内容から、ファイナンス関係、空間処理、行動分析、レポートの結合などの機能も持っています。

設定項目

ツールの設定のやり方ですが、上部のウィンドウにて集計を行いたいフィールドを選択し、真ん中にある「追加」というボタンで集計方法を選択すれば、下のアクションという部分に項目が追加されます。

Summarize_ToolSetting

上記画像のサンプル内では、「Group」というフィールドでグループ化を行い、「Value」という項目に対して合計を行うような設定となります。

選択ボタン

右上の選択ボタンを押すと、該当する項目名が「フィールド」にて選択されます。選択できる項目は以下のとおりです。

項目名 説明
すべて すべてのフィールドが選択されます
なし すべて非選択の状態にします
数値 数値フィールドのみ選択します
文字列 文字列フィールドのみ選択します
空間 空間フィールドのみ選択します

追加ボタン

このツールのメインの部分ですが、追加ボタンの内容としては、以下のとおりです。なお、一度「アクション」に追加されると集計方法は英語になってしまいますのでご注意ください。

Summarize_option

名称 英語名 内容
グループ化 GroupBy 同一の値をまとめます(グループ化)。
Sum 合計を算出します。
カウント Count レコード数を数えます。
非Nullのカウント CountNonNull Nullではないレコードを数えます。
重複を除いてカウント CountDistinct グループ内の一意のレコードを数えます。
非Nullを重複を除いてカウント CountDistinctNull Nullではない一意のレコード数を数えます。
Nullをカウント CountNull Nullのレコード数を数えます。
最小 Min 最小値を算出します。
最大 Max 最大値を算出します。
最初 First レコード順で最初に出てくる値を算出します。
最後 Last レコード順で最後に出てくる値を算出します。

ファイナンス

名称 英語名 内容
正味現在価値(NPV) NPV 正味現在価値を算出します。プロパティとして「割引率」を設定可能です(デフォルト:8%)。
日付(XNPV)付きの正味現在価値 XNPV 日付のグループの正味現在価値を算出します。プロパティとして「ファイナンスレート」(デフォルト:8%)、「日付フィールド」を設定可能です。
内部収益率(IRR) IRR 内部収益率を算出します。
日付付きの内部収益率(XIRR) XIRR 日付グループの内部収益率を算出します。プロパティとして「日付フィールド」を設定可能です。
修正された内部収益率(MIRR) MIRR 内部収益率の変更と、IRR に関するいくつかの問題を解決します。プロパティとして「ファイナンスレート」(デフォルト:8%)、「投資率」(デフォルト:8%)を設定可能です。
変更された日付付き内部変換レート(MXIRR) MXIRR 日付グループに対する変更内部収益率を算出します。プロパティとして「ファイナンスレート」(デフォルト:8%)、「投資率」(デフォルト:8%)、「日付フィールド」を設定可能です。

数値

名称 英語名 内容
平均 Avg 平均値を算出します。
パーセンタイル Percentile 指定した百分位を算出します。50%であれば中央値となります。

プロパティとして指定する百分位を設定できます(デフォルト:50%=中央値)。

中央値 Median 中央値を算出します。値を順番にソートした際の中央の数字となります。レコード数が偶数の場合は、中央の2つの数字の平均となります。
モード Mode 最頻値(最も頻繁に出てくる値)を算出します。
標準偏差 StdDev 標準偏差(値のばらつき)を算出します。
分散 Variance 分散を算出します。
平均 - 0を無視する AvgNo0 値が0のレコードを無視して平均値を算出します。
中央値 - 0を無視する PctlNo0 値が0のレコードを無視して中央値を算出します。
最頻値 - 0を無視する MedianNo0 値が0のレコードを無視して最頻値(最も頻繁に出てくる値)を算出します。
標準偏差 - 0を無視する StdDevNo0 値が0のレコードを無視して標準偏差(値のばらつき)を算出します。
分散 - 0を無視する VarianceNo0 値が0のレコードを無視して分散を算出します。

文字列

名称 英語名 内容
空白をカウント CountBlank 空白のレコードのレコード数を数えます。
非空白をカウント CountNonBlank 空白ではないレコードのレコード数を数えます。
連結する Concat グループ内のすべてのレコードの文字列を連結します。

プロパティとして、以下のものが設定可能です。

名称 内容
開始 連結時の先頭に付加する文字
区切り文字 連結時に付加される区切り文字
終わり 連結時の末尾に付加される文字
最長 Longest 一番文字数の長いレコードを算出します。
モード Mode 最も頻繁に出現し、最も文字数の短いレコードを算出します。
最短 Shortest 一番文字数の短いレコードを算出します。

空間

※サンプル画像は、入力が緑色、結果はオレンジ色です。

名称 英語名 内容
結合する Combine 一つの空間オブジェクトに結合します(複数のレコードが1つのレコードに結合されます=マルチポリゴン化)。

Summarize_spatial_combine

交差を作成する CreateIntersection 空間オブジェクトの重なり部分のポリゴンを作成します。

Summarize_spatial_intersection

境界矩形を作成する CreateBoundingRectangle 空間オブジェクトを全て含む四角形のポリゴンを作成します。

Summarize_spatial_BoundingRectangle

凸包を作成する CreateConvexHull 多角形のポリゴンを作成します。

Summarize_spatial_ConvexHull

中心点を作成する CreateCentroid 空間オブジェクトを合体した時の中心点を作成します。

Summarize_spatial_Centroid

※サンプルでは、入力は4つのポリゴンでそれぞれ2つずつA、Bと名称をつけています。サマライズツールにて、A、Bでグループ化し、それぞれの処理を行っています。結果のポリゴンとして、Aグループ、Bグループでそれぞれ一つずつ生成されます。

Summarize_spatial_sample

行動分析

名称 英語名 内容
プロファイルを結合 CombineProfiles 1つのプロファイルに結合します。

※行動分析は現在日本のデータが存在しないため利用できません

レポート

名称 英語名 内容
水平結合 CombineHorizontal 水平方向に結合します。
垂直結合 CombineVertical 垂直方向に結合します。

 

アクションプロパティ

一部の集計項目でプロパティが必要な場合に表示されます。

例:文字列を「結合」する場合

Summarize_Sample2

サンプル

簡単なデータとして、「No」「Group」「Value」というフィールドを持つデータを準備し、それに対して「Group」フィールドでグループ化してそれぞれ「Value」フィールドを合計するようなサンプルを以下に記載します。

以下のサンプルであれば、GroupフィールドにAとBという値があるので、それぞれの値に一致するもの同士のValueを合計しています。

Summarize_Sample

※Alteryx Version 2018.4.4時点での情報です

Alteryxの導入はぜひKCMEで!

セルフサービスデータ分析ツール「Alteryx」は4週間無償トライアルが可能です。

製品に対する操作方法、技術的な質問などは導入前・導入後に関わらずメールにてお答えします。また、Alteryxを用いた環境構築、開発、ヘルプデスク対応、ハンズオン、トレーニング、ワークフロー作成なども承りますので、お気軽にご相談ください。

おすすめの記事