Alteryxツールアイコン「サマライズツール」(Summarize Tool)をご紹介します
サマライズツール(Summarize Tool)
[変換]カテゴリの[サマライズ]ツールについて紹介します。概要
このツールは集計処理を行う機能を持っています。グループ化を行いながら、合計や平均などの集計処理を行うことができます。集計方法としては、合計、カウント、最大、最小などシンプルな内容から、ファイナンス関係、空間処理、行動分析、レポートの結合などの機能も持っています。
設定項目
ツールの設定のやり方ですが、上部のウィンドウにて集計を行いたいフィールドを選択し、真ん中にある「追加」というボタンで集計方法を選択すれば、下のアクションという部分に項目が追加されます。
上記画像のサンプル内では、「Group」というフィールドでグループ化を行い、「Value」という項目に対して合計を行うような設定となります。
選択ボタン
右上の選択ボタンを押すと、該当する項目名が「フィールド」にて選択されます。選択できる項目は以下のとおりです。
項目名 | 説明 |
---|---|
すべて | すべてのフィールドが選択されます |
なし | すべて非選択の状態にします |
数値 | 数値フィールドのみ選択します |
文字列 | 文字列フィールドのみ選択します |
空間 | 空間フィールドのみ選択します |
追加ボタン
このツールのメインの部分ですが、追加ボタンの内容としては、以下のとおりです。なお、一度「アクション」に追加されると集計方法は英語になってしまいますのでご注意ください。
名称 | 英語名 | 内容 |
---|---|---|
グループ化 | GroupBy | 同一の値をまとめます(グループ化)。 |
和 | Sum | 合計を算出します。 |
カウント | Count | レコード数を数えます。 |
非Nullのカウント | CountNonNull | Nullではないレコードを数えます。 |
重複を除いてカウント | CountDistinct | グループ内の一意のレコードを数えます。 |
非Nullを重複を除いてカウント | CountDistinctNull | Nullではない一意のレコード数を数えます。 |
Nullをカウント | CountNull | Nullのレコード数を数えます。 |
最小 | Min | 最小値を算出します。 |
最大 | Max | 最大値を算出します。 |
最初 | First | レコード順で最初に出てくる値を算出します。 |
最後 | Last | レコード順で最後に出てくる値を算出します。 |
ファイナンス
名称 | 英語名 | 内容 |
---|---|---|
正味現在価値(NPV) | NPV | 正味現在価値を算出します。プロパティとして「割引率」を設定可能です(デフォルト:8%)。 |
日付(XNPV)付きの正味現在価値 | XNPV | 日付のグループの正味現在価値を算出します。プロパティとして「ファイナンスレート」(デフォルト:8%)、「日付フィールド」を設定可能です。 |
内部収益率(IRR) | IRR | 内部収益率を算出します。 |
日付付きの内部収益率(XIRR) | XIRR | 日付グループの内部収益率を算出します。プロパティとして「日付フィールド」を設定可能です。 |
修正された内部収益率(MIRR) | MIRR | 内部収益率の変更と、IRR に関するいくつかの問題を解決します。プロパティとして「ファイナンスレート」(デフォルト:8%)、「投資率」(デフォルト:8%)を設定可能です。 |
変更された日付付き内部変換レート(MXIRR) | MXIRR | 日付グループに対する変更内部収益率を算出します。プロパティとして「ファイナンスレート」(デフォルト:8%)、「投資率」(デフォルト:8%)、「日付フィールド」を設定可能です。 |
数値
名称 | 英語名 | 内容 |
---|---|---|
平均 | Avg | 平均値を算出します。 |
パーセンタイル | Percentile | 指定した百分位を算出します。50%であれば中央値となります。
プロパティとして指定する百分位を設定できます(デフォルト:50%=中央値)。 |
中央値 | Median | 中央値を算出します。値を順番にソートした際の中央の数字となります。レコード数が偶数の場合は、中央の2つの数字の平均となります。 |
モード | Mode | 最頻値(最も頻繁に出てくる値)を算出します。 |
標準偏差 | StdDev | 標準偏差(値のばらつき)を算出します。 |
分散 | Variance | 分散を算出します。 |
平均 - 0を無視する | AvgNo0 | 値が0のレコードを無視して平均値を算出します。 |
中央値 - 0を無視する | PctlNo0 | 値が0のレコードを無視して中央値を算出します。 |
最頻値 - 0を無視する | MedianNo0 | 値が0のレコードを無視して最頻値(最も頻繁に出てくる値)を算出します。 |
標準偏差 - 0を無視する | StdDevNo0 | 値が0のレコードを無視して標準偏差(値のばらつき)を算出します。 |
分散 - 0を無視する | VarianceNo0 | 値が0のレコードを無視して分散を算出します。 |
文字列
名称 | 英語名 | 内容 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
空白をカウント | CountBlank | 空白のレコードのレコード数を数えます。 | ||||||||
非空白をカウント | CountNonBlank | 空白ではないレコードのレコード数を数えます。 | ||||||||
連結する | Concat | グループ内のすべてのレコードの文字列を連結します。
プロパティとして、以下のものが設定可能です。
|
||||||||
最長 | Longest | 一番文字数の長いレコードを算出します。 | ||||||||
モード | Mode | 最も頻繁に出現し、最も文字数の短いレコードを算出します。 | ||||||||
最短 | Shortest | 一番文字数の短いレコードを算出します。 |
空間
※サンプル画像は、入力が緑色、結果はオレンジ色です。
名称 | 英語名 | 内容 |
---|---|---|
結合する | Combine | 一つの空間オブジェクトに結合します(複数のレコードが1つのレコードに結合されます=マルチポリゴン化)。 |
交差を作成する | CreateIntersection | 空間オブジェクトの重なり部分のポリゴンを作成します。 |
境界矩形を作成する | CreateBoundingRectangle | 空間オブジェクトを全て含む四角形のポリゴンを作成します。 |
凸包を作成する | CreateConvexHull | 多角形のポリゴンを作成します。 |
中心点を作成する | CreateCentroid | 空間オブジェクトを合体した時の中心点を作成します。 |
※サンプルでは、入力は4つのポリゴンでそれぞれ2つずつA、Bと名称をつけています。サマライズツールにて、A、Bでグループ化し、それぞれの処理を行っています。結果のポリゴンとして、Aグループ、Bグループでそれぞれ一つずつ生成されます。
行動分析
名称 | 英語名 | 内容 |
---|---|---|
プロファイルを結合 | CombineProfiles | 1つのプロファイルに結合します。 |
※行動分析は現在日本のデータが存在しないため利用できません
レポート
名称 | 英語名 | 内容 |
---|---|---|
水平結合 | CombineHorizontal | 水平方向に結合します。 |
垂直結合 | CombineVertical | 垂直方向に結合します。 |
アクションプロパティ
一部の集計項目でプロパティが必要な場合に表示されます。
例:文字列を「結合」する場合
サンプル
簡単なデータとして、「No」「Group」「Value」というフィールドを持つデータを準備し、それに対して「Group」フィールドでグループ化してそれぞれ「Value」フィールドを合計するようなサンプルを以下に記載します。
以下のサンプルであれば、GroupフィールドにAとBという値があるので、それぞれの値に一致するもの同士のValueを合計しています。
※Alteryx Version 2018.4.4時点での情報です