【AlteryxTips】Alteryxにおける「型(データ型)」について

Alteryxでの「型(データ型)」についてご説明します

 

プログラミングを習っている方には比較的馴染み深いデータの「型」(データ型)ですが、そうでない方にとってはよくわからない話かと思います。今回は、Alteryxにおける「型」(データ型)についてご紹介したいと思います。

型(データ型)とは?

コンピュータがデータを扱う際に、扱いやすいようにデータ型というものを規定し、その型の種類によってどのようにデータを扱うか、というのを決めています。それが「データ型」です。

データ型を意識せずに使えるプログラミング言語などもありますが、例えば表計算ソフト上で数字の「1」がセルに入っている時、それが「文字列型」なのか「数字型」なのか、で取り扱いが変わった、という経験がある方は多いかと思います(よくあるのが、文字列型の数値の場合、並べ替えの時に思った順序になってくれない、という経験はありませんか?)

例えば、「1+1」という演算をした時に、文字列型であれば「+」という演算子は連結を意味することになり、結果は「11」となります。逆に数値型であれば「+」という演算子は足し算を意味することとなり、結果は「2」となります。表にすると以下のような形になります。

例:1+1をした時にどうなるか?

「1」の型 「+」の扱い 結果
数値型 足し算 2
文字列型 連結 11

 

この「型を正確に扱う」ということはコンピュータでデータ処理を行う上では必須の知識かと思います。

Alteryxでのデータ型

大きく分けると、文字列型、ブール型、数値型、日時型、空間オブジェクト型、Blob型に分かれます。

特に種類が多いのは、文字列型と数値型で、文字列型は4種類、数値型はさらに整数型と小数型に分かれ、整数型は4種類。小数型は3種類あります。

このあたりは一般的なプログラミング言語で使われているものとほぼ同じです。

ぶっちゃけ、どれ使ったら良い?

ややこしい整数、小数、文字列のオススメの型を、「大は小を兼ねる」という方針で記載したいと思います。

データ 実際に使う型
整数 Int64
小数 Double
文字列 V_WString

 

もちろんすべてのケースで全て当てはまるわけではありませんが、上記の設定であれば基本的にトラブルが出にくいかと思います。メモリを節約したいような場合(大量のデータを扱う等)や精度を気にする場合は、シビアに設定を見直した方が良いかと思います。

なお、文字列型はサイズ(文字数)を別途指定するようになるので、ご注意ください。

詳細な解説

分類 型名称 値の範囲等
ブール型 Bool True もしくは Falseの2値(False=0、Trueは0以外という扱い)のみ。計算式等で「True」や「False」という文字を利用する場合はダブルクオテーション(")やシングルクオテーション(')で囲う必要があります。
数値型 Byte 0~255の整数値。
Int16 -32,768~32,767の整数値。
Int32 –2,147,483,648~2,147,483,647の整数値。
Int64 –9,223,372,036,854,775,808~9,223,372,036,854,775,807の整数値。
FixedDecimal 固定小数点型。デフォルトでは19.6(トータル19桁で小数点部分が6桁)。最大50桁。
Float 単精度浮動小数点型。
Double 倍精度浮動小数点型。
文字列型 String 固定長の「Latin-1」文字列(いわゆる英数アルファベットのみのイメージです)。つまり、日本語等は使えません

設定した文字数を超えると切り捨てられますし、設定した文字数をの記憶領域をあらかじめ確保するため、メモリ使用効率も悪いです。

WString 固定長のワイド文字列(Unicode)。日本語が使えます

設定した文字数を超えると切り捨てられますし、設定した文字数をの記憶領域をあらかじめ確保するため、メモリ使用効率も悪いです。

V_String 可変長の「Latin-1」文字列(いわゆる英数アルファベットのみのイメージです)。つまり、日本語等は使えません

フィールド内に文字列全体を格納するように調整されます(※これはメモリ効率の話であり、実際はサイズで指定した文字数しか格納しません)。

V_WString 可変長ワイド文字列(Unicode)。日本語が使えます

フィールド内に文字列全体を格納するように調整されます(※これはメモリ効率の話であり、実際はサイズで指定した文字数しか格納しません)。

日時型 Date 日付型。「YYYY-MM-DD」形式の10文字の文字列。
Time 時間型。「HH:MM:SS」形式の8文字の文字列。
DateTime 日時型。「YYYY-MM-DD HH:MM:SS」形式の19文字の文字列。
空間オブジェクト型 SpatialObject 空間オブジェクト型。ポイント、ライン、ポリライン、ポリゴンを格納可能。
BLOB型 Blob バイナリ型。画像またはメディアファイルなどのバイナリラージオブジェクトが格納されます。※BLOB=Binary Large OBject

その他制限

単一のフィールドに対して2Gもしくは約21.4億億文字の制限があります。

このエラーに引っかかるときは「Error String size limit reached: Strings are limited to 2147483648 bytes」というようなエラーが表示されます。

まとめ

「型」はコンピュータを用いてデータ処理を行う場合の基本的な知識になります。

できるだけ慣れて適切なデータ型をつけるようにしましょう!

 

※Alteryx Designer 2019.2.7.63499時点の情報です

Alteryxの導入はぜひKCMEで!

セルフサービスデータ分析ツール「Alteryx」は4週間無償トライアルが可能です。

製品に対する操作方法、技術的な質問などは導入前・導入後に関わらずメールにてお答えします。また、Alteryxを用いた環境構築、開発、ヘルプデスク対応、ハンズオン、トレーニング、ワークフロー作成なども承りますので、お気軽にご相談ください。

おすすめの記事