【AlteryxTips】文字コードを指定してデータを保存する方法

Alteryxで文字コードを指定してデータを保存する方法をご紹介します

 

Alteryx DesignerではCSVファイルなどの保存時に文字コード(コードページ)を指定して保存することができます。

しかし、対応しているのはWindowsで標準的に利用される「日本語Shift-JIS」とインターネットでよく使われる「UTF-8」のみです。場合によってはEUC-JPなどの文字コードで保存したいような場合もあると思いますので、その方法についてご紹介します。

文字コード指定保存手順

まず、このようなデータをインプットに持つとします。

インプットデータ

やることは、コードページ指定読み込みの逆の発想になります。

ワークフロー

手順は以下のとおりです。

1.「複数行フォーミュラ」ツールで文字コード変換を行う

2.「動的リネーム」ツールでフィールド名の文字コードを変換する

3.「データ出力」ツールにて「ISO 8859-1ラテン語I」で保存する

 

1.「複数行フォーミュラ」ツールで文字コード変換を行う

まず、複数行フォーミュラツールを使って、各フィールド内のデータの文字コードを変換します。

複数フィールドフォーミュラツール設定

No オプション名 設定内容 コメント
フィールドを選択 すべてチェック(日本語のフィールドのみでもOK)
出力タイプを変更 チェックを付け、「V_WString」を選択 「WString」でも問題なし
サイズ 255など大きめの数字を指定 文字コードによってはフィールドサイズを現状の設定値より大きくする必要があります
以下の式を記載 20932の部分は、別表 の通り文字コードによって変わります。

例:

  • UTF-8 65001
  • Shift-JIS 932
  • EUC-JP 20932

式: EUC-JP形式で出力する場合

ConvertToCodePage([_CurrentField_], 20932)

 

2.「動的リネーム」ツールでフィールド名の文字コードを変換する

次に、「動的リネーム」ツールでフィールド名の文字コードを変換します。

動的リネームツール設定

No オプション名 設定内容 コメント
名前の変更モード 「フォーミュラ」を指定
変更フィールド すべてチェック(日本語名のフィールドのみでもOK) 「WString」でも問題なし
以下の式を記載 20932の部分は、別表 の通り文字コードによって変わります。

例:

  • UTF-8 65001
  • Shift-JIS 932
  • EUC-JP 20932

式: EUC-JP形式で出力する場合

ConvertToCodePage([_CurrentField_], 20932)

 

 

3.「データ出力」ツールにて「ISO 8859-1ラテン語I」で保存する

最後に、「データ出力」ツールで、ファイルの出力を行いますが、この時コードページは「ISO 8859-1ラテン語I」を指定します。

データ出力ツール設定

これで出力すればOKです。

今回は、EUC-JPで出力しましたが、試しにExcelで開いてみると・・・。

ExcelでEUC-JPのCSVファイルを開く

見事に文字化けしています。これはExcelはShift-JIS以外の文字コードのファイルは文字化けするからです。

テキストエディタで開いてみると、無事にEUC-JPで認識され、正常に読めています。

EUC-JP

 

サンプルワークフローダウンロード

CodePage_write_Sample 

 

注意事項

Alteryxでは、Shapeファイル出力時フィールド名に日本語を出力できません。参考URL (「Shape Fileで日本語のフィールド名を使いたい件をIdeaに投稿しました」

 

※Alteryx Designer 2020.4.5.12471時点の情報となります

Alteryxの導入はぜひKCMEで!

セルフサービスデータ分析ツール「Alteryx」は4週間無償トライアルが可能です。

製品に対する操作方法、技術的な質問などは導入前・導入後に関わらずメールにてお答えします。また、Alteryxを用いた環境構築、開発、ヘルプデスク対応、ハンズオン、トレーニング、ワークフロー作成なども承りますので、お気軽にご相談ください。

おすすめの記事