【Alteryx Tips】テキストを列に分割ツール(Text to Column)の応用例(分割する列数が不特定の場合)

「テキストを列に分割」ツールの応用例として、列方向に分割数が不明のデータを分割してみます

「テキストを列に分割」ツール紹介記事で「行では分割数に制限が無いため文章の分割などでも特に問題はありません。」と紹介しましたが、列方向に自由に分割したいこともあるかと思います。

それでは、今回は分割数が不明なデータを横方向に任意の数で分割できる様にワークフローを組んでみましょう。

お題

パースするデータですが、以下の文章を用意しました。

これを、句読点「、」「。」で列方向に分割したいと思います。ただ、文章を見る限り分割数が不定ですので、それをどうクリアするかがポイントです。

実際の手順

まず、これを分割する前に「レコードID」ツールでIDを付与します。

これを実行すると元の文が同じものは同じIDが付与された状態で分割できます。

次に「複数行フォーミュラ」ツールでグループ毎に連番を作成します。

最後にクロスタブでデータを横にします。

実行すると

これで分割要素が幾つになるか不明なテキストでも、任意に分割できるワークフローが出来ました。

まとめ

今回、「テキストを列に分割」ツール1つでは不可能な、「列方向にいくつに分割するか不明なデータを分割」することを、4つのツール「レコードID」「テキストを列に分割」「複数行フォーミュラ」「クロスタブ」で実現しました。

一つのツールでは不可能なことも、組み合わせで実現できます(組み合わせは千差万別です、いろいろ試してみましょう)。

特に「レコードID」ツールは意外と使えます。IDを付与するという簡単な機能ですが、データ分岐をする前に付与すれば、IDをもとに再度結合処理を行うことができるので便利です。

 

※Alteryx Version 2018.4.5時点での情報です

Alteryxの導入はぜひKCMEで!

セルフサービスデータ分析ツール「Alteryx」は2週間無償トライアルが可能です。

製品に対する操作方法、技術的な質問などは導入前・導入後に関わらずメールにてお答えします。また、Alteryxを用いた環境構築、開発、ヘルプデスク対応、ハンズオン、トレーニング、ワークフロー作成なども承りますので、お気軽にご相談ください。

おすすめの記事