【Alteryxアイコン200連発】正規表現ツール（Regular Expression Tool）

2018年8月31日 2023年12月22日 7分59秒

Alteryxツールアイコン「正規表現ツール」（Regular Expression Tool）をご紹介します

[パース]カテゴリの[正規表現]ツールについて紹介します。

このツールはPerl5正規表現を用いて、「置換」「トークン」「パース」「一致」の処理を実施するツールになります。

設定項目の説明の前に正規表現ツールを理解するために正規表現について簡単に説明します。

正規表現とは、「いくつかの文字列を１つの形式で表現する」方法です。メタ文字「.^$[]*+?|()」を使用して様々な表現を行います。

基本的な正規表現について説明します。

「.」は任意の１文字を表します。

例えば「私は.です」の正規表現と一致する文字列を検索すると

となります。「私は」と「です」の間が１文字でない「私は男の子です」、「私は女の子です」は一致しないと判断されます。これを「私は...です」の正規表現にすると任意の３文字となり

「私は男の子です」「私は女の子です」が一致と判断されます。

「*」は一つ前の文字をゼロ回以上繰り返すとなります。「.」と組み合わせると任意の文字と表現できます。

「私は.*です」と表現すると以下の様になります。

「私は*です」では「は」の繰り返しになりますので結果は以下の様になります。

この時0回も含みますので「私です」も対象になります。

「+」は1回以上の繰り返しになります。「私は+です」と表現すると以下の様になります。

「？」は0回または1回の繰り返しです。「私は?です」と表現すると以下の様になります。

「^」は文字列の先頭の文字を表します。「^私は.*」と表現すると「私は」で始まる任意の文字列になります。

$は文字列の終わりの文字を表します。「.*です$」と表現すると「です」で終わる任意の文字列になります。

「|」はorに当ります。「私です|私はです」と表現すると「私です」もしくは「私はです」に該当する文字列になります。

[]で囲むと、いずれかの1文字となります。「私は[男女は]です」と表現すると「私は男です」「私は女です」「私ははです」となります

[]内で^を使用すると、先程説明した^の意味が変わります。「私は[^男女]です」と表現すると男もしくは女以外の文字となります。

()で囲むとグループとして判断されます。例えば「私は+です」だと「は」1文字を繰り返しでしたが、「(私は)+です」とすると「私は」を繰り返すに変わります。

基本的な正規表現は以上となります。その他にも応用的な表現が多種存在します。

正規表現ツールの設定は、「対象フィールドの選択（パースするフィールド）」「正規表現」「出力メソッド」の３つに大きく別れます。

対象フィールドはプルダウンから選択します。

正規表現を入力する時は　右側の▼をクリックすると、入力補助がありますので利用して正規表現を作成できます。

出力メソッドには4つの方法があります。

出力メソッド	処理内容
置換	正規表現が一致した場合、指定したテキストに置換します。
トークン	正規表現に一致する部分に分割します。
パース	（）で囲ったグループ正規表現に分割します。
一致	正規表現に一致するかを「true」「false」で出力します。