Google NLPのSyntax APIを呼び出すツール紹介
Google Cloud Natural Language APIのSyntax(構文解析)機能を呼びだすツールです。GoogleからAPIキーを取得する必要があります。
概要
Alteryxには標準で日本語の形態素解析を行う機能は持っていません。通常はPythonやRのパッケージ(よく使われるのはMeCab等です)を使うことで無料で形態素解析を行うことができますが、別途MeCab自体のインストールが必要だったり配布されているマクロが動作しない、ということも多いようです。
今回ご紹介させて頂いているものは、Google Cloud Natural Language APIのSyntaxAPI(構文解析API)を呼び出すツールです。Google社の提供するAPIを使うことで、手軽に形態素解析を行うことができます。なお、本ツールの利用にはAPIキーをGoogle社から入手する必要があります。
月間5,000ユニット(1ユニット1,000文字)までは無料ですので、一度お試ししてみてはいかがでしょうか?
ツールダウンロード
GoogleNLP_Syntax1.0.yxifa-download
GoogleNLP_Syntax1.1.yxifa-download
※本マクロはyxi形式のマクロ(ツール)となります。ダウンロード後、解凍ツールで展開することで拡張子がyxiのファイルが得られますので、ダブルクリックしてインストールを行って下さい
使い方
設定項目
設定項目名 | 設定内容 |
---|---|
APIキー | Googleから入手したAPIキーを入力します。 |
ターゲット変数を設定 | 構文解析を行いたいフィールドを指定して下さい。 |
Text Type | テキストタイプは、平文のテキスト(PLAIN_TEXT)かHTMLから選択可能です。HTMLの場合は不要なタグなどが削除されます。 |
language | 通常はデフォルト値の「AUTO」で構いません。誤認識が発生した場合は、言語指定を行って下さい。日本語の場合は、「ja」です。 |
出力は二つの出力があります。
出力名 | 設定内容 |
---|---|
S出力 | 文章レベルの結果が出力されますが、元の文章が改行ごとに分割されて出力されるくらいで、実質的にはほとんど意味のない出力です。 |
T出力 | トークン(ワード)レベルの結果が出力されます。いわゆる形態素解析を行なった結果がこちらに出力されます。 |
サンプル
本ツールのサンプルワークフローとなります。サンプルワークフローは、マクロがインストールされたフォルダにも保存されています(英語版ではありますが)。
インプット:
Alteryx(アルテリックス / アルタリクス)は、GUIを用いた直感的なインターフェースを採用し、ノンプログラミングによるデータブレンディング・空間分析・予測統計分析機能を利用できるソフトウェアです。オンメモリ技術を用いた高速処理、ワークフローの再利用による業務効率化(ビックデータ)、豊富な対応データソース、Rベースの機械学習モデル等、セルフサービスデータ分析ツールの決定版です。
Alteryx Designerは1ライセンスからの小規模な導入が可能であり、Alteryx Serverを導入すれば組織内へのスケールアップも簡単。それに加え、Alteryx Connectではデータのカタログ化、Promoteでは機械学習モデルを組織内に簡単にデプロイ。Alteryxは組織内のデータ分析・活用を促進させるプラットフォームです。
結果は以下のようになります。
S出力:
T出力:
※大きすぎるため一部抜粋
技術情報
作成・動作確認バージョン
Alteryx Designer 2021.1.4.26400
参考情報
Google Cloud Natural Language API - Syntax Analysis
https://cloud.google.com/natural-language/docs/analyzing-syntax?hl=ja fa-external-link
サンプルワークフローダウンロード
SampleWorkflow_GoogleNLP_Syntax_ja fa-download
注意事項
- 本ツールに関する不具合、および利用したことによる損害については一切の責任を負いません
- 不具合報告、ご要望などあるようでしたら弊社フォームにて投稿頂ければ、本ツールの改良、機能追加など検討させて頂きますが、弊社都合にて行いますので要望の反映などのお約束はできませんのでご了承ください
- 有償でのカスタマイズ要望などあるようでしたら、弊社フォームにてお申し込みください。別途お見積りさせて頂きます