【AlteryxTips】Excelファイルの読み込みについての注意事項

Excelファイルの読み込みについての注意事項(Excel Legacy Driver)

 

Alteryx Designerでは、Excel形式のファイルは特に何も対応せず読み込むことができますが、一部形式については、別途ドライバの導入が必要です。以下の「ドライバが必要な形式」というファイルについては、デフォルトではメニューに表示されておらず、別途ドライバを導入することで表示されるようになります。

Excel Legacyドライバが必要

ドライバが必要な形式:

  • Microsoft Excel Legacy(*.xlsx)
  • Microsoft Excel Binary(*.xlsb)
  • Microsoft Access 2007,2010,2013,2016(*.accdb)
    ※「XLSX」形式は標準でも読み込み可能ですが、読み込み方に差異があります

 

以下のMicrosoft Accessデータベースエンジン2010/2013というドライバをインストールすることで、上記のファイルを扱うことができるようになります。

 

必要なドライバ:

  • Alteryx Designer 2020.4以前

Microsoft Access データベース エンジン 2010 再頒布可能コンポーネント
https://www.microsoft.com/ja-JP/download/details.aspx?id=13255

  • Alteryx Designer 2021.1以降

Microsoft Access 2013 Runtime

https://www.microsoft.com/ja-JP/download/details.aspx?id=39358

※64bit版+Windows11で動作確認済み

 

このドライバを導入することで、「XLSX」形式のファイルは二通りの読み込みができるようになります。すなわり、Alteryxが持っている読み込み機能と、MicrosoftのAccessデータベースエンジンが持っているドライバ(いわゆるLegacyドライバ)になります。

それぞれ、読み込みメニュー上で別々のものとして認識され、以下のように表示されます。

通常とLegacy

XLSXファイルについては、Alteryxの通常の読み込みとLegacyドライバを使う場合で、読み込み時のデータに差分が出てくる可能性があります。

これは、Legacyドライバでは、Excelファイルに設定されている書式が適応されたものを読み込むためのようです(例えば、1.001という値がセルに入っていて、これを表示形式で1にしていると、Legacyドライバでは1が読み込まれ、標準では1.001という値が読み込まれます)。

Excelに設定された書式をわざと有効にしたいような場合はわざわざLegacyドライバを用いて読み込みを行う、ということもあるかもしれません。必要に応じて使い分けていただければと思います。
ただ、Legacyなのでいつまで利用できるかどうかわからないので、その点はお気をつけください。

詳細は、AlteryxのHelpに記載がありますので、御覧ください。
https://help.alteryx.com/current/designer/microsoft-excel-alteryx-driver

 

まとめ

  • Excelバイナリ形式、ACCDB形式は別途ドライバが必要です
  • XLSX形式をLegacyドライバで読み込むと標準のドライバとは結果が異なります(標準のドライバでは、Excelの書式設定は無視されますが、Legacyドライバでは有効になります)
  • 標準のドライバの方がパフォーマンスが良いです

 

※Alteryx Designer 2020.1.2.24185時点の情報です

※Alteryx Designer 2022.1.1.25127時点の情報でアップデートしました(2022/08/05)

Alteryxの導入はぜひKCMEで!

セルフサービスデータ分析ツール「Alteryx」は4週間無償トライアルが可能です。

製品に対する操作方法、技術的な質問などは導入前・導入後に関わらずメールにてお答えします。また、Alteryxを用いた環境構築、開発、ヘルプデスク対応、ハンズオン、トレーニング、ワークフロー作成なども承りますので、お気軽にご相談ください。

おすすめの記事