
ThoughtSpotのSpotIQ分析の「予測」についてご紹介します
AkimasaKajitaniです。今回は、SpotIQ分析の「予測」について試してみたいと思います。
SpotIQ分析の予測とは?
SpotIQ分析の中でも一番明確なのがこの「予測」機能です。いわゆる時系列予測を行う機能で、ThoughtSpotではLSTM(Long Short-Term Memory)というアルゴリズムを使って予測を行います。このLSTMはいわゆるRNNというディープラーニングの手法の一つで、過去の重要な情報をうまく記憶できるという点が特徴です。
LSTMは計算コストが高いため、デスクトップ版が主流のセルフサービスBIでは予測モデルとしてETS(指数平滑法)と呼ばれる手法がよく採用されていますが、ThoughtSpotはクラウドの特性を活かし、計算コストの重さをうまくカバーしつつ予測精度の高いモデルを提供しています。ただし、これらの予測アルゴリズムの精度は、元データの特徴に大きく依存するため一般的に精度が高いアルゴリズムがすべてのデータで一番精度が高くなる、ということは必ずしもないのでご注意ください。
基本的に時系列予測モデルは、ある数値項目の過去の動き方のパターンを学習し未来を予測する、というものであり、季節性、トレンド、周期性がないデータの予測は困難なので、時系列予測の特徴を理解し、ご利用ください。グラフを見た時に、明らかに周期性やトレンド、季節性が見られるデータであれば、ある程度出てきたデータの傾向を信用して良いのではないかと思います。
「予測」を行うためには?
SpotIQの予測を行うためには、「KPIチャート」と呼ばれるチャートを日付項目を使って作成する必要があります。これには日付項目と予測を行いたい数値項目を使う必要があります。
例えば、以下のように数値項目一つと日付項目一つで検索します。

これにより、以下のようなKPIチャートができます。

KPIチャートが完成したら、3点メニューから「SpotIQ分析」を選択してみましょう(以下メニュー画面は、ライブボードに回答を貼り付けてから表示しています)。

以下の分析タイプ選択画面で「予測」を選択し、「次へ」をクリックします。

次に、予測のオプションを設定していきます。設定が完了すれば、「分析」ボタンをクリックします。

「予想データポイント」は、予測を行う期間を選択可能です。デフォルトでは10ですが、最大20まで選択が可能です(この数値の指定は、5単位でしかできません)。

あまり長期のデータポイントを予測しても精度が落ちるだけなのでほどほどにすることをおすすめします。
「予測」機能の一番重要なポイントが、この「メジャーを選択する」です。ここでは、KPIチャートで表示している数値項目に影響を与えるであろう数値項目を選択することで精度の向上をはかることができます。つまり、ここで設定した項目がKPIに影響を及ぼしているのであれば精度アップが見込めるということです。逆に、まったく関係ない値を選択し、偶然それがKPIに連動していた場合は予測モデルを逆に狂わせることになるので、メジャーの選択については慎重に決定してください。
今回は、値引き率という項目があるため、これを追加してみたいと思います。
「分析」ボタンをクリックすると、分析が開始され、少しすると完了します。完了したら「分析を見る」ボタンが出てくるので、これをクリックしてください。

これにより、予測結果が表示されます。

予測結果は右端のグレーの部分です。点線が予測線で、これを中心にグレーの範囲が95%の信頼区間となります。基本的にはグレーの枠内に収まる、と考えて頂ければオッケーです。

元々のグラフの形を見ると、なんとなくトレンドがあるのはわかりますが、季節性、周期性はあまりなさそうなデータに見えるため、トレンドを考えた時のだいたいの着地点が予測されたように見えます。
その他できること
その他、この画面でできることは、以下のとおりです。

- インサイトの保存
- 共有(3点メニュー)
「有効期限」というのが上のスクショでも見えると思いますが、SpotIQ分析は24時間後には削除されてしまいます。必要であれば、「インサイトの保存」で保存してください。これにより期限が無限になり、ナビゲーションメニューの「インサイト」の「SpotIQ分析」の項目内に残るようになります。
残念ながらライブボードへのピン留めはできません。
制約事項とベストプラクティス
制約事項
- 予測はKPIチャートのみで利用可能です
- 予測は、データソースが「クラウドデータウェアハウス」のみ対応しています
- 予測のためには、データポイントが15個必要です(15個より少ない場合、「予測」が選択肢に出てきません)
- カスタムカレンダーが設定されている日時項目を使ってKPIチャートを作成した場合、予測が選択できません
- 予測結果は、あらゆる形式への出力やドリルダウン、ソースデータ表示などはできません
ベストプラクティス
- 時系列予測に必要な数のデータポイントをKPIチャートで表示します。最低15ポイント必要ですが、季節性として2~3サイクル以上が推奨されています。
- 月単位でKPIチャートを作成した場合、24個以上のデータポイント(つまり最低2年)が季節性の学習に必要となります
- 「メジャーの選択」は、KPIチャートで表示している数値項目に関連する指標のみを選択してください。
- ドキュメントには書かれていませんが、SpotIQの相互相関分析を行うことで、関連性のありそうな数値項目を発見することができます
参考URL
Time-series forecasting | ThoughtSpot Document
運営会社
