時系列分析について実際のデータを例にモデルや活用事例をご紹介

時系列分析は、時間の経過にともなうデータ変化を分析する手法です。ビジネスにおいては、売り上げ予測、在庫予測、など、の未来を想定することにより、意思決定の精度改善ができ、業務の効率化につながります。また、製造業などの生産ラインのトラブルを、早期に発見することで、損失を抑えることができます。

今回は実際の東証株価指数データで、時系列分析の活用事例をご紹介します。

時系列分析とは

時系列分析は過去のデータの傾向を抽出して、未来を予測する場合に利用されます。定期的に発生する事象、突発的に発生する事象、などの傾向ごとにデータを分析することで、将来の値を予測するものです。

時系列データとは

時系列データとは、株価や気温、電力消費量のデータなど時間的に変動を持つデータのことを言います。データの種類と着目したい事象によって、用いる分析手法を選ぶ必要があります。

時系列分析における変動要因

1.傾向変動(トレンド)
長期的な傾向を指します。求人倍率を予測する場合、トレンドを把握すると中長期的な求人募集戦略や採用計画の精度向上に利用できます。

2.循環変動(サイクル)
季節性よりも長い周期の変動を指します。労働力を予測する場合、サイクルで分析すると長期休暇中は観光地への旅行者増加傾向がわかるため、飲食業や宿泊業の労働力を増強しておく、などの準備が可能となります。

3.季節変動(シーズナル)
一定期間で比較的短期的な周期の変動を指します。アイスクリームの売り上げの場合、季節変動を分析すると夏前には生産能力を増強し、冬は生産を抑制することで、最適化された生産計画を作成できます。

4.不規則変動(ノイズ)
一定のパターンや周期を持たず、突発の変化を指します。宿泊者数がコロナの緊急事態宣言発令により一時的に減少した、などの現象が該当します。これらのノイズを考慮して、人員採用計画や在庫計画を作成すると計画の精度向上に役立ちます。

周期 期間 期間の例
1.傾向変動(トレンド) 無し 長い 15年以上
2.循環変動(サイクル) 有り 長い 3~15年
3.季節変動(シーズナル) 有り 短い 3年未満
4.不規則変動(ノイズ) 無し 無し 無し

時系列分析の代表的なモデル

<自己回帰系モデル>
1.ARモデル(自己回帰モデル)
ARモデルは、現在の値は過去の値の線形結合として表します。ある時点前の自分自身を説明変数とする回帰モデルと理解することもできます。

2.MAモデル(移動平均モデル)
MAモデルは、現在の誤差は過去の誤差の線形結合として表します。過去の平均と過去の残差から現在の値を予想するモデルと理解することもできます。

3.ARMAモデル(自己回帰移動平均モデル)
自己回帰(AR)に移動平均(MA)を加えたモデルです。

4.ARIMAモデル(自己回帰和分移動平均モデル)
ARMAモデルに加えてデータの差分Iを加えたモデルです。
差分は、時系列データの各観測値と1つ前の観測値との差を取る操作です。これにより、データの変化率や季節性の効果を除去し、定常性を持つデータに変換することができます。

5.SARIMAモデル(季節変動自己回帰和分移動平均モデル)
ARIMAモデルの拡張版であり、季節性(Seasonal)のパターンを表現する能力を持っています。

<状態空間モデル>
6.状態空間モデル
状態空間モデルは、状態方程式と観測方程式を組み合わせて、システムの状態変化と観測値の関係をモデリングします。観測値の状態をモデルに適用することで、ARIMAなどのモデルよりも複雑なモデルの実現ができます。

ビジネスでの時系列分析/時系列データの活用事例
~データごとの注目すべき傾向を例に示します~

今回は、「政府統計の総合窓口」に掲載されている東証株価指数(TOPIX)を例に、時系列分析手法や各モデルでの分析結果をご説明します。

・データのご紹介 : 政府統計の総合窓口(外部サイト)

<TOPIXの統計分析>
TOPIXを変動要因、SARIMA、で分析したグラフを解説します。

~変動要因の分析結果~
Trend : リーマンショック以降は上昇傾向にあることがわかります。コロナウィルスで停滞していますが、概ね上昇傾向であることがわかります。
Seasonal : あまり変動が見られません。
Residual : 細かい変動が継続していることがわかります。リーマンショックとコロナを比較すると、リーマンショックの方が大きいことがわかります。
変動要因の分析結果
~SARIMAモデルの分析結果~
2007年2月から2022年1月までを学習して、2022年2月から2023年10月までを予測しました。概ね実測値に沿っています。実測値と予測範囲の中央と近いので、予測精度は良好と判断できそうです。
SARIMAモデルの分析結果
~状態空間モデルの分析結果~
モデルは増加傾向と予測しています。しかし、実際値と予測を比べると実際の方が大きいです。この実際の上昇は、コロナ明けで一時的なものなのか、継続的に上昇なのか、判断が難しいところです。
状態空間モデルの分析結果

まとめ

時系列分析について、実際のデータを使用して活用事例をご紹介しました。
本コラムでは紹介していませんが、Prophetなど時系列分析モデルは多種多様です。今回は過去のTOPIXを学習し未来のTOPIXを推測する単変量モデルを紹介しました。単変量モデルは特定の変数のみに着目するので、その変数の特性の理解を深める場合に有効です。実務では、TOPIXの過去と消費者物価指数を学習し、TOPIXを予測する多変量モデルを考慮する場合もあります。多変量モデルは複数の変数の相互作用を考慮して分析するため、予測精度などが高まる傾向にあります。一方で準備するデータが大量に必要であり、モデルの理解が複雑になる、といった懸念も存在します。

オージス総研は、単変量モデル、多変量モデルの傾向に応じて、適切なモデルとデータ加工のテクニックの選択と実装、サポートやアドバイスが可能ですので、お気軽にご相談ください。加えて、時系列分析に特化したハンズオントレーニングも準備しております。

詳しくは、資料をダウンロードしてご覧ください。