自己回帰モデルとは

自己回帰モデルとは、時系列分析と予測に最も一般的に使用される機械学習手法で、時系列内の以前のタイムステップからの1つ以上の値を使用して回帰を作成します。

これは時系列分析のためのシンプルでありながら強力な手法であり、データにタイムステップ全体の相関関係が含まれている場合、高度に解釈可能で効果的な予測を提供します。タイムステップ間の相関は、値がそれ自体にどの程度相関しているかを示す尺度であるため、自己相関と呼ばれます。純粋に線形なプロセスは時系列全体でそれ自体と完全に自己相関するため、自己回帰過程を使用して前の値から次の値を正確に予測することが可能になります。ホワイトノイズのような完全に確率的な過程は、過去の値を用いて現在または将来の値を予測することができないため、自己相関はありません。

時系列とは、同じ変数または変数のグループの、時間の経過に伴う一連の測定値のことです。測定は通常、1時間ごと、毎月、1年ごとなど、等間隔で行われます。一例として、毎月観察された国または地域の航空乗客数を測定する値があるとします。この場合、y は測定された乗客数を表し、時間の経過に伴う測定値の存在を強調しています。t の値は、ytが任意の時点で_yの値を表すことを示すために、通常のiではなく添え字として適用されます。

自己回帰モデルとは、時系列の値を同じ時系列の以前の値に回帰させることです。例えば、y_t-1に対するy _t回帰は、遅延値と呼ばれるyの以前の値を使用して、yの現在の値を予測します。この単純な回帰モデルでは、前の期間の従属変数が予測変数になっています。誤差は、単純な線形回帰モデルの誤差に関する通常の仮定をすべて表しています。自己回帰の次数は、現在の値の予測に使用された系列内の先行する値の数と見なすことがよくあります。したがって、_y _t-1上のyt回帰は、AR(1)と書かれる一次自己回帰です。

自己回帰の定義

多重線形回帰では、回帰の出力は複数の入力変数の線形結合です。自己回帰モデルでは、出力は過去のp個のデータポイントの線形結合として表される将来のデータポイントです。pは、方程式に含まれる遅延の数です。AR(1)モデルは、数学的に次のように定義されます。

$x_{t} = δ + ϕ_{1} x_{t - 1} + α_{t}$

x_t-1は、1遅延してからの過去の系列値

φはその遅延について計算された係数

_アルファはホワイトノイズ（ランダム性など）です

デルタは次のように定義されます

$δ = (1 - \sum_{p}^{i = 1} ϕ_{i}) μ$

次のpの自己回帰モデルの場合、pは遅延のために計算された共変量の総数、μはプロセス平均です。

モデルにさらに遅延が追加されると、方程式に係数と遅延変数が追加されます。

$x_{t} = δ + ϕ_{1} x_{t - 1} + ϕ_{2} x_{t - 2} + α_{t}$

前のモデルは、2つの遅延を含むため、2次の自己回帰です。

次数pの自己回帰方程式の一般形は次の通りです

$x_{t} = δ + ϕ_{1} x_{t - 1} . . . ϕ_{p} x_{t - p} + α_{t}$

時系列予測に自己回帰モデルを使用するには、現在の時間値と過去のデータを使用して次の時間ステップを予測します。例えば、2つの遅延があるARモデルは、次のように1つのタイムステップの前進を予測する可能性があります

$x_{t + 1} = δ + ϕ_{1} x_{t} + ϕ_{2} x_{t - 1} + α_{t + 1}$

信頼の統計ソフト「IBM SPSS Statistics」で実践

SPSS Statisticsは、学術研究などデータの統計的正しさを求められる場面において最適な、業界標準の統計ソフトです。高度な手法をノーコードの直感的な操作で実行でき、生成AIが結果の解釈をサポートします。「出力結果」はそのまま論文や報告書に使うことができます。まずは無料評価版でご体験ください。

係数の推定

各遅延を計算するための最も一般的なアプローチは、最尤推定（MLE）または最小二乗推定（OLS）を使用する係数です。同じ制限が線形モデルの回帰を適合させる際にこれらのアプローチに生じるのと、自己回帰モデルを適合させるときにも存在します。Python、R、およびライブラリーのどちらを使用しているかによっては、MLEまたはOLSに加えて、Yule-Walker法またはBurg法を使用できる場合があります。

多くのライブラリーでは、ユーザーがすべての候補モデルからモデルを選択する際に使用する基準を選択できます。例えば、モデル係数を使用して、ユースケースとデータに応じてAkaike情報基準またはベイズ情報基準を最小化することもできます。

ARモデルの次数の選択

自己相関は、時系列とそれ自体の遅延バージョンとの相関を計算します。遅延（ラグ）は、時系列をシフトする時間単位の数です。遅延1は、1つの前のタイムステップの時系列と比較されます。遅延2は、そのさらに1つの前のタイムステップと比較されます。特定の遅延における自己相関の度合いは、データの時間依存性を示します。自己相関が高い場合は、現在の値とその遅延の値の間に強い関係があります。自己相関が低いかゼロに近い場合は、関係が弱いか、まったく関係がないことを示唆します。

自己相関を可視化する一般的なアプローチは、自己相関関数（ACF）またはACFプロットを計算して、さまざまな遅延での自己相関係数を表示することです。

横軸は遅延を表し、縦軸は自己相関値を表します。ACFプロットの重要なピークやパターンにより、データの基礎となる時間構造を明らかにすることができます。ARモデルの遅延次数（p）の選択は、多くの場合ACFプロットの分析に依存します。AR（p）モデルでは、時系列の現在の値は、OLSまたはMLEによって決定される係数を使用して、過去のp値の線形結合として表されます。自己相関は、時系列が定常的かどうかを評価するためにも使用されます。定常時系列の場合、遅延が増えるにつれて自己相関は徐々に減少しますが、ACFプロットが減少を示していない場合は、データに非定常性が含まれている可能性があります。自己相関の詳細については、こちらをご覧ください。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

自己回帰モデルのバリエーション

標準的な自己回帰時系列モデルには、その課題や欠点に対処するさまざまなバリエーションがあります。

ベクトル自己回帰モデル

単純な自己回帰統計モデルは、単変量データ・セット（データ・セットには各期間について必ず1つの値が含まれている）で機能します。ベクトル自己回帰モデル（VAR）は、多変量時系列の自己回帰を可能にするために開発されました。これらは、各変数がそれ自体の過去の遅延と他の変数の過去の遅延の線形関数になるように構成されています。例えば、飛行機の月間搭乗回数と都市間鉄道の月間乗車回数という2つの異なる測定値で構成される時系列があるとします。VARモデルでは、両方を使用する場合の予測値を、他方の値を含むそれぞれの回帰によって求めることができます。鉄道乗車をX_rとし、飛行機搭乗をX_aとしてエンコードすると、次のようになります。

$x_{t, r} = α_{r} + ϕ_{11} x_{t - 1, a} + ϕ_{12} x_{t - 1, r} + ϵ_{t, r}$

$x_{t, a} = α_{a} + ϕ_{11} x_{t - 1, a} + ϕ_{12} x_{t - 1, r} + ϵ_{t, a}$

ARMAとARIMA

単純な自己回帰モデルでは、強い傾向がある時系列で問題が発生することがあります。自己回帰モデルの2つの一般的なバリエーションは、自己回帰移動平均（ARMA）モデルと自己回帰和分移動平均（ARIMA）モデルです。これらのバリエーションは、データに強い傾向がある場合に特に役立ちます。移動平均モデリングは、時系列データを予測するもう1つのアプローチであり、ARIMAはこれら2つのアプローチの和であるため、「和分」という名前が付けられています。ARIMAモデルにはバリエーションもあります。最も一般的な拡張の1つは、データが多変量である場合に使用される、ベクトルARIMA（VARIMA）です。もう1つの一般的な拡張は、データに強い季節性が含まれている場合の、季節性ARIMA（SARIMA）です。ARIMAモデルの詳細については、こちらをご覧ください。

自己回帰条件付き分散不均一性

自己回帰モデルは、時系列データが定常で、時系列全体の分散が変化しない場合に、はるかに信頼性の高いパフォーマンスを発揮します。多くの場合、非定常データにはまず時間差をつけて分散の変化を除去し、それからARモデルを当てはめます。その分散に意味があり、データサイエンティストがデータをそのままにしておくことを希望するという場合もあります。自己回帰条件付き不均一性（ARCH）手法では、ボラティリティーの増減のような時間依存性のある時系列での分散の変化をモデル化できます。このアプローチの、一般化自己回帰条件付き不均一性（GARCH）として知られる拡張では、時間依存のボラティリティーの変化をサポートできます。例えば、同じ時系列でのボラティリティーの増減などをサポートできます。

時系列分散の変化に非確率的プロセスがある場合、自己回帰条件付き不均一性（ARCH）アルゴリズムは自己回帰手法を使用して、データ・セットのボラティリティーの変化をモデル化し、予測できます。通常の自己回帰モデルでは、データ・セット全体の分散の変化はモデル化されません。このため、データサイエンティストは、ボックス・コックス変換を使用してデータ・セットの分散を低減することがあります。ただし、分散の変化が自己相関である場合、モデリングのARCHアプローチによって、プロセスが変化し始める時期を予測できます。このアプローチはボラティリティー予測として知られ、計量経済学や財務分析では一般的に使用されています。例えば、株価データを扱う場合には、株価が劇的に変化し始めると、株価の可能性のモデル化から予測にまで関心が広がっていく可能性があります。

IBMお客様事例

お客様のビジネス課題（顧客満足度の向上、営業力強化、コスト削減、業務改善、セキュリティー強化、システム運用管理の改善、グローバル展開、社会貢献など）を解決した多岐にわたる事例のご紹介です。

自己回帰のその他の応用

自己回帰モデルは一般的には時系列データに関連付けられますが、異なるタイプのデータを使用する他のモデリングでも応用できます。

自然言語処理

自己回帰モデリング手法は、文字シーケンスの出現可能性を生成し、例えば予測テキストで次に出現する文字や単語を提案します。自己回帰言語モデルは、文字列内の前の文字が指定された場合に、次に出現し得る文字や単語それぞれの可能性を計算します。「ネズミの好物は」と入力した場合に、ある程度の量の文章を学習してきたモデルであれば、「宿題です」よりも「チーズです」に高い確率を割り当てるでしょう。この確率は、自己回帰プロセスが言語モデルで、文字列内の前のすべての文字や単語を使用してそれぞれの文字や単語に割り当てます。

空間データ

自己回帰原理の別の応用として、値の位置をシーケンスとして使用し、関心対象とする位置のすべての関連位置を回帰することができます。一例として、工場からの距離が空気品質の測定値に影響を与えるのではないかと考えたとします。自己回帰モデルでは、他のサイトからの測定値を遅延値として使用し、工場からの距離を遅延として使用できます。

共同執筆者

Joshua Noble

Data Scientist