2019/01/17
2020/04/14
時系列分析の基本的なモデルをわかりやすく解説
本記事では時系列分析とはどのようなものなのか、代表的な時系列モデルなどについてわかりやすく解説をしていきます。時系列分析は統計学において重要なテーマであり、統計検定やアクチュアリー試験などでも頻繁に登場します。
今回はそんな時系列分析についての理解を深めていきましょう。
時系列分析とは
まず、時系列分析とは一体なんなのでしょうか?
時系列分析とは、時間の経過に伴い変化するデータを分析することです。この時の経過とともに観察されたデータのことを時系列データと呼びます。
例えば、日によって上下する株価、年々増加する二酸化炭素濃度はどれも時系列データです。確かにどのデータも時間の経過とともに観察されていますね。他にも我々の身の回りには様々な時系列データがあふれています。
時系列データの例)
・あるコンビニの毎月の売り上げ
・年齢とともに変化する死亡確率
・音声データ
・映像データ
この記事では時系列分析を理解するために必要な時系列データの扱いに触れます。その後、複数の時系列モデルについて簡単な説明をします。
時系列データの扱い方
はじめに時系列データがどのように扱われているかについて考えていきましょう。
先ほど触れたように時系列分析は時間の経過とともにデータがどのように変化しているかを分析します。
時系列データは時間的に連続しているという特性を考慮するために特殊な変換がなされることがあります。以下では、そんな時系列データの処理について触れていきます。
原系列
時系列データは原系列とも呼ばれ、式では\( y_t \)という形で表されることが多いです。原系列の「原」は処理される前といった意味で用いられています。
差分系列、階差系列
例えば株価が一日でどれだけ変化しているかについて分析したいとします。今日の株価と昨日の株価の差を考えたくなりますね。そんな時は、時間差をとった株価のデータ\( y_t – y_{t – 1} = {\Delta}y_t \)を用いるとよいでしょう。このように、一時点前のデータとの差をとった時系列データのことを差分系列、階差系列と呼ばれます。
対数系列
対数変換された時系列データは対数系列と呼ばます。数式では\( log(y_t) \)と表します。
対数系列は、バラツキが大きすぎる時系列データを扱いやすくするために用います。
例えば、ビットコインの価格などの極端な動きをするデータに対数系列を用います。
対数差分系列
ビットコインの価格が時間によってどれだけ変化しているか、その変化率について分析したいとしましょう。そんなときに用いるのが対数差分系列です。\( {\Delta}log(y_t ) – {\Delta}log(y_{t-1} ) \)と表すこともできます。この対数差分系列は、変化率 \( \frac{ y_t – y_{t – 1} }{ y_{t – 1} } \)を近似したものとなっています。
季節調整系列
季節変動の影響を受けるデータは、季節の影響を解消するための調整が行われます。このような調整が行われたデータを季節調整系列と呼びます。
時系列データが季節の影響を受けるのは、例えば以下の二酸化炭素濃度に関するグラフを見ると納得できるでしょう。
季節によって二酸化炭素濃度がギザギザと変化しているのが見て取れます。
時系列モデルについて
ここでは時系列分析にはどんなモデルがあるかについて簡単な説明とともに紹介します。
ARモデル(自己回帰モデル)
ある時点のデータを過去のデータを用いて回帰するのがARモデルです。例えば、今日の株価を昨日の株価を用いて単回帰したモデルはARモデルです。今日の株価を昨日と一昨日の株価を用いて重回帰したモデルもまたARモデルです。
自身を過去の自分で回帰した、自己回帰とイメージすると理解しやすいのではないでしょうか。
MAモデル(移動平均モデル)
ある時点のデータが時間によって生成された乱数の線形和で表されるのがMAモデルです。今日のデータが過去に発生した複数のランダムな数の加重和になっているとイメージすると、MAモデルの雰囲気がつかめるのではないでしょうか。
詳細はMAモデルについて説明した記事で説明します。
ARMAモデル、ARIMAモデル、SARIMAモデル
ARモデルとMAモデルを組み合わせたのがARMAモデルです。ARIMAモデルでは、ARMAモデルに加えてデータの差分を取ります。SARIMAモデルは、そんなARIMAモデルに季節変動を考慮します。
ARMAモデル群はARモデル、MAモデルを組み合わせたものとして理解できるでしょう。
ARCHモデル、GARCHモデル
金融の世界では例えば株価がどのように変動するか、その変動の大きさを考えたいときがあります。このような時、時間によって変化するボラティリティ(標準偏差)の動きを表したい時用いられるのがARCH、GARCHモデルです。
状態空間モデル
「状態」と「観測値」の二つについて考える時系列モデルです。時間とともに変化する「状態」に対して、「観測値」が決まるそんなモデルとイメージするとよいでしょう。
まとめ
この記事では、時系列分析の説明から始まり複数の時系列モデルの簡単な紹介を行いました。
それぞれのモデルについての詳細については他の記事で触れたいと思います。
Recommended