Aritalab:Lecture/NetworkBiology/Markov Chains
Wiki Top | Up one level | レポートの書き方 | Arita Laboratory |
|
ここではランダムウォークを考えるのに便利な概念を導入します。
マルコフ連鎖
離散確率過程は
を満たすときにマルコフ連鎖 (Markov chain) と呼ばれます。マルコフとはロシアの統計学者 Andrei A. Markov (1856-1922) のことで、マルコフ連鎖に関する多くの功績を残しました。状態 (state) が状態 のみに依存して決まる性質をマルコフ性 (Markov property) または無記憶性 (memoryless property) といいます。
マルコフ連鎖において状態 i から j への遷移確率を と書けば、マルコフ連鎖は遷移行列
で記述できます。[1] 遷移確率を表すので行列の行方向に足し合わせた値は必ず 1 になっており、確率行列 (stochastic matrix) と呼ばれます。もし行方向に足し合わせても 1 になる場合、二重確率行列 (doubly stochastic matrix) と呼ばれます。
記法を拡張し、i から j へ正確に m ステップで移る遷移確率を
と書きましょう。右肩にある (m) という表記は、m ステップ後という意味で m 乗ではありません。1ステップ目で移動した先を k と書くと であるから、遷移行列を m 乗すれば正確に m ステップで移った先を示す遷移行列を得ます(数学的帰納法)。また記法をそろえるために
と定義します。
チャップマン-コルモゴロフの等式
m ステップの遷移を、 s ステップと m − s ステップに分解する以下の式は、チャップマン-コルモゴロフの等式と呼ばれます[2]。
以下でも という式をよく使います。
既約
状態 i から j へ何ステップかで到達できる場合、j は i から到達可能 (accessible) と呼びます。 互いに到達可能な状態 i, j どうしを連結 (communicate) しているといい、と書きます。連結性により同値類が形成されます。
- 反射律 (reflexivity): いかなる状態 i も、
- 対称律 (symmetry): なら
- 推移律 (transitivity): かつなら
全ての状態が同じ同値類 (communication class) に属すとき、つまり全ての頂点が互いに連結なとき、マルコフ連鎖は既約 (irreducible) といいます。既約なマルコフ連鎖とは、グラフ表現すると強連結 (strongly connected) になっていて、任意の頂点から任意の頂点に移動できる場合に相当します。
また、状態集合 C は、C に属すどの状態からも C 以外の状態に抜け出せないとき、閉じている (closed) といいます。例えば、グラフ表現した際に外に出る辺をもたない状態だけからなる集合は閉じています。
- 例: 1次元のウォーク
0 と N の間を左右に1ステップずつ移動し、0, N を吸収状態とするランダムウォークを考えます。0 から N までの状態は 3 つの同値類 {0}, {1, 2, ..., N−1}, {N} に分かれ、{0, N} は閉じています。
周期性
状態 i に戻ってくるまでのステップ数が自然数 k (>1) の倍数回に限られ、しかも k がこの性質を持つ最大公約数の場合、状態 i は周期 k でといいます。 k = 1 のとき、状態は非周期的であるといいます。マルコフ連鎖の中で同じ同値類に属する (communicativeな) 状態 i, j は同じ周期をもちます[3]。
- 例:円周上のウォーク
円周上に配置された N 状態が一方向につながったマルコフ連鎖は、規約で周期 N を持ちます。遷移行列 P を N 乗すると、恒等行列 I になります。
再帰性
状態 i から出発し時刻 t になって初めて j に到達する確率をと書くことにします。 前出のは複数回 j を訪れることを許すため、となります。
再帰時間
同じ状態に初めて戻る確率 を初再帰確率 (first return probability) と呼び と定義します。状態 i は
- であれば過渡的 (transient)
- であれば再帰的 (recurrent)
と呼びます。全ての状態が再帰的であれば、マルコフ連鎖自体を再帰的と呼びます。
平均初再帰時間 MFRT
状態 i における平均初再帰時間 (mean first return time または mean recurrence time) を
と書きます。状態 i が過渡的な場合は です。
状態 i が再帰的でも が有限とは限りません。初再帰時間の期待値が有限なとき正再帰的 (positive recurrent)、そうでない場合をゼロ再帰的 (null recurrent) と呼びます。ゼロ再帰性を満たすには無限の状態数が必要です。状態数が有限 ( n 個) であれば、多くとも n + 1 ステップ目には既に訪れた状態を再び訪れます。
- 例:2 × 2 行列
以下の確率行列を持つ 2 状態のマルコフ連鎖は正再帰的です。
直感的には 2 状態の間を行き来できるため、必ず戻ってきます[4] 。
- 例:ゼロ再帰的なマルコフ連鎖
正の整数値に対応するマルコフ連鎖を仮定し、状態 i から確率 i/(i + 1) で状態 i + 1 に、確率 1/(i + 1) で状態 1 に移動するとします。
高い確率で無限遠に進んでいけるため、状態 1 に初めて戻るまでの期待値は無限大でゼロ再帰的です[5]。
通過時間、平均初通過確率 MFPT
状態 i から始めて j に最初に訪れる確率 を初通過確率 (first passage time probability) と呼び、 と定義します。平均初通過時間 (mean first passage time; MFPT) も同様に定義します。
定常分布
マルコフ連鎖の遷移行列に対して
を満たし、要素の総和が 1 、つまり となるような行ベクトルを定常分布 (stationary distribution) といいます。定常分布は PT の固有値 1 に対応する固有ベクトルともみなせます。状態数が有限の場合は 1 を必ず固有値に持つので定常分布が存在しますが、ただ一つとは限りません。
- 無限個の定常分布を持つ例
確率行列が n 次元の単位行列 I のとき、定常状態は無限にあります。固有値 λ (n個) は全て 1 で、このマルコフ連鎖は既約ではありません (reducible)。
- 定常分布を持たない例
正の整数値に対応するマルコフ連鎖を仮定し、状態 i から i, i + 1, i + 2 ... にそれぞれ 1/2, 1/4, 1/8 ... の確率で遷移するとします。各状態が非再帰的のため、定常状態 π はゼロベクトルになってしまいます。
定常分布をもつ条件
既約で再帰的、非周期的(エルゴード的)なマルコフ連鎖は唯一つの定常分布 を持ち、 再帰時間の期待値との間に
が成り立ちます。 これは再帰時間の期待値が出発する状態 j に依存しないことを意味し、再帰までのステップ数期待値が ならば状態 i に戻ってくる確率が であることに対応します。つまり各状態における存在確率は出発点に依存しません。
さらに定常分布においては、各状態に入る確率と出る確率が等しいことにも注意します。 つまり全ての状態 i, j に対し、i から
エルゴード的であれば定常分布がただ一つに定まることを証明しましょう。 仮に定常分布が二つあるとして、もう一つの分布を と書きます。 定常分布であるから
すなわちです。
参考・解説
- ↑ 状態 i から j への遷移確率を pij とする記法が主流ですが (Karlin & Taylor 1975)、Linda JS Allen (2011 2nd Ed) では j から i への遷移確率を pij と定義しています。そうすると定常分布を考える際に 以下で書くように行ベクトル π を用いて とするのではなく、列ベクトルを用いて と書けるようになります。記法上の問題であり、本質はかわりません。
- ↑
- チャップマン-コルモゴロフの等式の証明
- ↑
- 同じ同値類に属する状態の周期が等しいことの証明
- ↑
- 例:2 × 2 行列が正再帰的になることの証明
- ↑
- ゼロ再帰性の証明