Skip to content

Markov Chain

Markov Chain的基本性质

定义

  • Markov Chain是一类特殊的随机过程,时间参数空间为连续或者离散集,但是状态空间至多是可数集

  • \(X=(X_n,n\geq 1)\)\(Markov-Chain\)的充要条件是

    • \[\forall n\geq 0,\forall i,j,\forall i_0,i_1\cdots,i_{n-1:}\]
    • \[P(X_{n+1}=j|X_n=i,X_{n-1}=i_{n-1},\cdots,X_0=i_0)=P(X_{n+1}=j|X_n=i)\]
  • \(p_{n;ij}=P(X_{n+1}=j|X_n=i)\),则\(p_{n;ij}\)为Markov Chain在 \(n\) 时刻存状态 \(i\) 转化到状态 \(j\) 的概率,特别的如果\(p_{n;ij}\)与 n 无关,那么称\(X\)是(时间)齐次马尔科夫链

  • \(P=(p_{ij})_{n\times n}\)为状态转移矩阵

Markov-Chain的分布

  • 定义:\(P_k(i)=P(X_k=i)\),\(i.e.P_k(i)\)为Markov Chain在 \(k\) 时刻状态为 \(i\) 的概率 \(p_k=(P_k(1),P_k(2),\cdots,P_k(n))\)为Markov Chain在 \(k\) 时刻的分布

    • \(p_0=(P_0(1),P_0(2),\cdots,P_0(n))\)为初始分布,初始分布和状态转移矩阵完全决定了Markov Chain的分布

    • 容易得到\(p_n=p_0P^n\)

    • \[P(X_0=i_0,X_1=i_1,\cdots,X_n=i_n)=P(X_0=i_0)P(X_1=i_1|X_0=i_0)\cdots P(X_n=i_n|X_{n-1}=i_{n-1})\]
      • \[=p_0(i_0)p_{i_0i_1}p_{i_1i_2}\cdots p_{i_{n-1}i_n}\]

m-步转移概率

  • \(p_{ij}^{(m)}=P(X_{n+m}=j|X_n=i)\),则\(p_{ij}^{(m)}\)为Markov Chain在\(n\)时刻从状态\(i\)经过\(m\)步转化到状态\(j\)的概率

    • \(P^{(m)}=(p_{ij}^{(m)})_{n\times n}\)\(m\)步转移矩阵
    • \(P^{(m)}=P^m\),左边是\(m\)步转移矩阵,右边是状态转移矩阵的\(m\)次方
    • \(P^{(m+n)}=P^{(m)}P^{(n)}\),即\(p_{ij}^{(m+n)}=\sum_{k=1}^np_{ik}^{(m)}p_{kj}^{(n)}\)称为Chapman-Kolmogorov方程

状态空间分解

类似群作用的轨道

互通类

  • 称状态\(i\)可到达状态\(j\),如果存在\(n\geq 0\)使得\(p_{ij}^{(n)}>0\),记作\(i\rightarrow j\)
  • 约定\(p_{ii}^{(0)}=1,p_{ij}^{(0)}=0,i\neq j\)

  • 定义:状态\(i\)和状态\(j\)互通,如果\(i\rightarrow j\)\(j\rightarrow i\),记作\(i\leftrightarrow j\)

    • 互通是等价关系,将状态空间分解为互通类.满足:

      • 对称性:\(i\leftrightarrow j\implies j\leftrightarrow i\)
      • 传递性:\(i\leftrightarrow j,j\leftrightarrow k\implies i\leftrightarrow k\)
      • 自反性:\(i\leftrightarrow i\)
    • 状态空间中的互通类是不相交的,且互通类的并是整个状态空间

    • 如果初始状态在某个互通类中,那么以后的状态都在这个互通类中
    • 如果任意两个状态是互通的,就称这个Markov链是不可约的

周期

  • \(d_i=\gcd\{n\geq 1:p_{ii}^{(n)}>0\}\)称为状态 \(i\) 的周期,如果\(d_i=1\),则称状态i是非周期的,否则称状态 \(i\) 是周期的

    • \(p_{ii}^{(n)}>0\)表示状态i在n步之后又回到了状态 \(i\)

引理 1

  • \(d_i=d\)那么\(\exists N>0,s.t.\forall n\geq N\):
    • \[p_{ii}^{(nd)}> 0\]
    • 特别的如果\(d=1\),那么也就是\(p_{ii}^{(n)}>0\),换句话说,从非周期状态出发,经过充分多次后,总有可能返回该状态

定理 4.1

  • 如果\(i \leftrightarrow j\),那么\(d_i=d_j\)
  • 互通的元素有相同的周期

状态空间分解

  • 给定状态\(j\),令\(T_j=\inf\{n\geq 1:X_n=j\}\),即\(T_j\)是Markov Chain第一次到达状态j的时刻

    • 约定:\(\inf\emptyset=+\infty\),即如果Markov Chain永远不会到达状态j,那么\(T_j=+\infty\)
    • \(X_0=j\) 时, \(T_j\) 表示首次回到状态 \(j\) 的时刻,不然表示首次到达状态 \(j\) 的时刻
  • 如果\(P(T_j<\infty |X_0=j)=1\),也就是说在有限的时间内一定会回到状态 \(j\) ,那么称 \(j\) 是常返状态

    • 如果\(E(T_j|X_0=j)<\infty\),那么称\(j\)是正常返状态
    • 如果\(E(T_j|X_0=j)=\infty\),那么称\(j\)是零常返状态
  • 如果\(P(T_j<\infty |X_0=j)<1\),那么称\(j\)是瞬时状态

[!NOTE] 如果 \(p_{ii}>0\), 那么 \(i\) 一定在一个常返状态类里面,至少 \(i\in C\)

定理 4.2

  • 如果\(i\leftrightarrow j\),那么:

    • \(i\)是瞬时状态\(\iff j\)是瞬时状态
    • \(i\)是常返状态\(\iff j\)是常返状态
    • \(i\)是正常返状态\(\iff j\)是正常返状态

    这表明常返性和瞬时性都是"类性质"

定理 4.3

  • \(i\)是常返的,那么\(C_i=\{j:i\leftrightarrow j\}\)是闭集

[!NOTE] 这里的关键在于 \(i\) 一定要是常返的, 如果不是, 那么 \(C_i\) 不一定是闭的

定理 4.4(状态空间的分解)

  • \(\mathcal{E} = C_1+\cdots+C_m+\mathcal{N}\),其中\(C_1,\cdots,C_m\)是常返类,\(\mathcal{N}\)是瞬时状态全体,\(m\)可以取无穷

    不同常返状态等价类是不相交之闭

常返性与瞬时性

  • \(T_j=\inf\{n\geq 1:X_n=j\}\),令\(f_{jj}^{(n)}=P(T_j=n|X_0=j)=P(X_1\neq j,\cdots,X_{n-1}\neq j,X_n=j|X_0=j)\)

  • \(j\)是常返状态\(\iff\sum\limits_{n=1}^{\infty}f_{jj}^{(n)}=1\)

  • \(j\)是瞬时状态\(\iff\sum\limits_{n=1}^{\infty}f_{jj}^{(n)}<1\)
    • 常返状态\(j\)的平均返回时间为\(\tau_j=E(T_j|X_0=j)=\sum\limits_{n=1}^{\infty}nf_{jj}^{(n)}\)

定理4.5

  • \(j\)是常返状态\(\iff\sum\limits_{n=1}^{\infty}p_{jj}^{(n)}=\infty\)

    • 推论:\(j\)常返时:\(\forall i\in\mathcal{E}\)\(i\to j\):

      • \[\sum\limits_{n=1}^\infty p_{ij}^{(n)}=\infty\]
    • \(i\not\to j\):

      • \[\sum\limits_{n=1}^\infty p_{ij}^{(n)}=0\]
  • \(j\)是瞬时状态\(\iff\sum\limits_{n=1}^{\infty}p_{jj}^{(n)}<\infty\)

    • 而且有\(\sum\limits_{n=1}^{\infty}p_{jj}^{(n)}=\frac{1}{1-f_{ii}}-1\)
      • \(\sum\limits_{n=0}^{\infty}p_{jj}^{(n)}=\frac{1}{1-f_{ii}}\)
      • reference
    • 推论:\(j\)瞬时时:\(\forall i\in\mathcal{E}\):
      • \[\sum\limits_{n=1}^\infty p_{ij}^{(n)}<\infty\]

[!NOTE] 若\(i\leftrightarrow j\),并且为常返状态,那么\(f_{ij}=1\),不然与常返性矛盾

定理 4.6

  • 如果\(j\)是瞬时状态,那么
  • \[\lim\limits_{n\to\infty} p_{jj}^{(n)}=0\]
  • 如果\(j\)是零常返状态,那么
  • \[\lim\limits_{n\to\infty} p_{jj}^{(n)}=0\]
  • 如果\(j\)是非周期正常返状态,那么
  • \[\lim\limits_{n\to\infty} p_{jj}^{(n)}=\frac{1}{\tau_j}\]
  • 如果\(j\)是周期为\(d_j\)的正常返状态,那么
  • \[\lim\limits_{n\to\infty} p_{jj}^{(n)}=\frac{d_j}{\tau_j}\]
    • 综合来看,只要\(j\)是常返状态,那么\(\lim\limits_{n\to\infty} p_{jj}^{(n)}=\frac{d_j}{\tau_j}\)
    • 如果对瞬时状态也定义平均返回时间\(\tau_j=+\infty\),那么\(\lim\limits_{n\to\infty} p_{jj}^{(n)}=\frac{d_j}{\tau_j}\),对所有的状态都成立

推论 4.1

  • 如果\(j\)是零常返或者瞬时状态,那么对任意状态\(i\),有
  • \[\lim\limits_{n\to\infty} p_{ij}^{(n)}=0\]
  • 如果\(j\)是非周期正常返状态,那么对任意状态\(i\),有
  • \[\lim\limits_{n\to\infty} p_{ij}^{(n)}=\frac{f_{ij}}{\tau_j}\]
    • 其中\(f_{ij}\)为从\(i\)出发可到达\(j\)的概率

定理 4.7

  • 有限 Markov 链一定存在正常返状态

定义

  • \(M_j=\#\{ n\geq 0:X_n=j \}\)表示状态\(j\)的访问次数

定理 4.8

  • 如果\(j\)是常返状态,那么
  • \[P(M_j=\infty|X_0=j)=1\]
  • 如果\(j\)是瞬时状态,那么
  • \[P(M_j=\infty|X_0=j)=0,(P(M_j<\infty|X_0=j)=1)\]

平稳 Markov 链

极限分布

  • 若存在\(\mathcal{E}\)上的一个概率分布\(\mu,s.t.,\forall j \in \mathcal{E}\)
  • \[\lim\limits_{n\to\infty} p_n(j)=\mu(j)\]
    • 则称\(\mu\)为Markov Chain的极限分布
  • 极限分布的存在性

  • \(\mu_j = \sum\limits_{i=1}^{N}p_0(i)\nu_{ij},j\in\mathcal{E}\),其中\(\nu_{ij}=\lim\limits_{n\to\infty}p_{ij}^{(n)}\),则\(\mu=(\mu_1,\cdots,\mu_n)\)是Markov Chain的一个极限分布
    • 实际上\(\mu_j=\lim\limits_{n\to\infty}p_{ij}^{(n)}\)

平稳分布

  • \(X\)是强平稳\(\iff (X_m,X_{m+1},\cdots,X_{m+n})\overset{d}{=}(X_0,X_1,\cdots,X_n),\iff p_0=p_1=\cdots \iff p_0=p_0P\)
  • 从而取\(p_0\in \{\pi:\pi P=\pi\}\),就得到平稳\(Markov\)
  • 求解方程组
    • \[\begin{cases} \sum\limits_{i=1}^{N}\pi_{i}p_{ij}=\pi_j&j=1,2,\cdots ,N, \\ \sum\limits_{i=1}^{N}\pi_i=1 \\ \pi_i\geq 0\end{cases}\]

定理 4.9

  • 假设\(X\)是非周期不可约(任意状态之间互通)Markov 链,转移概率矩阵为\(P\),那么该 Markov 链存在平稳分布当且仅当每个状态都是正常返的,并且
  • \[\pi_j = \frac{1}{\tau_j},j\in\mathcal{E}\]
  • 其中\(\tau_j=ET_j\)为状态\(j\)的平均返回时间

推论 4.2

  • 假设\(X\)是非周期不可约Markov 链,转移概率矩阵为\(P\),那么该 Markov 链存在极限分布当且仅当存在平稳分布,且二者相等

    • 非周期不可约 Markov 链的极限分布等同于平稳分布

可逆 Markov 链

定义 4.10

  • 如果对任意的\(m\geq 0,M\geq m\),有
    • \[(X_M,X_{M-1},\cdots,X_m)\overset{d}{=}(X_0,X_1,\cdots,X_{m})\]
    • 那么称\(X\)是可逆 Markov 链
  • 如果\(X\)是可逆 Markov 链,那么
    • \[X_M\overset{d}{=}X_0\]
    • 也就是说它一定是平稳的

定理 4.10

  • 假设平稳分布\(\pi\)存在,并选择\(\pi\)作为初始分布,那么\(X\)是可逆的当且仅当
    • \[(X_0 ,X_1) \overset{d}{=} (X_1,X_0)\]
    • \[\pi_i p_{ij}=\pi_j p_{ji},\forall i,j\in\mathcal{E}\]

[!NOTE] 现在验证一个Markov链是否可逆,需要验证定理4.10的条件,但是这需要计算平稳分布(这需要使用概率转移矩阵计算),有没有直接从概率转移矩阵判断的方法?

定理 4.11

  • 假设\(X\)是不可约平稳Markov链,转移概率矩阵为\(P\),那么\(X\)是可逆的当且仅当

    • \(p_{i_0,i_1}p_{i_1,i_2}\cdots p_{i_{m-1}i_0}=p_{i_m,i_{m-1}}p_{i_{m-1},i_{m-2}}\cdots p_{i_1,i_0}\)

    • 例:2 状态不可约平稳Markov链一定是可逆的

连续时间Markov链

  • \(X=(X(t),t\geq 0)\)是连续时间随机过程,状态空间\(\mathcal{E}=\{1,2,\cdots,N\}\)\(\forall 0\leq s<t,\)

    • \[P(X(t)=j|X(s)=i,X(u)=i_u,u\leq s)=P(X(t)=j|X(s)=i)\]
    • 那么称\(X\)是连续时间Markov链
    • \(p_{ij}(s;t)=P(X(t)=j|X(s)=i)\),若\(p_{ij}(s;t)\)仅与时间差\(t-s\)有关,那么称\(X\)是齐次的
      • 此时记\(p_{ij}(t)=P(X(t)=j|X(0)=i),p_t(i)=P(X(t)=i),P(t)=(p_{ij}(t))_{n\times n}\)
  • 假设\(p_{ij}(t)\)是关于\(t>0\)的连续函数,并且有

    • \(\lim\limits_{t\to 0}p_{ij}(t) = \begin{cases} 1 & i=j \\ 0 & i\neq j \end{cases}\)
  • 称满足上述假设的的转移概率矩阵族\(\{P(t),t\geq 0\}\)称为是 标准的