马尔可夫链的平稳分布
一个平稳分布的马尔可夫链是随时间推移在马尔可夫链中保持不变的概率分布。通常,它被表示为行向量 哪个条目的概率总和是 ,鉴于转移矩阵 ,它满足
换句话说, 是不变的的矩阵 。
各态历经的马尔可夫链有一个独特的平稳分布,并且吸收马尔可夫链只在吸收态具有非零元素的平稳分布。平稳分布给出了关于稳定在某些情况下,描述了马尔可夫链的极限行为。
一位体育播音员希望预测有多少密歇根居民更喜欢密歇根大学(University of Michigan,简称“Michigan”)的球队,又有多少人更喜欢密歇根州立大学(Michigan State)的球队。她注意到,年复一年,大多数人都会选择自己喜欢的团队;然而,对于 很多密歇根的球迷转投了密歇根州立大学 密歇根州的球迷转到了密歇根州。然而,该州1000万人口的偏好总体上没有明显差异;换句话说,密歇根的体育迷似乎已经达到了一个固定的分布。那是什么呢?
解决这个问题的一个合理的方法是假设有 百万密歇根球迷 一百万密歇根州球迷。这个州的人口是 百万,所以 。这些数字每年都不会改变。由此可见, 重新安排要么方程, 。自 , 和 。所以有 百万密歇根球迷 一百万密歇根州球迷。也就是说,平稳分布是 。
请注意,限制分布并不取决于球迷的数量在州!
找到固定的分布
的学生线性代数可以注意到方程 和列向量方程很相似 为特征值和特征向量, 。实际上,通过转置矩阵, 换句话说就是转置的转移矩阵 特征向量有特征值吗 用列向量表示的平稳分布。因此,如果特征向量 是已知的,那么带转移矩阵的马尔可夫链的平稳分布也是已知的吗 。简而言之,平稳分布是转移矩阵的一个左特征向量(与通常的右特征向量相反)。
当有多个特征向量与1的特征值相关联时,每个这样的特征向量都产生一个相关联的平稳分布。然而,这只会发生在马尔可夫链是可约的情况下,即有多个通信类。
在遗传学上,识别显性性状的一种方法是将一个样本与一个已知的杂种配对。它们的后代再次与已知的杂交后代配对,以此类推。这样,某一特定后代在某一性状上是纯显性、纯隐性或杂种的概率如下表所示。
州 孩子占主导地位 孩子混合 儿童隐性 父母主导 父母混合 父母隐性 马尔可夫链的平稳分布是什么?
转移矩阵为 这个矩阵的转置具有满足这个方程的特征值 由此可见, 。特征值是 , , 。特征值 得到特征向量 的特征值 得到特征向量 ,和特征值 得到特征向量 。平稳分布的唯一可能候选是最终特征向量,因为其他所有特征向量都包含负值。
那么,平稳分布一定是 。
与极限分布关系
的极限分布马尔可夫链的概念试图描述过程的行为长时间后。为了使它存在,下列极限对于任何状态都必须存在 和 : 此外,对于任何国家来说 ,下面的和必须是 : 这确保了所获得的数字实际上构成了一个概率分布。如果满足这两个条件,则有 概率分布是 。
对于任何非周期且不可约的时齐次马尔可夫链, 收敛到所有行相等的矩阵 。然而,并非所有的平稳分布都是这样产生的。某些平稳分布(例如,某些周期性分布)只满足较弱的平均数条件 过程处于状态的时间 在第一个 步骤逼近平稳分布对应的值。也就是说,如果 那么,是平稳分布吗
不是所有的平稳分布都是极限分布。
考虑带转移矩阵的双状态马尔可夫链 作为 增加,没有限制的行为 。实际上,表达式只是在求值和 和 ,单位矩阵。但系统具有平稳分布 ,因为 不是所有的平稳分布都是极限分布。有时不存在限制分布!
对于时齐次马尔可夫链,任何极限分布都是平稳分布。
设马尔可夫链有转移矩阵 。然后,假设 也就是说,极限是an 矩阵的所有行都等于 。然后注意 检查左边矩阵的一行在右边相乘,很明显 。因此,极限分布也是一个平稳分布。