正则链(Regular Markov Chains)

一个具有n个状态的马尔可夫链如果存在正整数N,使从任意状态i经过N次转移都能以大于零的概率到达状态j(i,j=1,2,...n),则称此马氏链为正则链(Regular Markov Chains)[1]

正则链的判断方法:对于概率矩阵P,若其某幂次方Pm的所有元素皆为正数,则矩阵P称为正规概率矩阵,此时马氏链称为正则链,或者称马氏链具有遍历性(Ergodicity)[2]

一个具有遍历性的马尔可夫链经过相当长的时间后,它处于各个状态的概率趋于稳定,且概率稳定值与初始状态无关。在工程技术中,当马尔可夫链的极限概率分布存在时,它的遍历性表示一个系统经过相当长时间后趋于平衡状态,这时,系统处于各个状态的概率分布既不依赖于初始状态,也不再随时间的推移而改变。

正则链的极限分布是方程组
$$! \left\{ \begin{array}{l} \pi =\pi P \\ {{\pi }_{i}}>0,\sum\limits_{j=1}^{n}{{{\pi }_{i}}}=1 \\ \end[......]

阅读全文 »

吸收马尔可夫链

在马尔可夫链中,称Pij=1的状态为吸收状态。如果一个马尔可夫链中至少包含一个吸收状态,并且从每一个非吸收状态出发,都可以到达某个吸收状态,那么这个马尔可夫链称为吸收马尔可夫链(Absorbing Markov Chains)[1]

在上图的醉汉游走模型中,当醉汉处于位置1、2或者3时,他将会以等概率(1/2)向左或者向右走,他一直走,直到他到达位置0(他的家)或者位置4(酒吧)才停止游走。这模型的转移矩阵为:

Drunkard's Walk转移矩阵

含有r个吸收状态和t个非吸收状态的吸收链,其转移矩阵的标准形式为:

DW转移矩阵标准形式

其中,I是一个r×r的单位矩阵,0是一个r×t的零矩阵,R是一个t×r的非零矩阵,Q是一个t×t的矩阵。

吸收链到达吸收状态的概率为1(即当n→∞时,Qn0)。

对于吸收链P的标准形式,矩阵I-Q具有可逆矩阵N,且N=(I-Q)-1=I+Q+Q2+···。N的元素nij是从非吸收状态si到另一非吸收状态sj的平均转移次数。设c为元素全为1的列向量c=[1,1,···,1]',则t=Nc的第i个分量是从第i个非吸收态出发,到某个吸收状态的平均转移次数。从非[......]

阅读全文 »

Data Analysis - Week 2

一、Steps in a Data Analysis
  1. Define the question
  2. Define the ideal data set
  3. Determine what data you can access
  4. Obtain the data
  5. Clean the data
  6. Exploratory data analysis
  7. Statistical prediction/modeling
  8. Interpret results
  9. Challenge results
  10. Synthesize/write up results
  11. Create reproducible code
二、Data Analysis Files
(一)Data

  1、Raw data
    -Should be stored in your analysis folder
    -If accessed from the web, include url, description, and date accessed in README
  2、Processed dat[......]

阅读全文 »

What does randomness look like?(随机是个什么玩意儿?)

V-1_cutaway

1944年6月13日,诺曼底登陆后的一个星期,一阵嗡嗡声呼啸着划破饱受战火的伦敦上空,这种响声来自当时德国发明的战争武器——V-1飞行炸弹。作为巡航导弹的前身,V-1是一种自我推进、由陀螺仪导航、通过简单脉冲式喷气发动机以每秒50次的频率吸进空气点燃燃料提供动力的飞行炸弹。由于高频率的喷气使得这种炸弹发出独特的声音,因此它有了一个绰号:“嗡嗡炸弹(buzzbombs)”。

从1944年的6月到10月,德国从法国海岸和荷兰总共发射了9521枚这种嗡嗡炸弹,其中有2419枚击中了伦敦的目标。英国人担忧这种无人驾驶战机的精确性。它们只是随机地飞过城市,还是会击中既定的目标?德国人真的发明了一种能自我导航且命中率高的炸弹吗?

幸运的是,英国人小心谨慎地统计了二战期间落到伦敦的几乎所有这种炸弹的地点和时间。根据这些数据,他们可以统计得出到底这些炸弹是随机落到伦敦还是被瞄准发射的,这是一个事关现实后果的数学问题。

想象一下,此时此刻,你供职于英国情报处,你被要求解决这个问题。某人给了你一张布满密密麻麻的点的纸,而你的任务就是判断这些点是否随机。

让我们具体一点。现在[......]

阅读全文 »

Data Analysis - Week 1

1月22日开始的Coursera课程Data Analysis第一周中介绍了一个网站OpenIntro[1],上面有一本免费的统计学教科书OpenIntro Statistics和概率分布表。

参考:
[1] http://www.openintro.org/index.php

[......]

阅读全文 »

马尔可夫链

马尔可夫链(Markov Chains)[1]是具有马尔可夫性质的离散时间随机过程。该过程在给定当前知识或信息的情况下,只有当前的状态用来预测将来,过去(即当前以前的历史状态)对于预测将来(即当前以后的未来状态)是无关的,即t+1时刻系统状态的概率分布只与t时刻的状态有关,与t时刻以前的状态无关。在马尔可夫链的每一步,系统根据概率分布,可以从一个状态转移到另一个状态,也可以保持当前状态。

设马尔可夫链从状态Pi转移到Pj的转移概率为pij,则有一步转移概率矩阵:
$$! \begin{equation} P=P(1)=\left[ \begin{matrix} {{p}_{11}} & {{p}_{12}} & \cdots & {{p}_{1j}} & \cdots \\ {{p}_{21}} & {{p}_{22}} & \cdots & {{p}_{2j}} & \cdots \\ \vdots & \vdots & {} & \vdots & {} \\ {{p}_{i1}} & {{p}_{i2}} & \cdots & {{p}_{ij}} & \cdo[......]

阅读全文 »

随机化回答—敏感性问题调查方法

当在调查时涉及敏感问题,如对被调查者询问其是否试过盗窃、发生过性行为等,采用直接发问方式时,被调查者一般否定回答或者拒绝回答。针对敏感性问题的调查方法,S.L.Warner于1965年提出随机化回答技术[1],具体操作如下:

假设需要调查试过盗窃的人数比例,则准备如下两个问题:
●问题A:你曾经试过盗窃?
●问题B:你没有试过盗窃?
设计一种手段,让被调查者能以概率PA的比例回答问题A,例如,设计一个划分为两个扇形的圆盘,在扇形上分别写上A和B,圆盘上有一指针,被调查者在调查人员不知情的情况下转动指针,若指针停在A扇形位置,则回答问题A,反之亦然;又如,被调查者在调查者员看不到的情况下抛骰子,约定当抛得点数为6时(也可以其它点数)回答问题A,抛得除6以外的其它点数时回答问题B。由于调查人员不知道指针停在哪里,或者不知道被调查者抛骰子的点数,所以无论被调查者回答“是”或“否”,调查者都不会知道被调查者回答的是哪个问题,故被调查者的隐私得到保障。

经随机抽样搜集足够资料后,调查者可以统计出回答“是”的比例为PY;另一方面,被调查者回答问题A的概率PA事先已清楚(在转盘方法[......]

阅读全文 »

Hello 2013!

向2012年努力的自己说声感谢,向2013年继续努力的自己说声加油![......]

阅读全文 »