统计不同汉字个数及其重复次数

对我国四大名著的统计结果如下,并列出重复次数最多的前十个字:

《红楼梦》
总汉字数: 731598
不同汉字数: 4253
[('了', 21229), ('的', 15736), ('不', 15038), ('一', 12194), ('来', 11450), ('道', 11061), ('人', 10558), ('是', 10151), ('说', 9710), ('我', 9176)]

《西游记》
总汉字数: 584058
不同汉字数: 4458
[('道', 10994), ('不', 8827), ('一', 7910), ('了', 7690), ('那', 7494), ('我', 7138), ('是', 6463), ('来', 5935), ('他', 5729), ('个', 5683)]

《水浒传》
总汉字数: 705654
不同汉字数: 4074
[('了', 11459), ('道', 10433), ('一', 10029), ('来', 97[......]

阅读全文 »

浦丰投针问题的另一巧妙解法

浦丰投针问题可以根据条件概率进行计算,涉及到积分运算。在[1]的第1.1节中给出了另一种巧妙的解法,不仅使计算量大为减少,而且更加体现几何概率的思想。

令针长为L,平面上等间距相互平行垂直相交的平行线间距为D,且L<D。令X1为随机投掷到平面上长为L1的针与平行线相交的次数,当L1<D时,则X1只可取0或1(即要么不相交,要么相交)。

令pn表示针恰好与n根平行线相交的概率,且令E(X1)表示随机变量X1的期望值,则有:


对于L1<D的情形,有:


而p1正是我们所要求的针与平行线相交的概率。假如有另一根长为L2的针随机投掷,则该针与平行线相交的次数X2也是一个随机变量。随机变量X1和X2是相互独立的,除非它们焊接在一起。假如这两根针的一端焊在一起,则可以形成一根直线,或者形成一个角度,不管哪种情形,这两根针同时投掷到平面上,它们与平行线相交的次数仍然是X1+X2,此时随机变量X1和X2不再相互独立,但它们之和的期[......]

阅读全文 »

模仿苹果2013年秋季发布会邀请函

苹果于2013年秋季发布了iPhone 5S和iPhone 5C,邀请函如下:
sep_2013_event_invite

这次的苹果发布会乏善可陈,不过对于发布会的邀请函有点兴趣,用AI模仿了一下:
imitate-apple-2013-invite[......]

阅读全文 »

模仿苹果2011年秋季发布会邀请函

苹果2011年秋季发布会上发布了iPhone 4S,加入了语音助手Siri,当时的邀请函如下:
let's talk iphone
2011年的国庆假期,我去了贵州旅游,去之前用AI模仿了以上的邀请函:
Lets visit guizhou
含义是:10月2号(星期天)早上7:50在广州白云机场坐飞机去贵州玩4天。[......]

阅读全文 »

心形函数曲线

昨天是七夕,想起以前见到过的心形函数曲线。心形函数如下所示:


在www.wolframalpha.com上输入以上函数式,得到如下心形曲线:

heart
生活中一些事物,只要从另一角度来看,也能变成心形,举两个栗子:

heart1
heart2[......]

阅读全文 »

Stepping Stone Model

[1]中第11章有个例子介绍了应用于遗传学的“Stepping Stone Model”(中文似乎翻译为踏脚石模型)。在该模型中,有N×N个小格子组成的方阵,初始时每个小格子从k种颜色中等概率地随机选择一种颜色。在每一次迭代中,这N×N个小格子中的一个被随机挑选到,它的颜色等概率地变为围绕它的8个小格子中的一个,为了避免边界问题,认为在方阵最左边上的小格子是与最右边的小格子相邻,最上边的小格子与最下边的小格子相邻。经过足够多次的迭代后,最终所有格子都会变成同一种颜色,而这k种颜色最后能胜出的概率等于初始时该颜色的小格子的数目占总数(N×N)的比例。

举一个简单的例子,当N=10,k=2(黑、白)时,如果初始时这100个小格子的颜色如下图所示:two_colors_of_stepping_stone_model其中黑色的小格子有45个,白色的小格子有55个,则按照上述所说的迭代规则,最后所有格子变成黑色的概率为45/100,而所有格子变成白色的概率为55/100。

考虑赌徒破产问题,当赌徒初始有a单位财富,在每一次赌博中,他以1/2概率输掉1单位财富,以1/2概率赢得1单位财富,则他最后能赢得N单位财富的概率为a/N。以另一种角度考虑这个问题[......]

阅读全文 »

图中的“大蒜阵”,僵尸最终会死在哪一行的推车上?

这是果壳网上的一篇转载文章[1]——
zombies
这是最后一只僵尸,他啃完南瓜后将开始进入大蒜阵。假设:僵尸啃大蒜后将等概率地到相邻两行(如果在第1或5行则只能进入2或4行),並且其在某一列啃满四次后,第五次在该列啃大蒜的时候将进入相邻行的下一列,到最后一列时会被车推死。问,该僵尸死于中间那辆车下的概率。

该贴中的“文艺算法”用到了马尔可夫模型,但列出的式子有点不规范,应该如下:
$$! \begin{array}{l} S &= \begin{bmatrix} 0 & 0 & 1 & 0 & 0 \end{bmatrix} \times \begin{bmatrix} 0 & 1 & 0 & 0 & 0 \\ 0.5 & 0 & 0.5 & 0 & 0 \\ 0 & 0.5 & 0 & 0.5 & 0 \\ 0 & 0 & 0.5 & 0 & 0.5 \\ 0 & 0 & 0 & 1 & 0 \end{bmatrix}^{ 5 \times 9} \\ &= \begin{bmatrix} 0 & 0.5 & 0 & 0.5 & 0 \end{bmatrix} \end{array}[......]

阅读全文 »

LaTeX例子

本博客公式插件使用“LaTeX for WordPress”[1]。以下列举本博客常用的公式LaTeX代码,方便经常参考。

1、两条公式左对齐排列:

a)使用\begin{array}{l},其中{l}代表左对齐,还有{r}代表右对齐,{c}代表居中对齐:

b)使用\begin{align},会自动编号,且自动居中(尽管使用了行内显示),没有“&”公式会右对齐,“&”用来控制对齐的位置:


c)当有多列公式对齐时,\begin{align}使用“&”间隔每一列,以下例子有两列公式,且根据“=”[......]

阅读全文 »

斐波那契数列的通式求解

斐波那契数列[1]指的是这样一个数列:0、1、1、2、3、5、8、13、21……,每一项是其前面两项之和,即有通式:F0=0,F1=1,F2=1,Fn+2=Fn+1+Fn(n∈非负整数)。

下面通过线性代数的方法来求得斐波那契数列的通式Fn

,则可表示为,因此,。若λ1是矩阵A的特征根,相应的特征向量为x1,则有$$ {{A}^{n}}{{x}_{1}}={{\lam[......]

阅读全文 »

贝特朗悖论(Bertrand's Paradox)

贝特朗悖论:在一给定圆内所有的弦中任选一条弦,求该弦的长度长于圆的内接正三角形边长的概率。

至少有三种方法可以在一个圆上随机选择一条弦,如下:
Bertrand's Paradox
解法一:如左图,由于对称性,可预先固定弦的一端。仅当弦与过此端点的切线的交角在60°~120°之间,其长才合乎要求。所有方向是等可能的,则所求概率为1/3。此时假定端点在圆周上均匀分布。
解法二:如中图,由于对称性,可预先指定弦的方向。作垂直于此方向的直径,只有交直径于1/4点与3/4点间的弦,其长才大于内接正三角形边长。所有交点是等可能的,则所求概率为1/2。此时假定弦的中心在直径上均匀分布。
解法三:如右图,弦被其中点位置唯一确定。只有当弦的中点落在半径缩小了一半的同心圆内,其长才合乎要求。中点位置都是等可能的,则所求概率为1/4。此时假定弦长被其中心唯一确定。

这导致同一事件有不同概率,因此为悖论。

同一问题有三种不同答案,究其原因在于圆内“取弦”时规定尚不够具体,不同的“等可能性假定”导致了不同的样本空间,具体如下,其中“均匀分布”应理解为“等可能取点”:
解法一中假定弦的另一端在圆周上均匀分布,圆周上的点组成[......]

阅读全文 »