斯特林公式的概率证明

斯特林公式[1]是用来求n阶乘的近似值,公式如下:


该公式的一种概率证明方法如下[2]。令X1,X2,...,Xn是独立的泊松分布随机变量,均值都是1,令,则Sn的均值和方差都是n。
$$!\begin{array}{l} P\{{{S}_{n}}=n\}=P\{n-1[......]

阅读全文 »

单位区间[0 1]里随机分布n个点

在数轴上的区间[0 1]上有两个随机点A和B,它们的坐标服从[0 1]上的均匀分布,即X1~U(0,1),X2~U(0,1)。则此两点间距离的数学期望是多少?

两点间的距离X = |X1-X2| = max{X1,X2} - min{X1,X2}。令Y = max{X1,X2}, Z = min{X1,X2},两者的累积分布函数为:

F(Y) = P(Y≦y) = P(X1≦y & X2≦y) = P(X1≦y) × P(X2≦y) = y×y = y2

F(Z) = P(Z≦z) = 1-P(Z≧z) = 1-P(X1≧z & X2≧z) = 1 - P(X1≧z) × P(X2≧z)
= 1 - (1-z)×(1-z) = 1-(1-z)2

两点坐标值的最大值与最小值的概率密度函数分别为:

f(Y) = F'(Y) = 2y , f(Z) = F'(Z) = 2(1-z)

则两点坐标值的最大值与最小值的数学期望分别为:

E(Y) = yf(Y)dy = 2y2dy[......]

阅读全文 »

收集与调和级数

Collecting Coupons: Coupons in cereal boxes are numbered 1 to 5, and a set of one of each is required for a prize. With one coupon per box, how many boxes on the average are required to make a complete set?

这是《Fifty Challenging Problems in Probability with Solutions》书中的第14个题目[1]。在第一个盒子中,我们得到其中一个数字,在下一个盒子中得到另一个数字的概率为4/5,根据《Trials Until First Success》讨论的结果,得到第二个新的数字平均需要1/(4/5)=5/4个盒子,第三个数字平均再需要1/(3/5)=5/3个盒子,第四个数字需要5/2个盒子,第五个需要5/1个盒子。因此,平均需要的盒子总数为:

5(1/5 + 1/4 + 1/3 + 1/2 +1) ≈ 11.42

一般地,对于有[......]

阅读全文 »

生日问题(Birthday Problem)

生日问题[1-2]是指在随机选择的一群人当中有两人的生日相同的概率。如果一个房间里有23个或23个以上的人,那么至少有两个人的生日相同的概率要大于50%;对于60或者更多的人,这种概率要大于99%。计算与此相关的概率被称为生日问题,在这个问题之后的数学理论已被用于设计著名的密码攻击方法:生日攻击。

假设有n个人在同一房间内,不考虑特殊因素,例如闰年、双胞胎,并且假设一年365日出生概率是均匀分布的。首先计算每个人的生日日期都不同的概率为:


则有两个人在同一日出生的概率为:
$$! \begin{equation} \label{Pn365} \begin{array}{l} p(n,365)=1-\overline{p(n,365)}=1-\frac{A_{365}^{n}}{{{365}^{n}}}=1-\frac{365!}{{{365}^{n}}(365-n)!} \\ =1-\frac{3[......]

阅读全文 »

傅里叶变换动画演示

傅里叶变换动画演示

Fourier_series_for_square_wave

图1:http://www.oschina.net/code/snippet_936379_18947
图2:http://goo.gl/B21UPx

[......]

阅读全文 »

最佳奖品问题、麦穗问题、相亲问题、炮灰模型、秘书问题—最优停止理论

在读Ross的《Introduction to Probability Models》时[1],有个例子的原理被广泛讨论——

(最佳奖品问题) 假设我们可以从一系列先后宣布的n个不同的奖项中选取一个,在一个奖项宣布后我们必须立刻决定是接受还是拒绝转而考虑随后的奖项。我们只能根据该奖项与前面已经宣布的奖项的比较决定是否接受它。就是说,例如,当第5个奖项宣布时,我们知道它与前面已经宣布的4个奖是如何比较的。假设拒绝了一个奖就失去了这次机会,我们的目标是使得到最佳奖的概率达到极大。假定奖项的所有n!个次序都是等可能的,我们该怎样做?

 选定一个k,0≦k≦n,同时考虑前k个都拒绝并接受此后第一个比前面k个更好的策略,将使用此策略选到最佳奖的概率记为Pk(best)。为了计算它,对最佳奖项的位置X取条件,得出

Pk(best)=Pk(best|X=i)P(X=i)=Pk(best|X=i)

现在,如果最佳奖项在前k个奖项之中,那么用所考虑的策略[......]

阅读全文 »

连续抛掷一枚出现正面的概率为p的硬币

一、首次出现正面时抛掷次数的平均值E(N)。

令Y=1表示第一次掷硬币的结果是正面,Y=0表示第一次掷硬币的结果是反面,则:

E(N) = E(N|Y=0) × P(Y=0) + E(N|Y=1) × P(Y=1)
=[1 + E(N)] × (1-p) + 1×p
=1 + (1-p) × E(N)

所以:E(N) = 1/p

另一种方法是使用吸收马尔可夫链,以硬币处于正面的状态为吸收状态,易得标准形式的转移矩阵为:


则有:N = (I-B)-1 = [1-(1-p)]-1 = 1/p

即初始为反面时,平均还需要掷1/p次才能得到正面,则有:

E(N) = (1-p)(1+1/p) + 1×p = 1/p

二、首次出现连续k次正面的抛掷次数的平均值E(Nk)

很明显,由第一问可知:E(N1) = 1/p

求解首次出现连续2次正面的抛掷次数的平均值:

1、当第1次掷到反面时,平均需要1+E(N2)次;
2、当[......]

阅读全文 »

Data Analysis - Week 4

Basic Least Squares

fit a line

abline() - This function adds one or more straight lines through the current plot.

Inference Basics

A one inch increase in parental height is associated with a 0.77 inch increase in child's height (95% CI: 0.42-1.12 inches).

P-values

[crayon-664a[......]

阅读全文 »

Data Analysis - Week 3

一、Exploratory Graphs
  • boxplot() - Produce box-and-whisker plot(s) of the given (grouped) values. Parameter formula such as y ~ grp means y is a numeric vector of data values to be split into groups according to the grouping variable grp (usually a factor).
  • barplot(height, ...) - Creates a bar plot with vertical or horizontal bars.
  • hist(x, ...) - Computes a histogram of the given data values.

  • plot() - For more details about the graphical parameter[......]

    阅读全文 »

Trials Until First Success

On the average, how many times must a die be thrown until one gets a 6?

这是《Fifty Challenging Problems in Probability with Solutions》书中的第4个题目[1],书中给出了两种解法。

方法一:

设p为在一次掷骰子中得到6的概率(很明显,p=1/6),令q=1-p。则首次掷到6的概率分布为:

次数 概率
1 p
2 pq
3 pq2
· ·
· ·
· ·

平均次数则为:

m = p + 2pq + 3pq2 + 4pq3 + ···

上式[......]

阅读全文 »