刊名: 教育研究
Educational
Research
主办: 中国教育科学研究院
周期: 月刊
出版地:北京市
语种: 中文;
开本: 16开
ISSN: 1002-5731
CN: 11-1281/G4
邮发代号:
2-277
投稿邮箱:jyyj79@126.com
历史沿革:
现用刊名:教育研究
创刊时间:1979
该刊被以下数据库收录:
中国人文社会科学引文数据库(CHSSCD—2004)
核心期刊:
中文核心期刊(2008)
中文核心期刊(2004)
中文核心期刊(2000)
中文核心期刊(1996)
中文核心期刊(1992)
伯努利场合的中心极限定理及其相关应用
【作者】 张 骉
【机构】 重庆西南大学数学与统计学院
【摘要】伴随着社会的日益发展,中心极限定理正广为人们所重视。本文主要讨论了伯努利场合下的中心极限定理及其相关应用。本文从理论和实例两个方面说明了正是因为伯努利场合的普遍性,决定了中心极限定理在社会生活中的大量运用。然后从正态分布的导出出发,探讨了其与二项分布之间存在的本质联系,解释了为何正态分布在一定条件下能够精确地描绘二项分布。紧接着,我们讨论了它的相关应用。在探讨中心极限定理应用时引入了概率论的另一个重要分布——泊松分布。通过在理论和实际两个场合对泊松逼近与正态分布的逼近进行对比发现,其各自适用的范围,以及彼此存在联系。最后通过探究了生活中比较典型的例子,说明了中心极限定理在社会生活中的广泛应用。【关键词】伯努利场合;中心极限定理;正态分布;泊松分布
1. 问题的提出
1.1 问题的发展动态与现状
概率论是一门研究随机现象数量规律的学科。它的产生起源于对随机对弈游戏的研究。先是于1654年,法国数学家帕斯卡与费马就机会博弈中的一些问题作了通信讨论,后来惠更斯也加入了研究。其后,在对伯努利概型进行深入研究中,发现了两种形式的极限定理——大数定理和中心极限定理,奠定了概率论在数学中的理论地位。另一方面,正是由于伯努利于1717年发表的第一篇概率论论文,其中证明了当n→∞是频率un/n依概率收敛于某个固定的常数,即假设P(A)=p>0,则对任何给定的ε>0,
limP{|■-p|≥ε}=0 (1)
概率论的发展才向前大大迈进了一步,足以看出极限定理对于概率论而言开创性的意义。紧接着,1801年,作为古典概率大师的拉普拉斯,证明了在伯努利情形下,对于标准化的随机变量
?灼n=■ (2)
其极限分布是正态分布,即
limP{?灼<x}=■■e-t2/2dt (3)
形如(3)的收敛于正态分布的极限定理的研究,在长达两个世纪的时期内成了概率论研究的中心课题,因此在上世纪20年代有波利亚命名为中心极限定理。紧接着,随着量子力学的创立和分子遗传学的发展,人们认识到了无论是物理现象还是生命现象都维系着随机性,在人类生活中充满着不确定性,因此长期统治学术界的机械决定论迅速溃退,概率论也迎来了复兴与大发展的新世纪。
1.2 研究的必要性与意义
正如恩格斯所指出的,表面上是偶然性在起作用的地方,这种偶然性始终是受内部屏蔽着的规律支配的,而问题只是在于发现这些规律。而人们在经历长期实践后发现,对于随机事件,尽管个别事件在某次实验中可以出现也可以不出现,但是在大量重复试验中却呈现出明显的规律性,即一个随机事件出现的概率在某个固定数的附近摆动,这就是概率论所研究的核心之一——频率稳定性。
事实表明,多次测量同一物体,其结果虽略有差异,但当测量次数增加时,就会越来越清楚地呈现出一些规律性:测量值的平均值在某个固定常数附近波动,诸测量值在此常数两旁的分布呈现某种对称性。这就体现了随机现象有其偶然性的一面,也有其必然性的一面。而中心极限定理,正式对这一现象给予理论上的说明。
受于篇幅限制,本文仅限于对伯努利试验场合的中心极限定理进行讨论,这已足够为我们揭露大量实例的本质。下文若不加注解,所指的中心极限定理都只是针对伯努利场合而言的。
2. 中心极限定理
2.1 伯努利分布
2.1.1.伯努利概型
在研究中心极限定理之前,我们首先要探讨它研究的大环境——伯努利试验。为此,我们必须先明确伯努利试验的相关概念。
我们将事件域取为?灼-{?准,A,A,Ω},并称出现为“成功”,出现事件为“失败”。这种只有两种可能结果的试验成为伯努利试验。一般而言,我们更加关注的是重伯努利试验,其满足如下的四个约定:
(1)每次试验至多出现两个可能结果之一:或A;
(2)A在每次试验中出现的概率p保持不变;
(3)各次试验相互独立;
(4)共进行n次试验。
前面已经提到,在以伯努利试验作为研究背景的基础上,中心极限定理仍具有其普遍性。这很大程度上来源于,伯努利试验,其作为一种非常重要的概率模型,有着广泛的实际应用。接下来我们就要对此作进一步的探讨。
2.1.2伯努利试验的相关分布
从理论上来讲,伯努利试验具有广泛实际应用的一个基础就在于,几乎所有常见的离散型随机变量的分布都可以由它推出。
设进行重复独立试验,设每次试验成功的概率为P,失败的概率为q=1-p(0<p<1)。
(1)将试验进行一次,以X1表示成功的次数,求X1的分布律。
解 X1服从参数为p的伯努利分布,即
p{X1=k}=pkq1-k,k=0.1 (4)
(2)将试验进行n次,以X2表示成功的次数,求X2的分布律。
解 X2服从参数为n,p的二项分布,即
p{X2=k}=Cnkpkqn-k,k=0,1,2,…,n (5)
(3)将试验进行到出现一次成功为止,以X3表示所需试验的次数,求X3的分布律。
解 设第k次首次成功,则前k-1次都失败,X3服从参数为p的几何分布,即
p{X3=k}=pqk-1,k=1,2,… (6)
(4)将试验进行到出现r次成功为止,以X4表示所需试验的次数,求X4的分布律。
解 设总共试验次数k次,则第r次成功,前k-1有r-1次成功,X4服从参数为r,p的负二项分布,即
p{X4=k}=Ck-1r-1prqk-r,k=r,r+1,… (7)
(5)进行试验共计N次,其中M(M≤N与N有关)次成功,从中任选n(n<N)次试验,以X5表示所含试验成功的次数,求X5的分布律。
解 X5服从参数为n,M,N的超几何分布,与p无关,即
p{X5=k}=■,k=0,1,2,…,n. (8)
(6)将试验进行n次,以X6表示成功的次数,设在一次试验中成功的概率为pn(与试验总数n有关),假定n→∞时,npn→λ,求X6的极限分布律。
解 X6的极限分布服从参数为λ的泊松分布,记λn=npn,则λn→λ,从而
limP{X6=k}=limCnkpnk(1-pn)n-k=■,k=0,1,2,…. (9)
由于这些分布的产生都是以伯努利试验为基础的,将伯努利试验看成产生上述离散型随机变量的源头,不难得到这些分布之间的关系。鉴于本文主要是为了研究中心极限定理,我们就在此强调一下其中三者的联系,其他的就不在一一赘述。它们分别是二项分布,泊松分布与正态分布,其构成了概率论最重要的三大分布。在工科的应用中,当n很大p很小,同时保持np适中时,一般采用泊松分布逼近计算二项分布,当n很大p也很大时,则一般采用正态分布对二项分布进行逼近。这里只是粗略地说明一下,两种逼近的原理以及各自的运用范畴我们将会在后面的内容中予以详细讨论。
2.1.3伯努利试验的相关应用
通过前面的论述我们知道,伯努利试验几乎涵盖了所有离散型随机分布,甚至在满足一定条件时,可以转化到诸如正态分布这类连续性分布的计算上。有了这一理论认识,生活中大量概率问题都可以尝试使用伯努利概型进行解决。而对于实际应用问题,我们首先应做模型转化,尝试套用熟悉的概率模型以达到我们想要的结果。
鉴于离散型的伯努利概型在生活中已经被运用得相当广泛,我们就此针对非离散型的伯努利概型加以讨论。
我们来研究无穷伯努利试验中的一个连贯问题。
考虑一个无穷伯努利试验,例如投掷一颗骰子无穷多次。设甲乙两个赌徒打赌:甲掷骰子,若甲能连续掷出5次“六点”后又连续掷出2次“非六点”,则甲获胜,否则则乙获胜。设甲可以投掷骰子无穷多次,考察甲获胜的概率是多少。
对于这样的问题,我们还是先进行模型转换。“甲获胜”这一事件可以理解为,如果接连“成功”(单次试验A发生)α次得连贯发生在接连“失败”(单次试验A发生)β次的连贯之前。显然其属于无穷伯努利试验序列,其对应的样本空间并不是离散的。因此为了求得甲获胜的概率,我们可以利用概率的下连续性。
先假设在第n次试验过后甲或者获胜或者失败,或者不分胜负。假设其对应的概率分别为xn,yn,zn,显然成立
xn+yn+zn=1 (10)
而当试验次数n增加时,甲获胜的概率xn和甲失败的概率yn一定上升,此时不分胜负的概率zn只能下降,因此存在
x=limxn,y=limyn,z=limzn (11)
而x,y,z即为甲最后获胜、失败或胜负不分的概率。
在此,先来讨论更为一般的场合。可令A表示“接连成功α次得连贯发生在接连失败β次得连贯之前”这一事件,显然,A发生就意味着甲获胜,从而有x=p(A),再令u,v分别表示“第一次试验成功”与“第一次试验失败”的条件下事件A的条件概率,于是有
x=pu+qv (12)
接着,设第一次试验的结果为成功,于是事件A可以如下α种互不相容的方式发生,在此将其分为两类来描述:
(1)紧接在后面的α-1次试验的结果都是成功,其对应的概率为Pα-1。
(2)第一次失败发生在第k次试验,其中2≤k≤α,令这一事件为Wk,于是有
p(Wk)=pk-2q (13)
而p(A|Wk),利用加法原理,即可得
u=pα-1+qv(1+p+…+pα-2)=pα-1+v(1-pα-1) (14)
在第一试验结果为失败的情形下,类似的方法可以推得
v=pu(1+q+…+qβ-2)=u(1-qβ-1) (15)
联立(14),(15)式,我们可以解得u,v,再将其带入(12)式即得
x=pα-1■ (16)
利用对称性,只需将(16)式中的p,q;α,β互换位置,即可得相应y的表达式,即
y=qβ-1■ (17)
由(16),(17)式相加即得
x+y=1 (18)
对应(10)式可得,z=0。换言之,部分胜负的概率为0.
综上所述,令p=1/6,q=1/6,α=5,β=2,代入(16)式即可得甲获胜的概率趋近于0.00015.这个概率是相当小的。可见即便是让甲一直掷骰子下去,这场赌局对甲而言也是不利的。
上述例子充分显示了伯努利概型的普遍性。这也是为何伯努利场合的中心极限定理在概率论中占有主要地位的原因。生活中的大量实例,都可以通过模型转化,将其归为伯努利概型,从而为后续使用中心极限定理奠定基础。
2.2 正态分布
在之前我们已经探讨了中心极限定理的大背景——伯努利场合,正是由于伯努利概型在日常生活中广泛的适用性,决定了中心极限定理同样具有大量实际应用。这里我们有必要浅谈一下中心定理的另一个优点——精确性,这个精确性正是体现在使用正态分布对次伯努利试验进行逼近。由此我们需要对概率论中最重要的分布——正态分布,进行一定的探讨。
正态分布的重要性的其中一方面就在于它的常见性,可以说无论是数理统计中的抽样分析,还是各种参数估计中都可以见到正态分布的应用。中心极限定理也被视为正态分布的主要应用之一。
鉴于本文主要是为了研究中心极限定理,作为逼近次伯努利试验的两大分布之一,另一个是利用泊松分布进行逼近,正态分布的部分性质我们将在随后作为对比泊松逼近与正态逼近精确性时进行详细地探讨。因此在这里,我们首先研究正态分布的导出,一方面为接下来的内容做铺垫,一方面有助于我们更加了解中心极限定理。
正态分布源于高斯关于测量误差的研究。在测量中,若u为真值,xi为观察值,而xi-u误差的分布密度函数p(xi-u)。经验表明p(x)关于x=0对称,而且对一切x成立p(x)>0。为推到方便起见,还可假设p(x)具有连续导数。
如果有独立同分布的观察值x1,x2,…,xn,可得其似然函数为
L(u)=■p(xi-u) (19)
它表示出来这组观察值落在u的附近的可能性的大小。假定:观察值的平均值
x=■(x1+x2+…+xn) (20)
作未知参数u的估值使L(u)达到最大。
基于以上假设,设x是似然函数L(u)达到最大值,对应的,我们可以构造
F(u)=lnL(u) (21)
显然成立
■|u=x (22)
记■=g(x),则显然有g(x)=■,又由假设知其是连续函数,这是(22)式可以写为
■g(xi-x)=0 (23)
当n=2时,方程(23)化为
g(x1-x)+g(x2-x)=0 (24)
由于x1-x=-(x2-x),以及x1,x2的任意性得到g(-x)=-g(x)对一切实数x成立。
当n=3时,方程(23)化为
g(x1-x)+g(x2-x)+g(x3-x)=0 (25)
由于x1-x=-[(x2-x)+(x3-x)],同样可得对一切实数x,y成立
g(x)+g(y)=g(x+y) (26)
记?蕊(x)=eg(x),则方程(26)可化为
?蕊(x)?蕊(y)=?蕊(x+y) (27)
由于该方程对一切实数x,y成立,且?蕊(x)是连续函数,因此由数分中相关引理可得?蕊(x)=ax,a≥0,从而可得
g(x)=(lna)x (28)
为了以后表达方便,这里令b=lna,因此有
(lnp(x))'=bx (29)
进一步通过积分运算得
■(lnp(t))'dt=■btdt (30)
in(p(x)/p(C1))=■(31)
p(x)=p(C1)e e (32)
记b=-■,K=(C1)e ,则
p(x)=Ke ,-∞<x<+∞ (33)
最后由规范化条件■p(x)dx=1求得K=■,故最终得
p(x)=■e ,-∞<x<+∞,(34)
由此推得了正态分布。
整个推导过程中,除去后面利用数分理论知识,我们可以从中看到正态分布许多实质性的东西。
由(19)式可以看出,整个推论的前提假设是每一个密度函数为p(xi-u)的分布是相互独立的,并用n个这样的分布密度函数连乘得到误差的似然函数。这两条性质与之前我们曾提到的,伯努利试验四个约束条件中的(3),(4)有很大的相似之处。一定程度上,我们可以构建这样一个“类似伯努利”概型:即每次试验相互独立,且每次试验中,事件Ai在每次试验发生的概率P(xi≤ξ<xi+△xi)=p(xi-u)△xi,求重复进行n次试验的概率。求上述概型的概率等价于对随机变量ξ1,ξ2,…,ξn,其彼此相互独立,求它在一个一维博雷尔点集的概率。由随机变量独立性,即得
P{xi≤ξi<xi+△xi,i=1,2,…,n}=■P(xi≤ξi<xi+△xi)≈■p(xi-u)△xi, (35)
由之前的整个推到过程知道,(35)式最后的推倒结果是其服从正态分布。换言之,我们可以说,上面构造的“类似伯努利”概型其实是服从正态分布。倘若将上述“类似伯努利”概型的条件稍作修改,将“事件在Ai每次试验发生的概率P(xi≤ξi<xi+△xi)=p(xi-u)△xi”改为“事件在每次试验发生的概率为一个定值p”,这就是一个标准的伯努利概型了。换言之,当伯努利概型满足“一定条件”时,其可以修改为“类似伯努利”概型,进而服从正态分布。这也就解释了之前提出的为何正态分布可以准确地逼近n重伯努利试验,因为正态分布本身的由来就与之存在紧密联系。上述提到的n重伯努利试验到n重“类似伯努利试验”的转换正是我们接下来所要探讨的中心极限定理的主要内容。
2.3 棣莫弗-拉普拉斯极限定理
有了前面相关内容的铺垫,我们可以在这里直接给出n次伯努利试验中的中心极限定理,即棣莫弗—拉普拉斯定理:
若un是n次伯努利试验中事件A出现的次数,0<p<1,则对任意有限区间[a,b]:
(1)当a≤xk=■≤b以及n→∞时,一致地有
P{un=k}÷(■□■e ) (36)
(2)当n→∞时,一致地有
P{a≤■<b}→■?渍(x)dx (37)
其中?渍(x)=■e (-∞<x<∞).
关于一般情况的中心极限定理,即独立同分布的大数定理,其证明的方法有很多种。从最初切比雪夫使用母函数法证明,再到后来引入各种矩法实行证明,诸如切比雪夫矩法、马尔可夫矩法等,以至最后李亚普洛夫引入特征函数这一突破性的概念加以证明。可以说,关于中心极限定理的证明所带来的革新与进步就代表了整个概率论的发展史。至于其特殊情况,即我们这里探讨的在n重伯努利试验中的中心极限定理,也有许多相关的证明,由于本文主要是为了研究中心极限定理及其应用,这里就不再多探究其具体的证明过程了。
3. 中心极限定理的应用
3.1 泊松分布与正态分布
3.1.1泊松分布的导出
从前面的内容中,我们已经对中心极限定理有了较为深刻的了解。了解了它能精确描述概率分布的同时,还大量的出现于生活实例中。接下来,为了能更深刻地体会这一点,我们着重探讨中心极限定理在实际生活中的应用。在这里我们特将它与二项分布的泊松逼近作对比研究。
泊松分布作为概率论中最重要的三大分布之一,与正态分布、二项分布有着同等重要的地位。不仅广泛地应用于社会生活与物理现象之中,它许多特有与有趣的性质也是人们对其备受重视的原因。这里我们主要探讨的,就是泊松分布关于二项分布的泊松逼近。一方面,考虑到中心极限定理也是针对n重伯努利试验而言,这里难免会将它与正态分布的逼近作一个比较,两者逼近的条件有何不同,哪个更为精确,都是我们希望考察的内容。另一方面,泊松分布本身也可以看作是因为二项分布满足“一定条件”时而导出的,这与我们之前对正态分布的研究十分相似。因此,我们首先来看泊松分布的由来,也即是泊松定理及其相关证明。
假设在独立试验中,以pn代表事件A在试验中出现的概率,它与试验总数n有关,若记λn=npn,且假设有
λn=npn→λ (38)
则有
b(k;n,pn)=Cnkpnk(1-pn)n-k
=■{■}k{1-■}n-k
=■{1-■}{1-■}…{1-■}{1-■}n-k (39)
由于对固定的k有
limλnk=λk, (40)
由函数的连续性又可得
lim(1-■)n-k=e-λ (41)
又有
lim{1-■}{1-■}…{1-■}=1 (42)
将(40),(41),(42)式代入(39)式即得
limb(k;n,pn)=■e-λ (43)
而所求得到的
p(k;λ)=■e-λ,k=0,1,2… (44)
正是我们需要研究的泊松分布。
从上面整个推到过程来看,除去使用的数分相关知识,最重要的假设显然是(38)式。显然,这也就是能够实现泊松逼近的最重要条件之一。与中心极限定理的前提条件相对比,泊松逼近也要求n→∞,即是说,两者都要求独立重复的试验次数相当大。不同的是,泊松逼近还有(38)式作为前提。由于伯努利试验中,每次试验事件A所发生的概率为恒定的p,若要保证λ=np,且其中的参数λ不会因为太大或太小而对计算造成不便。后面我们将会用实例说明,当λ过大时,整个逼近是完全不可行的。自然这里对P的值肯定有进一步的要求。根据相关文献说明,对于泊松分布而言P<0.1,而n又足够大时,适宜采用泊松逼近。相较之下,中心极限定理似乎只要求n足够大,就能够保持良好的逼近。但经过试验证明,若要使用正态分布逼近,n重伯努利试验的概率p还是不应该太大或太小。为了对这结论更直观的说明,我们接下来将直接使用实例进行探讨。
3.1.2泊松分布与正态分布的相关应用
我们通过数理统计假设检验的例子,对二项分布的泊松近似与正态近似的逼近条件有更深刻的理解。
某并用药的治愈率为95%,改进剂型后治疗200人,治愈了198人。评估改进剂型能否增进疗效。
我们首先使用泊松近似对其进行评估。设改进剂型后治愈人数为,原假设与备择假设分别为
H0:λ=λ0=0.95×200=190,H1:λ>λ0=190,
由于α=0.05,则有
u=(x-λ)/■=(198-190)/■
=0.584<1.645=Uα, (45)
故不能否定H0,即认为改进剂型对增进疗效没有显著意义。
接下来我们在使用另一种方法考察这个问题。设改进剂型的治愈率为?字,则原假设与备择假设分别为
H0:?字=?字0=0.95,H1:?字>?字0=0.95
又有α=0.05,
U=|P-?字|/■
=|0.99-0.95|/■
=2.596>1.645=Uα(46)
故否定H0,接受H1。认为改进剂型对增加治愈率有显著意义。
可以看出,两种方法对得到了不同的结论。事实上,第一种方法得出的结论并不有效,原因还是在于二项分布的泊松近似条件不满足,这里的P=0.95要远远大于0.1。而第二种方法中,二项分布较好地满足了正态近似条件,自然会得到更为有效的结论。
单从上面的一些例子中可以看出,相较于泊松逼近,中心极限定理适用的范围更令人满意一些,至此,我们也对这类极限定理有了更深入的了解。
3.1.3 泊松分布与正态分布之间的关系
前面已经提到了二项分布在满足一定条件时,可以被泊松分布与正态分布逼近,并对各自适用的条件进行了一定的探讨。这里我们联想到,是否泊松分布与正态分布之间本身就存在着逼近。联系前面电站电网的例子,我们猜测,当泊松分布的参数足够大时,泊松分布能够有效的逼近正态分布。查阅相关文献后,我们得到了以下的结论。
设ξ服从参数为λ的泊松分布,则当λ充分大时,有
limP{■≤x}=■■e dt (47)
我们可以通过探讨关于这个结论的证明得到我们想要的结论。
设ξ1,ξ2,…为独立切服从参数为λ0的泊松分布,即
P(ξi=k)=■e-λ0,k=0,1,2,… (48)
因为E(ξi)=λ0,D(ξi),i=1,2,…,n,
故由独立同分布的的中心极限定理有:对任意x,有
limP{■≤x}=■■e dt (49)
再令ξ=■ξi,λ=nλ0,又由泊松分布的再生性,即得所求结论。
从上面的证明过程中明显可以看出,当泊松分布的参数λ较大时可以使用正态分布近似逼近。换言之,以后在处理重伯努利试验时,对二项分布而言,当λ=np较小或者适中时,我们可以利用泊松分布进行逼近;当λ=np较大时,我们则选用正态分布对其进行近似的计算。这样,就能保证最后得到较为准确的逼近结果。
3.2 中心极限定理在生活中的应用
基于之前对中心极限定理详细的探讨,我们已经对它的由来,准确性,普及性以及使用范围有了较为深刻的理解。最后,我们还是回归现实,一起来探究关于一个利用中心极限定理的例子,这正是我们在文章开头就已经提到的高尔顿板。关于高尔顿板的具体概念我们就不在这里做赘述,人们往往惊异于为何重复多次向高尔顿板投入小球,小球落入后累计成的高度曲线会与正态分布密度函数曲线十分相似。这是一个反映频率稳定性的著名例子,接下来我们将利用中心极限定理,对高尔顿板反映出的现象作出理论解释。
首先,做模型转换。事实上,可以将高尔顿板看作是伯努利试验的一个实验模型。如果我们把小球碰到钉子看作是一次试验,而把从右边落下算作是成功,反之从左边落下就算是失败,这是就有了一次p=■的伯努利试验。如果小球从顶端到底层共需要经过排钉子,这就相当于一个n次伯努利试验。紧接着我们引入随机变量,对于小球碰到第i排钉子这一事件用随机变量ui来表示。当小球碰到钉子后往右边下落时,令ui=1;当小球碰到钉子后往左边下落时,令ui=0。显然ui服从伯努利分布。再将整个落球这个过程用随机变量ξ表示,由于小球从上一排下落到下一排这个过程是相互独立的,显然有
ξn=u1+u2+……+un(50)
即说明了ξn是服从二项分布的。
记事件A为小球碰到钉子后向右方落下,显然ξn的值等同于n次伯努利试验中事件A出现的次数。记?鬃n=■=■,当小球落入最下方一排正中间一格时,意味着途中向左落下和向右落下的次数是相等的,即是说有ξn=■。当ξn=■时,?鬃n=0。换言之,当小球最后落入第n排正中间一格时,有?鬃n=0。依此类推,可以令小球落入第n排的每一格的情况与?鬃n的值一一对应,赋值的方法就如之前所陈述的一样。如此就可以构造出一条实数轴,其关于?鬃n=0对称,当n→∞时,这条实数轴上的每一个实数点就对应着小球落入一个空格的情况,又依照棣莫弗拉普拉斯定理得,?鬃n实际上时服从标准正态分布的。这也就说明了为什么多次往高尔顿板中投入小球后,由小球累计而成的高度曲线会逼近与正态分布密度函数曲线。利用中心极限定理,可以更有助于我们发现现象的本质。
4. 问题的延伸
从前面的讨论中我们已经看到了中心极限定理的各种优越性与适用性,但本文所探讨的中心极限定理始终都只关乎于伯努利试验场合的。难免会让人提出疑问,类似的极限定理是否在其他场合也同样适用?这个回答是肯定的,对于相互独立同分布的情形,我们可以讲之前的中心极限定理进行推广。得到了著名的林德伯格—莱维中心极限定理。
若ξ1nξ2,…是一串相互独立相同分布的随机变量序列,且
Eξk=μ,Dξk=δ2 (51)
并且其随机变量和
ξn=■■(ξk-μ) (52)
在0<δ2<∞的前提下,我们有结论
limP{ξn<x}=■■e dt (53)
这一定理将中心极限定理推广到了更一般的情形,社会生活中对它的使用也更加广泛。在数理统计和分析证明中都有大量使用,实际上,我们再之前证明正态分布对泊松分布进行逼近时,已经用到了这个定理。
由于本文主要是探讨伯努利试验下的中心极限定理,关于这里独立同分布场合的极限定理,我们再这里只是做一个简要的介绍,不再做详细的讨论。
参考文献:
[1]蔡东汉. 概率论简史[J]. 华中师范大学学报(自然科学版),1990. 24(4).
[2]周德强. 用伯努利试验研究离散随机变量的分布[J]. 高等数学研究,2009.12(1).
[3]刘心乐,刘小琼. 从伯努利试验说起[J]. 科技信息,2008.(24).