认证主体:徐**(实名认证)
IP属地:湖北
下载本文档
1、 第七章 应用统计方法应用统计方法包括概率论与数理统计两个部分,其中概率论是研究随机(或偶然)现象的统计规律性,数理统计是研究随机数据的收集、整理、分析和推断的方法。统计方法在科学研究与工程技术中具有广泛的应用:如,面对大量的信息与数据,如何分析处理,找出数据反映的规律和模型;在研制一种新产品时,影响产品的性能与质量的因素非常多,如何科学的安排试验,才能找出影响性能的主要因素以及它们的数量关系,以降低成本,缩短研制时间;工厂每天生产一大批产品,如何进行质量管理与控制,如何预测未来产品的销售量等等。数理统计将为这些问题提供具有启发性的思维方法与强有力的工具。第一节 常用的随机变量与统计量(1-2
2、)1随机变量及其分布11随机变量 随机变量是概率论中的一个重要概念,所谓随机变量就是随试验结果不同而能取不同值的变量,由于试验结果的随机性,故取值具有随机性,称其为随机变量。 通常用大写字母X,Y,Z等表示随机变量,而用小写字母x,y,z等表示随机变量相应于某个试验结果的值,又称随机变量的观测值。随机变量与实数间虽然没有“自然”的联系,但可以人为地给它们建立起一个对应关系。 引入随机变量后,随机试验中各个事件就可以通过随机变量的取值表达出来,如“在n重伯努利试验中事件A出现的次数不超过2”的事件可用X£2表示;再如,在抽查新生婴儿性别的试验中“抽到男婴”的时间可用Y=1表示。下面给随
3、机变量一个确切的定义: 定义:设随机试验E的样本空间为W,若存在一个函数X=X(w),对于每个,均有唯一确定的实数X(w)与之对应,则称X=X(w)为一个随机变量。 对于随机变量,我们主要讨论离散型随机变量和连续型随机变量两大类。12离散型随机变量的概率分布 在有些试验中,随机变量可能取到的值是有限个或可列无限个,这类随机变量通常称为离散型随机变量。例1:设一实验箱中装有标号依次为-1,2,3,3,4五个形状完全相同的白鼠,从中任取一只,则取到白鼠的标号X是一个随机变量,它能取到-1,2,3,4四个值,它究竟取到哪个值,要随试验结果而定,故X是一个离散型随机变量。例2:从一批次品为10%的产品
4、中逐渐抽取产品(有放回的),直到抽到次品为止,所需的抽取次数Y是一个随机变量,它能取可列无穷多个值,所以Y也是一个离散型随机变量。 再如n粒种子的发芽数,n尾鱼苗的成活数均为离散型随机变量。 对于离散型随机变量,我们除关心它取什么值之外,还应该搞清楚,它以多大的概率取这些值,即要了解其取值规律。 通常用表格来描述随机变量X的取值规律,此表称为离散型随机变量的概率分布或分布率。一般的设随机变量X的所有可能取值为(k=1,2,3,), X取这些值的概率,即事件PX=xk=pk, 则其概率分布为:XP 其中pk(k=1,2,3,)满足条件:1) pk³ 0 (k=1,2,3,);2)只有p
5、k满足上述两个条件时,才能成为离散型随机变量的分布;如例1的离散型随机变量的概率分布分别为:X-1234P例2的离散型随机变量的概率分布分别为:Y123kP0.10.9*0.1(0.9)2*0.1(0.9)k-1*0.1 离散型随机变量的分布有两点分布、二项分布、泊松分布、超几何分布。下面分别进行介绍。121 两点分布定义: 设随机变量X只能取0,1两个值,且P(X=1) = p, P(X=0) = 1- p ( 0 < p < 1)。即其分布律为:X10Pp1-p 则称X服从参数为p的两点分布或0-1分布。记作X0 1分布。 例;从装有6只白球和4只红球的口袋中任取一球,用X表示
6、“取到的白球数”,即X=1;表示取到白球; X=0; 表示取到红球;P (X=1) = 0.6 P ( X=0 ) = 0.4一次试验只有两种可能结果的概率分布都可用两点分布来描述。如在射击中只考虑“命中”与“未命中”;对产品进行检验时,只关心产品“合格”与“不合格”等,都可用两点分布来研究。122 二项分布定义:若随机变量X的分布为 其中0<p<1, 则称X服从参数为n,p的二项分布,又称伯努利分布,记作XB(n,p)考虑二项分布: 按二项式展开,它的第k项为 ,当q=1-p时上式特别当n=1时,二项分布即化为两点分布,这时, 例3:某小麦品种在田间出现自然变异植株的概率为0.0
7、045, 今调查100株,试计算获得两株和两株以上变异植株的概率。解:用A表示“该株小麦出现自然变异”的事件,而用表示“该株小麦不出现自然变异”的事件。用X表示所调查的100株中出现自然变异的株数,显然XB(100, 0.0045)。于是获得两株和两株以上变异植株的概率其中故有例4:有2500名从事某种职业的职工参加人寿保险,根据资料统计,这类人在一年内的死亡率为0.002。参加保险者当年向保险公司付12元保险费。若参加保险者死亡,家属可获得2000元补偿,试求下列事件的概率。(1)一年中保险公司亏本;(2)一年中保险公司获利不少于1万元;(3)一年中保险公司获利超过2万元。解:保险公司的年收
8、入为30000元,在不考虑这笔保险金的利息的收入和保险业务的各项支出的情况下来考虑上述三个问题。 用X表示一年中参加保险死亡人数,显然 故解(1):若保险公司亏本,必须使X>15,故 (查泊松分布表,l=np=5) 结果表明,保险公司一年中亏本的概率很小,几乎是不可能的。解(2):若公司获利不少于1万元,必须满足故解(3):获利超过2万元,即满足 X< 5 以上计算中用到下列Poisson近似公式来计算的近似值;其中:123泊松分布定义:若随机变量X的分布为 其中,则称X服从参数为的泊松分布,记为。泊松分布作为二项分布的近似,是法国数学家泊松于1837年引入的。在实际生活中,有很多
9、随机变量服从泊松分布。如田间出现变异植株的株数、牧草种子中的杂草种子数、某段时间内放射性物质所放射的粒子数等,均可用泊松分布来描述。泊松分布是描述在一定空间(长度、面积和体积)或者在一定时间间隔内点子的散步状态的理想化模型。例5:麦田中,平均每10平方米有一株杂草,现在问每100平方米麦田中无杂草、有一株杂草、以及有5株以上杂草的概率各为多少?解:该问题是研究一定面积内杂草散步状态的,而一定面积内的杂草株数服从泊松分布。现求每 100平方米 麦田中平均杂草数(这里是泊松分布中参数的最佳估计,即)由此可以得出,每100平方米麦田中有x株杂草的概率 x=0时,得到每100平方米麦田中无杂草的概率x
10、=1时,得到每100平方米麦田中有1株杂草的概率而有5株以上杂草的概率为124 超几何分布 定义:若一个随机变量X的分布规律为: 则称X服从超几何分布,记为有N件产品,K件次品,抽取n件,出现x件次品的概率;分析:N件产品中,抽取n件的所有情况为 在n件产品中出现x件次品的所有情况为 在考察野生动物时,常常需要了解野生动物种群的大小,一种常用的方法是,先捕捉一定数量的动物,作上记号,放回到原群体中。然后,再捕捉第二个样本,记下其中有标记的动物数。根据以上资料可以估计该群种的大小。原理是;在捕捉第二个样本时,捉到有标记的动物数,是一个服从超几何的随机变量;再依据超几何分布的平均数,就可以估计该群
11、种的大小。N为种群所含个数的总体,K为有记号的个体数,n为第二次抽样中抽出的个体数,x为容量为n的样本中(即第二次抽样中)有标记的个体数。可以证明,超几何分布的平均数(或称数学期望)如下:于是可以得出估计该群种大小的公式:1 3连续型随机变量及其分布密度前面研究的离散型随机变量的取值只限于有限或可列无穷多个值,具有很大的局限性,在许多随机试验中,如测量某种无线电元件的寿命、观测某品种小麦的株高等,它们的取值充满某个区间。对于这类可以在某个区间或整个数轴上取值的随机变量,由于其取值不是集中在有限个或可列无穷多个点上,所以不能象离散型随机变量那样通过建立概率分布来描述它们。我们只有掌握了X取值落入
12、某个区间的概率,才能真正了解随机变量X的取值规律。 定义: 对于随机变量X,若存在非负可积函数使对于任意实数a, b(a<b)均有: 则称X为连续型随机变量,称为X的分布密度或称为概率密度。 分布密度与概率分布有类似的性质:(1)f(x)³0;(2) 例6: 设连续型随机变量X的分布密度为试求:(1)常数k; (2)P(1<X<3) ; P(X<1)解(1) 由分布密度的性质得; (2)(3)下面介绍几种常见的连续型分布。131 均匀分布定义: 若随机变量X的分布密度为则称X在区间a,b上服从均匀分布,记作显然:(1)(2)若X在区间a,b上服从均匀分布,则对
13、于任意满足a<c<d<b的c, d,均有这表明X在区间a,b的任一区间c,d内取值的概率与该区间的长度成正比,而与区间所处的位置无关。例7:公共汽车站每隔10分钟有一辆汽车通过,乘客在任一时刻到达公共汽车站都是可能的,求乘客候车不超过2分钟的概率。解:设乘客到达公共汽车站的时刻为T,乘客到站后,来站的第一辆汽车抵达时刻为t0。依题意,随机变量T在t0-10,t0内服从均匀分布,即分布密度为“乘客候车不超过2分钟”的事件,就是落入t0-2,t0的事件,其概率13,2 指数分布定义:若随机变量X的分布密度为其中: 是常数,则称X服从参数为的指数分布,记为显然:(1)(2) 指数分
14、布有着重要应用,如无限电元件的寿命、动植物的寿命,以及随机服务系统中的服务时间等都可用指数分布来描述。例8: 设某种灯泡的使用寿命为X,其分布密度为(),求此种灯泡使用超过100小时的概率:解:133 正态分布在生产实践和科学研究中所遇到的随机变量,大量的服从或近似服从正态分布,如测量误差,植株的高度,各种产品的质量指标(如零件的尺寸、材料的强度)动物的体重、人的高度、健康人红细胞的数目、年降雨量、某班学生的考试成绩等等。定义: 设随机变量X的分布密度为其中和(是两个常数,则称X服从参数为和的正态分布,记作,通常又称X为正态变量。y=f(x)的图形是一条钟形曲线,该曲线具有如下性质:(1) 关
15、于对称,当时,f(x)取得最大值(2)曲线以x轴为水平渐近线;(3)若固定值,改变值,则曲线y=f(x)沿x轴方向平移,而曲线的形状不变;若固定,改变值,值越大,曲线越平坦,值越小,曲线越尖峭;(4)特别当时,称X服从标准正态分布,记作XN(0,1), 其分布密度为习题一1设随机变量X的分布列为 k=1,2,3,4,5试求:(1)P(X=1或X=2); (2) ; (3) 2设随机变量X只能取5,6,7,, 16这12个值,且取每个值的机会均等。试求: (1) (2); (3)3 在相同条件下,相互独立地射击五次,每次射中目标的概率为0.6,求命中目标的次数X的概率分布。4 进行某种试验,设成
16、功的概率为,失败的概率为,以X表示首次试验成功所需要的次数,求X的概率分布。5 设随机变量X的概率密度为求:(1) (2) (3)6 设随机变量X的概率密度为求: (1)常数k; (2)7 设随机变量M服从0,10均匀分布,求方程:有实根的概率。8设随机变量M服从参数为=1 的指数分布,求方程:无实根的概率。9 设随机变量X的概率密度 试求: (1)常数C; (2) )10 设随机变量X的分布函数试求相应的概率密度,并求。14随机变量的分布函数与随机变量函数的分布 (3-4)141 随机变量的分布函数 对于离散型随机变量和连续型随机变量的概率分布,我们分别用分布律和分布密度来描述,实际上,还存
17、在一种用来描述各类随机变量概率分布的统一形式,这就是随机变量的分布函数。 定义:设X为一随机变量,称函数为随机变量的分布函数。F(x)是一个定义域为全体实数,值域为区间0,1的普遍函数,它的引入将使许多概率问题转化为函数问题,从而得到简化。分布函数具有如下性质:(1) (2)F(x)是x的的单调不减函数、右连续;(3)(4)若X是连续型随机变量,它的分布密度为,则X的分布函数有微积分的知识可以得到如下结论:(1)F(x)是x的连续函数;(2)对于密度函数f(x)的连续点,有F(x)=f(x)例1:离散型随机变量其分布率如下:X-1234p1/51/52/51/5试求:(1)X的分布函数;(2)
18、(3)解:(1)X的分布函数为;(2)(3)例2: 设X在区间a,b上服从均匀分布,求X的分布函数,计算;解:X的分布密度为则X的分布函数为:142 随机变量函数的分布在实际问题中,经常需要研究随机变量函数的分布。随机变量X的函数仍然是一个随机变量。现在的问题是如何由X的概率分布求出Y的概率分布。1421 离散型随机变量函数的分布 设已知离散型随机变量X的分布率为Xx1x2xkPp1p2pk 当随机变量X取得它的某一可能值xi时,其函数取值,则随机变量Y的分布律为Yg(x1)g(x2)g(xk)Pp1p2pk例3:设随机变量的分布律为X0123P5/3015/309/301/30求:(1) Y
19、=2X+1的分布律; (2) Y=(X-1)2的分布律解(1) Y=2X+1的分布律为Y=2X+11357P5/3015/309/301/30(2)Y=(X-1)2的分布律为Y=(X-1)21014P5/3015/309/301/30把Y=1的两个概率相加,得到;Y=(X-1)2014P15/3014/301/301422 连续型随机变量函数的分布 对于连续型随机变量,我们要由随机变量X的分布密度去求随机变量的分布密度。例4: 设随机变量X的分布密度为,求Y=kX+b的分布密度。解:设随机变量X与Y的分布函数分别为和,则若k>0,即函数Y=kX+b为单调增函数时,有两端对y求导,得到若k
20、<0,即函数Y=kX+b为单调减函数时,有两端对y求导,得到综上所述,不论k>0,还是k<0,均有15正态变量的标准化 为了解决正态分布的概率计算问题,书后附录了标准正态分布的分布函数函数值表,称为标准正态分布表,可供查阅。具有以下性质:(1)(2)(3)(4)故对于标准正态分布的概率计算,只需查表即可。对于一般正态分布的概率计算,可以通过定积分的换元积分法化成标准正态分布,然后查表。设,则有于是得到若用表示的分布函数,令,则有例5:设分布,试求:P(1<X<2), P(÷X÷< 1), P(X£-1), 解:该问题为正态分布,
21、可以直接查表; (1) P(1<X<2) = F(2) F(1) = 0.9772 0.8413 = 0.1359 (2) P(÷X÷< 1) = P ( -1 < X < 1) = F(1) F(-1) = 2F(1) 1= 0.6826 (3)P(X£-1) = F(-1) = 1 F(1)= 1 0.8413 = 0.1587 (4) = 1 - P(X£ 1.54) = 2 2F(1.54)= 2 2*0.9382 = 0.1236 例6:设分布,试求: 解:该问题为一般正态分布,将其转化为标准正态分布;(1)P(X
22、£ -3.5) = (2)P(1< X < 3) = (3)1 6随机变量的数字特征随机变量的数字特征,就是刻画随机变量的某种特征(如平均值、偏差程度)的量,它虽然不一定能完整地描述随机变量,但在理论和实践上都具有重要意义。比如在检查灯泡的质量时,我们关心的是灯泡的平均寿命;在农业上我们只关心某作物的平均产量;在评定棉花质量时,我们主要关心纤维的平均长度,以及纤维长度与平均长度的偏差等。161 数学期望 定义:设离散型随机变量X的分布律为, (k=1,2,)若级数绝对收敛,则称级数为随机变量X的数学期望,简称为期望或均值,记作E(X),即 定义:设连续型随机变量X的分布密
23、度为,若积分绝对收敛,则称此积分值为X的数学期望,记作E(X),即例1:设随机变量X服从参数为的泊松分布,试求其数学期望。解:此处,故 例2:已知某电子元件的寿命X服从参数为的指数分布(单位:h),即其概率密度为求这类电子元件的平均寿命。解:因为,故即这类电子元件的平均寿命为1000小时。162 随机变量函数的数学期望 在许多实际工作中,常常需要求随机变量函数的数学期望,若已知随机变量X的分布,要求其函数的数学期望,我们可以先由X的分布求出Y的分布,然后按定义计算Y的期望。定理: 设是随机变量X的函数(1)若X为离散型随机变量,其分布律为 当级数收敛时,则有:(2) 若X为连续型随机变量,其分
24、布密度为,则当收敛时,有例3:设风速X是一个随机变量,在0,a上服从均匀分布,而飞机两翼上所受的压力Y与风速的平方成正比,即求。解:随机变量X的分布密度为于是例4:假定国际市场每年对我国某产品的需求量X是一个随机变量(单位:t),它在区间2000,4000上服从均匀分布。已知每售出一吨该产品,可赚外汇3万美圆;若销售不出去,则每吨需仓储费一万元。那么,外贸部门每年应组织多少吨货源,才能使收益最大?解:收益多少是由销售量和组织的货源量共同决定的,以y表示组织的货源量,以X表示需求量,它是一个随机变量,收益量是X的函数,记作Y。由题设条件而是随机变量X的函数,根据题意由于Y是随机变量,要收益最大,
25、只需使其平均收益最大即可,也就是使Y的数学期望最大,而由微积分可知,当组织货源时,可使收益最大。E(Y)=8250(美圆)163 数学期望的性质(1)设C为常数,则E(C)=C;(2)设X是随机变量,C为常数,则E(CX)=CE(X);(3)E(X+C)=E(X)+C;(4)E(kX+b)=kE(X)+b (k,b为常数)164 方差与标准差 随机变量X是数学期望,用来描述随机变量平均取值的情况,是随机变量的一个重要的数字特征。然而在许多实际问题中,还需要了解随机变量取值与其平均值的偏离程度。为此,我们引入方差的概念。 定义:设X为随机变量,若存在,则称它为随机变量X的方差,记作D(X),即D
26、(X)=若X为离散型随机变量,则 其中为X的分布律。若X为连续型随机变量,其分布密度为则通常我们把称为X的标准差或均方差,记作即方差D(X)是一个非负值,这个常数的大小反映随机变量X取值的分散程度,方差越大,取值越分散;方差越小,取值越集中。 在方差的计算中,常用到的公式例5:设随机变量X服从参数为的指数分布,即求D(X);解: 因为X的概率密度为故:又,所以165 方差的性质(1)设C为常数,则D(C)= 0;(2)设X为随机变量,C为常数,则 D(CX)= C2D(X)(3)设X为随机变量,C为常数,则 D(X+C)= D(X)166 几种常见分布的期望与方差习题二1 设随机变量X服从标准
27、正态分布,求:(1);(2);(3)2 设XN(3,4),求;(1)(2)(3)3 设随机变量的概率分布为: k=1,2,3,4,5试求:E(X)和D(X)。4设随机变量Y具有分布; k=1,2,试求E(X)和D(X)。5 设在某一规定时间间隔内,电器设备用于最大负荷的时间是一连续型随机变量,其概率密度为求:E(X)6 设随机变量X的概率密度为求:的数学期望和方差。7 设随机变量X的概率密度为:求X的期望和方差。8某射手每次击中目标的概率为0.8, 现连续射击30次,求击中目标的次数的数学期望和方差。2 统计量及相关概念(5-6)21 总体与样本211 样本 如果我们要了解某工厂生产的灯泡的质
28、量,就要对灯泡的寿命进行测试,由于测试具有破坏性,所以我们只能从产品中抽取一部分进行寿命测试,然后根据这部分灯泡的寿命对整批灯泡的质量进行推断。 在数理统计中,我们把研究对象的全体称为总体,而把组成总体的每个基本单元称为个体。在实际问题中,我们关心的往往不是研究对象的全部情况,而是它的某一个或某几个质量指标。比如,对灯泡我们只要关心的是其使用寿命,而该批灯泡的使用寿命X取值的全体,就构成了研究对象的全体,即总体,显然X是一个随机变量。根据总体所含个体的多少,又可把总体区分为有限总体与无限总体两类。要了解总体的规律性,必须对其中的个体进行统计、观测,而统计观测的方法一般分为两类:一类是全面观测,
29、即对全部个体逐个观测,该方法全面但是不可行的;另一类是抽样观测,即从总体中抽取n个个体进行观测,然后由n个个体的性质来推断总体的性质或规律性。我们把被抽到的n个个体的集合称为总体的一个样本,n称为该样本的容量。 在总体X中每抽取一个个体,就是对随机变量X进行一次观测,抽取n个个体就是对X进行n次观测,每次观测的结果都得到X的一个个体的观测值。把样本的一个n维随机变量记作,而把样本观测值记为。 若总体X的概率密度函数为,则样本的联合密度函数为若总体的分布函数为,则样本的联合分布函数为212 理论分布与样本分布函数 我们知道,若总体是随机变量X,则X的分布就是总体的分布(也叫理论分布),X的分布函
30、数便是总体的分布函数。要了解总体的情况,就要了解随机变量X的分布或它的某些数字特征。问题是如何由样本来推断总体的分布。一般做法是作出样本分布函数用以观测理论分布的面貌,下面给出分布函数的定义:定义:若是总体X的n个独立的观测值,将这些观测值由小到大排列为并作出函数称为对总体X进行n次独立观测得到的样本分布函数(或称经验分布函数)。的图形是一条跃迁上升的阶梯形曲线,该分布函数具有如下性质:(1)(2)单调不减(3)处处右连续。213 分布密度的近似求法 我们可以由样本观测值作出频率直方图来近似找到分布密度函数。通过一个例子说明直方图的画法。例:为了了解某工厂产品重量的分布情况,从该厂生产的产品中
31、抽取容量为100的样本,测得其重量如表所示:图1 产品重量数据表 单位:g 试根据以上数据,求出总体X的近似分布。近似描述X的概率分布的具体步骤是:(1) 对n个样本值进行分组,组数记为k,一般要依据样本容量n的大小决定分组数k,组数多少与n的关系可参考下表。表2-2样本容量n组数k5010020030050010005108161020122415302040分组方法是:(a) 将n个样本值按大小排列,找出最大值,最小值,本例中, , (b) 选取a(比略小)和b(比略大),把区间(a,b)作为样本的取值区间,并把(a,b)等分成k个小区间,每个区间的长度为组距,记为h,这里 本例中 h=0
32、.1(2) 数出样本值落入第i个区间的个数,称为频数,记作(i=1,2,k),进而计算出样本值落入第i个区间的频率,记作,即(3)列出频率分布表如下所示:(4)画出频率直方图在频率直方图中,高: 从图中可见,频率直方图中第i个矩形的面积等于样本值落入第i个区间内的频率, 且 即所有矩形面积之和等于1。22 统计量与抽样分布 样本是总体的代表和反映,但在抽取样本之后,我们并不立即由样本来推断总体,而是要对样本进行“加工”和“提炼”,把样本中包含我们所关心的信息集中起来,这就是针对不同的问题构造出某种样本的函数,这种样本的函数在统计学中称为统计量。定义:设是来自总体X的一个样本,是不包括任何未知参
33、数的样本的函数,则为统计量。 由于样本是随机变量,所以作为样本函数的统计量也是一个随机变量,若是样本的一个观测值,则就是的一个观测值。 一般地,若是来自总体X的样本,则称统计量为样本均值(表示总体平均取什么值);称统计量为样本方差(总体取值的分散程度);称统计量为样本标准差。称为样本的k阶原点矩;称为样本的k阶中心矩。 在统计中,为了客观地比较两个均值不等的样本的变异程度而引入的变异系数,为了度量曲线形状而引入的偏度,以及峰度等等,均为统计量。222 抽样分布 统计量是n维随机变量的函数,作为一个随机变量,它也有自己的概率分布,通常把统计量的分布称为抽样分布。 设总体X的分布函数已知,如果对于
34、任意容量为n的样本,能求出给定的统计量的分布函数,则称该分布函数为的精确分布,精确分布对于数理统计中的“小样本问题”的研究很重要。下面就正态总体,求出样本的几个函数的精确分布。2221 样本均值的分布 设,是来自总体X的样本,由于正态变量的线性函数仍然是正态变量,故当为已知时,统计量通常称为总体的标准误,记作 在讨论有关正态总体的问题时,经常用到标准正态分布的上侧临界值的概念。设,对于任意给定的满足或称为标准正态分布的上侧临界值,其集合解释如下图(左)所示。把满足的称为标准正态分布的双侧临界值,其如下图(由)所示。几个常用的临界值为2222 分布 设是来自总体N(0,1)的样本,则服从自由度为
35、n的分布,记作分布的密度函数为 其图形如下所示。为了使用方便起见,数学工作者对不同自由度、不同值按表达式计算出,称为分布的上侧临界值,其几何解释如下图所示。例如: n=30, 即 可以证明分布具有可加性:设且二者相互独立,则 研究分布,经常用到下述定理:定理1: 设是来自正态总体的样本,则(1) 样本均值与样本方差相互独立;(2)2223 t分布 设X N(0,1),Y,且X与Y相互独立,则随机变量服从自由度为n的t分布,记为Tt(n)t分布的概率密度函数为 它的图形如下所述。 类似标准正态分布的密度函数,当n较大时,t分布近似于标准正态分布。研究t分布经常用到如下定理:定理2:设是来自正态总
36、体的样本,则统计计算通常称为样本的标准误,记作,定理3: 设和分别来自正态总体和的样本,且二者相互独立,则统计量对于给定的,我们称满足条件的为t分布的上侧临界值,如下图(左)所示;而把满足条件的为t分布的双侧临界值,如下图右所示。例如:当时, 2224 F分布设,且与相互独立,则随机变量服从第一自由度为,第二自由度为的F分布,记作F分布的密度函数为其中F分布的上侧临界值是指满足 对于任意给定的和值,通过查F分布表可得临界值若较大时,可由公式查F分布表得出。例如:,则查表可得, 研究F分布,经常用到如下定理:定理4 设是正态总体的样本容量和样本方差;是正态总体的样本容量和样本方差,且两个样本相互独立,则统计量23 中心极限定理231 大数定律本节所讲的大数定律将从理论上证实频率具有稳定性2311 切比雪夫不等式切比雪夫不等式:设 随机变量X具有有限期望和方差,记,则对于任意正数,恒
0/150
联系客服
本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!