1. 随机事件及其概率 1.1. 随机试验和随机事件 1.1.1. 随机试验 1.1.2. 样本空间 1.1.3. 随机事件 1.2. 事件的关系、运算及其运算律 1.2.1. 事件 AB 之和(并) 1.2.2. 事件 AB 的积 1.2.3. 事件 AB 的差 1.2.4. 事件的包含 1.2.5. 事件相等 1.2.6. 互斥事件 1.2.7. 对立事件 1.2.8. 事件的运算律 1.3. 概率及其性质 1.3.1. 概率的定义 1.3.2. 概率的性质 1.4. 三大概型 1.4.1. 古典概型 1.4.2. 几何概型 1.4.3. 伯努利(Bernoulli)模型 1.5. 三大概率公式 1.5.1. 条件概率与乘法公式 1.5.2. 全概率公式 1.5.3. 贝叶斯(Bayes)公式 1.6. 事件的独立性 1.6.1. 两个事件的独立性 1.6.2. 两事件相互独立的充要条件 1.6.3. n个事件的两两独立于相互独立 (n3 2. 随机变量及其分布 2.1. 分布函数 2.2. 离散型随机变量 2.2.1. 分布律 2.2.2. 分布律的性质 2.2.3. 分布函数F(x) 2.3. 连续型随机变量 2.3.1. 定义 2.3.2. 概率密度函数的性质 2.3.3. 连续型随机变量分布函数的性质 2.4. 离散型分布(五大分布) 2.4.1. 0-1分布 2.4.2. 二项分布 2.4.3. 几何分布 2.4.4. 超几何分布 2.4.5. 泊松分布 2.5. 连续型分布(三大分布) 2.5.1. 均匀分布 2.5.2. 指数分布 2.5.3. 正态分布 2.6. 随机变量函数的分布 2.6.1. X是离散型随机变量 2.6.2. X是连续型随机变量 3. 多维随机变量及其分布 3.1. 二维随机变量联合分布函数及其性质 3.1.1. 二维RV联合分布函数定义 3.1.2. 二维RV联合分布函数性质 3.1.3. 联合分布函数的几何意义 3.1.4. 边缘分布函数 3.2. 二维离散型随机变量的联合概率分布、边缘概率分布及条件概率分布 3.2.1. 联合分布律 3.2.2. 边缘分布律 3.2.3. 条件分布律 3.3. 二维连续型随机变量的联合概率密度、边缘概率密度及条件概率密度 3.3.1. 连续型随机变量 3.3.2. 联合概率密度f(x,y)的性质: 3.3.3. 边缘概率密度 3.3.4. 条件概率密度 3.4. 常见的二维分布 3.4.1. 二维均匀分布 3.4.2. 二维正态分布 3.5. 随机变量的独立性 3.5.1. 一般型随机变量 3.5.2. 离散型随机变量 3.5.3. 连续型随机变量 3.5.4. 随机变量函数的独立性 3.5.5. 二维正态分布关于独立的相关结论 3.6. 两个随机变量函数的分布 3.6.1. 两个随机变量函数的定义 3.6.2. 二维离散型随机变量函数的分布律 3.6.3. 二维连续型随机变量函数的分布 3.6.4. 混合型 3.7. 极值分布 4. 随机变量的数字特征 4.1. 随机变量的数学期望 4.1.1. 一维随机变量的数学期望 4.1.2. 随机变量函数的数字期望 4.1.3. 数学期望的性质 4.2. 随机变量的方差 4.2.1. 方差及标准差的概念 4.2.2. 方差的计算公式 4.2.3. 方差的性质 4.3. 协方差 4.3.1. 协方差的概念 4.3.2. 协方差的计算公式 4.3.3. 协方差的性质 4.4. 相关系数 4.4.1. 相关系数的定义 4.4.2. 相关系数的性质 4.4.3. 随机变量X,Y等价的五个结论 5. 大数定律与中心极限定理 5.1. 切比雪夫不等式 5.2. 大数定律 5.2.1. 依概率收敛 5.2.2. 伯努利大数定律(即频率依概率收敛于概率) 5.2.3. 辛钦大数定律 5.2.4. 切比雪夫大数定律 5.3. 中心极限定理 5.3.1. 独立同分布中心极限定理 5.3.2. 拉普拉斯中心极限定理 6. 数理统计的基本概念 6.1. 常用统计量 6.1.1. 样本均值 6.1.2. 样本方差 6.2. 抽样分布 6.2.1. 三大分布 6.3. 关于样本的分布 7. 参数估计与假设检验 7.1. 点估计 7.1.1. 矩估计法 7.1.2. 最大似然估计法 7.2. 估计量的评选标准 7.2.1. 无偏性 7.2.2. 有效性 7.2.3. 一致性 7.3. 区间估计 7.4. 假设检验 7.4.1. 显著性检验的基本思想 7.4.2. 假设检验的基本步骤 7.4.3. 两类错误 7.4.4. 正态总体未知参数的假设检验(检验水平𝛼 1. 随机事件及其概率1.1. 随机试验和随机事件1.1.1. 随机试验概率论中将满足下面三个条件的试验称为随机试验,简称试验:(1) 可在相同的条件下重复进行;(2) 所有的结果是明确可知的:(3) 试验之前不能确定哪一个结果会发生. 1.1.2. 样本空间随机试验的所有可能结果所组成的樂合称为样本空间,常记为ΩΩ中的元素称为样本点. 1.1.3. 随机事件样本空间的子集,即试验的结果称为随机事件,简称事件,由一个样本点組成的单点集,称为基本事件.另外,两个特殊的事件为:必然事件Ω----每次试验中一定发生的事件;不可能事件----每次试验中一定不发生的事件. 1.2. 事件的关系、运算及其运算律1.2.1. 事件 AB 之和(并)AB(或 A+B)表示事件 AB 至少有一个发生 1.2.2. 事件 AB 的积AB(或 AB)表示事件 AB 同时发生 1.2.3. 事件 AB 的差A-B 表示事件A发生而B不发生性质:A-B=ABAB. 1.2.4. 事件的包含若时间A发生必然导致事件B发生,则称事件B包含A(或A包含于B),记为BA. 1.2.5. 事件相等ABBA,则称事件 AB 相等,记为 A=B. 1.2.6. 互斥事件在试验中,若事件AB不能同时发生,即AB=,则称A、B为互斥事件. 1.2.7. 对立事件每次试验中,“事件A不发生”的事件称为A的对立事件或逆事件,A的对立事件记为A.性质:(1) A+A=Ω(必然事件)(2) AA=(不可能事件) 1.2.8. 事件的运算律(1) 吸收律 若AB,则AB=BAB=AAB=.(2) 交换律 AB=BA,AB=BA.(3) 结合律 (AB)C=A(BC)(AB)C=A(BC).(4) 分配律 (AB)C=(AC)(BC),A(BC)=(AB)(AC).(5) 德摩根律1 A1A2=A1A2A1A2=A1A2. 1.3. 概率及其性质1.3.1. 概率的定义设随机试验E的样本空间为Ω,则称满足下列条件的事件集上的函数P()为概率:(1) 对于任意事件AP(A)0(2) 对于必然事件ΩP(Ω)=1(3) A1,A2,,An,为两两互不相容的事件,即AiAj=(ij,i,j=1,2,),则P(k=1Ak)=k=1P(Ak).1.3.2. 概率的性质(1) P(A)=1-P(A)(2) P(A-B)=P(A)-P(AB),特别,当BA时,P(A-B)=P(A)-P(B),且P(B)P(A)(3) P(AB)=P(A)+P(B)-P(AB),(3) P(ABC)=P(A)+P(B)+P(C)-P(AB)-P(BC)-P(AC)+P(ABC)(3) 特别的,若AB互斥,则P(AB)=P(A)+P(B)-P(AB),P(A-B)=P(A) 1.4. 三大概型1.4.1. 古典概型如果随机试验E满足下列条件:(1) 试验的样本空间Ω的元素只有有限个,(2) 样本空间中每个元素,即基本事件发生的可能性相同,则称此试验为古典概型,对于古典概型,事件A的概率有下列计算公式:P(A)=A中基本事件数
Ω中基本事件总数
(1) 1.4.2. 几何概型如果随机试验E的样本空间Ω为欧式空间中的一个区域,且每个样本点的出现具有等可能性,则称此试验为几何概型,对于几何概型,事件A的概率有下列计算公式: P(A)=A的度量(长度、面积、体积)
Ω的度量(长度、面积、体积)
.
1.4.3. 伯努利(Bernoulli)模型如果试验E的结果只有两个,AA,则称此试验为伯努利概型(试验),若将伯努利试验独立重复n次,则称为n重伯努利概型,简称伯努利概型,在伯努利概型中,若P(A)=p,则n次试验中事件A发生k次的概率为Pn(k)=Cknpk(1-p)n-k,k=0,1,,n. 1.5. 三大概率公式1.5.1. 条件概率与乘法公式AB是两个事件,且P(A)>0,称P(B|A)=P(AB)
P(A)
为在事件A发生条件下事件B发生的条件概率. 乘法公式:设P(A1)>0,P(A2)>0,则 P(A1A2)=P(A1)P(A2|A1)=P(A2)P(A1|A2).一般地,设P(A1A2An-1)>0,则 P(A1A2An)=P(A1)P(A2|A1)P(A3|A1A2)P(An|A1An-1) 1.5.2. 全概率公式B1,B2,,Bn为一完备事件组,即BiBj=,ijni=1Bi=Ω,P(Bi>0),i=1,2,,n,则对事件A P(Bj|A)=P(A|Bj)P(Bj)
ni=1P(A|Bi)P(Bi)
1.5.3. 贝叶斯(Bayes)公式B1,B2,,Bn为一完备事件组,P(Bi)>0,i=1,2,,n,P(A)>0,则有P(Bj|A)=P(A|Bj)P(Bj)
ni=1P(A|Bi)P(Bi)
,j=1,2,,n.
1.6. 事件的独立性1.6.1. 两个事件的独立性A,B是两个事件,若有等式 P(AB)=P(A)P(B)则称AB相互独立. 1.6.2. 两事件相互独立的充要条件P(AB)=P(A)P(B)P(B|A)=P(B)P(A)>0); 或 P(A|B)=P(A)P(B)>0③ 四对事件 ABABABAB中有一对相互独立,则另外三对也相互独立. 1.6.3. n个事件的两两独立于相互独立 (n3(1) n个事件A1,A2,,An两两独立:其中任何两个时间相互独立,即有下列C2n=n(n-1)
2
个等式成立:P(AiAj)=P(Ai)P(Aj)1i<jn
(1) (2) n个事件A1,A2,,An相互独立,其中任意k个不同事件都相互独立,即有下列2n-n-1个等式成立;P(Ai1Ai2Aik)=P(Ai1)P(Ai2)P(Aik),其中ii1<i2<⋯<ikn,k=2,3,,n,(2) (3) n个事件两两独立于相互独立的关系:(3) A1,A2,,An相互独立A1,A2,,An两两独立(3) A1,A2,,An两两独立A1,A2,,An相互独立(3) (4) n个事件相互独立的结论:若A1,A2,,An相互独立,则由其中任意部分事件所产生的事件与另一部分事件所产生的事件相互独立. 2. 随机变量及其分布2.1. 分布函数(1) 定义 设X为随机变量,x为任意实数,则函数 F(x)=P(Xx)称为随机变量X的分布函数(2) 性质:(2) 0F(x)1,-<x<+(2) F(x)是单调不减的函数,即x1<x2时,有F(x1)F(x2);(2) F(x)=0F(x)=1(2) F(x)=F(x0),即F(x)是右连续的; 2.2. 离散型随机变量2.2.1. 分布律X的所有取值为xk(k=1,2,),则称事件{X=xk}的概率即P{X=xk}=pk,或下列表格.
Xx1x2xn
Pp1p2pn
X的分布律2.2.2. 分布律的性质(1) pi0,i=1,2,,n,(2) k=1pk=1 2.2.3. 分布函数F(x)X的分布律为P{X=xk}=pkk=1,2,,则X的分布函数为F(x)=P(Xx)= xk⩽xP{X=xk}.若已知X的分布函数F(x),则可求得X的分布律: P{X=xk}=F(xk)-F(x),k=1,2, 2.3. 连续型随机变量2.3.1. 定义若随机变量X的分布函数F(x),可以表示成非可积负函数f(x)的积分形式: F(x)=f(t)dt -<x<+则称X为连续型随机变量,f(x)称为X的概率密度函数,简称概率密度。 2.3.2. 概率密度函数的性质(1) f(x)0(2) f(t)dt=1 2.3.3. 连续型随机变量分布函数的性质(1) F(x)是关于x的连续函数,对于任何实数c,有P{X=c}=0(2) f(x)x处连续,则有F'(x)=f(x)(2) P(x1Xx2)=P(x1<Xx2)=P(x1X<x2)=P(x1<X<x2)=F(x2)-F(x1)=f(t)dt 2.4. 离散型分布(五大分布)2.4.1. 0-1分布设一次伯努利试验中事件A发生X次,则X服从0-1分布,其分布律为
X10
Pp1-p
其中p为时间A出现的概率,0<p<1. 2.4.2. 二项分布n重伯努利试验中事件A发生X次,则X服从二项分布,记作X~B(n,p),其分布律为P(X=k)=Cknpkqn-k, k=0,1,2,,n, 2.4.3. 几何分布进行独立重复试验,设每次试验成功的概率为p,失败的概率为q=1-p(0<p<1),将试验进行到出现一次成功为止,以X表示所需的试验次数,则X服从參数为p的几何分布,记为X~G(p),其分布律为 P(X=k)=qk-1p, k=1,2,3,, 其中 p0,q=1-p 2.4.4. 超几何分布N件产品,其中M件次品,从中任取n件,有X个次品,则随机变量X服从参数为n,N,M的超几何分布,通常记为X~H(n,N,M),其分布律为 P(X=i)=CiMCn-iN-M
CnN
,0inN,iM
2.4.5. 泊松分布设随机变量X的分布律为P(X=k)=𝜆k
k!
e-𝜆, 𝜆>0, k=0,1,2,
则称随机变量X服从参数为𝜆的泊松分布,记为X~P(𝜆). 2.5. 连续型分布(三大分布)2.5.1. 均匀分布设随机变量X的值等可能地落在[a,b]内,则称X[a,b]上服从均匀分布,记为X~U(x,y),其密度分布为 f(x)=a
1
b-a
,
axb,
0,others.
分布函数为 f(x)=a
0,x<a
x-a
b-a
,
ax<b
1xb
2.5.2. 指数分布若连续型随机变量X的概率密度为 f(x)=a
𝜆e-𝜆x,x>0
0,x0
其中𝜆>0,则称X服从参数为𝜆的指数分布,记为XE(𝜆),其分布函数 F(x)=a
1-e-𝜆x,x0
0,x<0
2.5.3. 正态分布(1) 一般正态分布(a) 定义 若随机变量X的密度函数为(a) f(x)=1
2𝜋𝜎
e-(x-𝜇)2
2𝜎2
(-<x<+)
(a) 其中𝜎>0𝜇𝜎均为常数,则称X服从参数为𝜇𝜎的正态分布,记为XN(𝜇,𝜎2).其分布函数(a) F(x)=1
2𝜋𝜎
e-(x-𝜇)2
2𝜎2
dx
(-<x<+)
(a) (b) f(x)F(x)的性质如下:(i) f(x)的图形是关于x=𝜇对称,即f(𝜇+x)=f(𝜇-x);(ii) F(𝜇+x)+F(𝜇-x)=1;(iii) F(𝜇)=1
2
;
(iv) x=𝜇时,f(𝜇)=1
2𝜋𝜎
为最大值;
(v) f(x)x轴为渐近线.(1) (2) 标准正态分布(a) 定义 当u=0𝜎2=1,即X的密度函数为(a) 𝜑(x)=1
2𝜋
e-x2
2
-<x<+
(a) 则称X服从标准正态分布,记为XN(0,1),其分布函数为(a) Φ(x)=1
2𝜋
e-x2
2
dx.
(b) 𝜑(x)Φ(x)的性质如下:(i) 𝜑(-x)=𝜑(x)(ii) Φ(-a)+Φ(a)=1(iii) Φ(0)=1
2
(2) (3) 一般正态分布与标准正态分布之间的关系:如果XN(𝜇,𝜎2),则X-𝜇
𝜎
N(0,1)
P(x1<Xx2)=Φ(x2-𝜇
𝜎
)-Φ(x1-𝜇
𝜎
)
.
(a) 2.6. 随机变量函数的分布随机变量Y是随机变量X的函数Y=g(X),其中g(x)为连续函数或分段函数,现要求Y=g(X)的概率分布,分两种情形讨论:2.6.1. X是离散型随机变量已知X的分布列为
Xx1x2xn
Pp1p2pn
显然,Y=g(x)的取值只可能是g(x1),g(x2),,g(xn),,若g(xi)互不相等,则Y的分布列如下:
Yg(x1)g(x2)g(xn)
Pp1p2pn
若有某些g(xi)相等,则应将对应的pi相加作为g(xi)的概率 2.6.2. X是连续型随机变量分布函数法:先按分布函数的定义求得Y的分布函数FY(y),再通过求导得到Y的概率密度fY(y),即 FY(y)=P(Yy)=P(g(x)y)=fX(x)dx,fY(y)=dFY(y)
dy
3. 多维随机变量及其分布3.1. 二维随机变量联合分布函数及其性质3.1.1. 二维RV联合分布函数定义(X,Y)是二维随机变量,对任意实数xy,称 F(x,y)=P{Xx,Yy}(X,Y)的分布函数,又称联合分布函数. 3.1.2. 二维RV联合分布函数性质(1) 0F(x,y)1;(2) F(x,y)xy都是单调非减的,即对任意的x1,x2,若x1>x2,则有F(x1,y)F(x2,y)(3) F(x,y)=1F(x,y)=F(x,y)=F(x,y)=0(4) F(x,y)xy都是右连续. 3.1.3. 联合分布函数的几何意义F(x,y)(x,y)的函数值就是随机点(X,Y)X=x左侧和Y=y下方的无穷矩形内的概率,对有限矩形域有: P{x1<X<x2,y1<Y<y2}=F(x2,y2)-F(x1,y2)-F(x2,y1)+F(x1,y1). 3.1.4. 边缘分布函数在试验涉及二维随机变量(X,Y)的前提下,单个随机变型XY的分布函数FX(x)FY(y)称为二维随机变量(X,Y)的关于X和关于Y的边缘分布函数,即 FX(x)=P{Xx}=F(x,y)FY(y)=P{Yy}=F(x,y) 3.2. 二维离散型随机变量的联合概率分布、边缘概率分布及条件概率分布3.2.1. 联合分布律(1) 定义(1) 设离散型随机变量(X,Y)的所有可能取值为(xi,yi)(i,j=1,2,)且事件{(X,Y)=(xi,yj)}的概率为pij,称(1) P(X=xi,Y=yj)=Pij(i,j=1,2,)(1) (X,Y)的联合分布律,联合分布律有时也用下面的概率分布表来表示:(1)
YXy1y2yjP{X=xi}
x1P11P12P1jP{X=x1}
x2P21P22P2jP{X=x2}
xiPi1Pi2PijP{X=xi}
P{Y=yj}P{Y=y1}P{Y=y2}P{Y=yj}1
(1) (2) 性质(a) Pij0(i,j=1,2,)(b) i jpij=1. 3.2.2. 边缘分布律设随机变盘(X,Y)的联合分布律为 P{(X,Y)=(xi,yj)}=pij(i,j=1,2,),X的边缘分布为 P(X=xi)= jpij(i,j=1,2,);Y的边缘分布为 P(Y=yj)= ipij(i,j=1,2,). 3.2.3. 条件分布律二维离散型随机变型(X,Y)的联合分布律为 P{(X,Y)=(xi,yj)}=pij(i,j=1,2,),在已知X=xi的条件下,Y取值的条件分布律为 P(Y=yj|X=xi)=P{X=xi,Y=yj}
P(X=xi)
,
在已知Y=yj的条件下,X取值的条件分布律为 P(Y=yi|X=xj)=P{X=xi,Y=yj}
P(Y=yj)
,
其中P(X=xi)P(Y=yj)分别为XY的边缘分布律. 3.3. 二维连续型随机变量的联合概率密度、边缘概率密度及条件概率密度3.3.1. 连续型随机变量F(x,y)为二维随机变量(X,Y)的分布函数,如果存在非负函数f(x,y)使得对任意实数xyF(x,y)=f(u,v)dudv,则称(X,Y)为二维连续型随机变量,f(x,y)(X,Y)的联合概率密度. 3.3.2. 联合概率密度f(x,y)的性质:(1) f(x,y)0(2) f(x,y)dxdy=1. 3.3.3. 边缘概率密度(X,Y)为连续型随机变量,并且其联合概率密度为f(x,y),则XY的边缘概率密度为 fX(x)=f(x,y)dy, fY(y)=f(x,y)dx. 3.3.4. 条件概率密度二维连续型随机变量(X,Y)的联合概率密度为f(x,y),则在己知Y=y的条件下,X的条件概率密度为 fX|Y(x|y)=f(x,y)
fY(y)
在已知X=x的条件下,Y的条件概率密度为 fY|X(y|x)=f(x,y)
fX(x)
其中fx(x)>0,fY(y)>0分别为X,Y的边缘概率密度. 3.4. 常见的二维分布3.4.1. 二维均匀分布设随机变量(X,Y)的概率密度为 f(x,y)=a
1/SD,(x,y)D
0,others
其中SD为区城D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)~U(D). 3.4.2. 二维正态分布设随机变量(X,Y)的概率密度为 f(x,y)=1
2𝜋𝜎1𝜎21-𝜌2
e-1
2(1-𝜌2)
[(x-𝜇1
𝜎1
)2-2𝜌(x-𝜇1)(y-𝜇2)
𝜎1𝜎2
+(y-𝜇2
𝜎2
)2]
其中𝜇1,𝜇2,𝜎1>0,𝜎2>0,|𝜌|1,则称(X,Y)服从二维正态分布,记为(X,Y)N(𝜇1,𝜇2,𝜎21,𝜎22,𝜌) 3.5. 随机变量的独立性3.5.1. 一般型随机变量相互独立:设(X,Y)的分布函数为F(x,y),边缘分布函数为FX(x)FY(y),如果对一切x,yF(x,y)=FX(x)FY(y)则称XY相互独立. 3.5.2. 离散型随机变量XY相互独立的充要条件是:P(X=xi,Y=yj)=P(X =xi)P(Y=yj) 3.5.3. 连续型随机变量XY是相互独立的充要条件是f(x,y)=fX(x)fY(y) 3.5.4. 随机变量函数的独立性XY独立,h,gXY连续函数,则:h(X)g(Y)独立. 3.5.5. 二维正态分布关于独立的相关结论1. (X,Y)N(𝜇1,𝜇2,𝜎21,𝜎22,𝜌),则XN(𝜇1,𝜎21),YN(𝜇2,𝜎22);但是若XN(𝜇1,𝜎21)Y-N(𝜇2,𝜎22),则(X,Y)未必是二维正态分布.2. (X,Y)N(𝜇1,𝜇2,𝜎21,𝜎22,𝜌),则随机变量X,Y的非零线性组合Z=aX+bY0服从一维正态分布.3. XN(𝜇1,𝜎21)Y(𝜇2,𝜎22),且(X,Y)相互独立,则(X,Y)服从二维正态分布.4. (X,Y)N(𝜇1,𝜇2,𝜎21,𝜎22,𝜌),则XY相互独立的充要条件是𝜌=05. X1,X2,,Xn相互独立且服从正态分布,则X1,X2,,Xn的线性组合服从正态分布 3.6. 两个随机变量函数的分布3.6.1. 两个随机变量函数的定义X,Y为两个随机变量,z=g(x,y)为二元连续函数,则称Z=g(X,Y)为随机变量X,Y的函数,显然两随机变量函数是一维随机变量. 3.6.2. 二维离散型随机变量函数的分布律Z=g(X,Y)也是离散型随机变量,其分布律为 P{Z=g(xi,yj)}=P{X=xi,Y=yj}=Pij 如果有若干个g(xi,yj)相同,则合并诸项为一项,并将相应的概率相加作为Z取值为g(xi,yj)的概率. Z的分布函数为:FZ(z)=P{Zz}=P{g(X,Y)z}= g(xi,yj)⩽z)P(X=xi,Y=yj). 3.6.3. 二维连续型随机变量函数的分布(X,Y)的联合概率密度为f(x,y),则Z=g(X,Y)的分布函数为 FZ(z)=P{Zz}=P{g(X,Y)z}=f(x,y)dxdy 3.6.4. 混合型(XY中有一个是离散型随机变量,另一个为连续型随机变量)利用分布函数法求之. 3.7. 极值分布XY是两个相互独立的随机变量,其分布函数分别为FX(x)FY(y),则Z=max(X,Y)的分布函数为: Fmax(z)=FX(z)FY(z)Z=min(X,Y)的分布函数为: Fmin(z)=1-[1-FX(z)][1-FY(z)]. 特别地当X1,X2,,Xn相互独立时Z=max(X1,X2,,Xn)的分布函数为: Fmax(z)=FX1(z)Fx2(z)Fxn(z)Z=min(X1,X2,,Xn)的分布函数分别为: Fmin(z)=1-[1-FX1(z)][1-Fx2(z)][1-Fxn(z)] 4. 随机变量的数字特征4.1. 随机变量的数学期望4.1.1. 一维随机变量的数学期望(1) 离散型随机变量的数学期望(1) 设离散型随机变量X的分布律为P{X=Xi}=pi(i=1,2,).若无穷级数i=1xipi绝对收敛,则称无穷级数i=1xipi的和为随机变量X的数学期望,记作E(X),即(1) E(X)=i=1xipi(2) 连续型随机变量的数学期望(2) X为连续型随机变量,其概率密度为f(x),若反常积分xf(x)dx绝对收敛,则称反常积分xf(x)dx的值为随机变量X的数学期望,记为E(X),即(2) E(x)=xf(x)dx 4.1.2. 随机变量函数的数字期望(1) 一维随机变量函数的数学期望(1) Y是随机变量X的函数;Y=g(X)g是连续函数或分段连续函数).(1) 设离散型随机变量X具有分布律p{X=xi}=pii=1,2,,且无穷级数i=1g(xi)pi绝对收敛;则有:(1) E(Y)=E[g(X)]=i=1g(xi)pi(1) 设连续型随机变量X具有概率密度函数f(x),且反常积分g(x)f(x)dx绝对收敛,则有:(1) E(Y)=E[g(X)]=g(x)f(x)dx(1) (2) 二维随机变量函数的数学期望(2) Z是随机变量X,Y的函数:Z=g(X,Y)g是连续函数),那么,Z是一个一维随机变量.(2) 设二维离散型随机变量(X,Y)具有分布律P{X=xi,Y=yi}=pij(i,j=1,2,);则有(2) E(Z)=E[g(X,Y)]=j=1i=1g(x,y)Pij(2) 或者,设Z具有分布律P{Z=zi}=pi(i=1,2,),则有:(2) E(Z)=i=1zipi(2) 这里的无穷级数绝对收敛.(2) (2) 设二维连续型随机变量(X,Y)具有联合概率密度f(x,y),则有(2) E(Z)=E[g(X,Y)]=g(x,y)f(x,y)dxdy(2) Z具有概率密度fZ(z),则有:(2) E(Z)=zfZ(z)dz(2) 这里的反常积分绝对收敛. 4.1.3. 数学期望的性质(1) E(C)=C,(C为常数)(2) E(CX)=CE(X)(3) E(X+C)=E(X)+C(4) E(X+Y)=E(X)+E(Y)综合(1)(2)(4)有E(ni=1CiXi)=ni=1CiE(Xi) 4.2. 随机变量的方差4.2.1. 方差及标准差的概念X是一个随机变量,若E{[X-E(X)]2}存在,则称E{[X-E(X)]2}X的方差,记为D(X),即D(X)=E{[X-E(X)]2} 方差的算术平方根D(X)称为X的均方差或标准差. (1) 离散型随机变量的方差(1) D(X)= k[xk-E(X)]2pk(2) 连续型随机变量的方差(2) D(X)=[x-E(X)]2f(x)dx 4.2.2. 方差的计算公式D(X)=E(X2)-[E(X)]2. 4.2.3. 方差的性质(1) D(C)=0,(C为常数);(2) D(CX)=C2D(X)(3) D(X+C)=D(X)(4) X1,X2,,Xm两两独立或两两不相关,则(4) D(C1X1+C2X2++CmXm)=C21D(X1)+C22D(X2)++C2mD(Xm).
分布记号期望方差
0-1分布B(1,p)pp(1-p)
二项分布B(n,p)npnp(1-p)
泊松分布P(𝜆)𝜆𝜆
几何分布G(p)1
p
1-p
p2
超几何分布H(n,M,N)nM
N
nM
N
(1-M
N
)(N-n
N-1
)
均匀分布U(a,b)a+b
2
(b-a)2
12
指数分布E(𝜆)1
𝜆
1
𝜆2
正态分布N(𝜇,𝜎2)𝜇𝜎2
4.3. 协方差4.3.1. 协方差的概念(X,Y)是二维随机变量,如果E[(X-EX)(Y-EY)]存在,则称它为随机变量XY的协方差,记作Cov(X,Y)=E[(X-EX)(Y-EY)]. 4.3.2. 协方差的计算公式对任意两个随机变量X,Y,有(1) Cov(X,Y)=E(XY)-E(X)E(Y)(2) D(X±Y)=D(X)+D(Y)±2Cov(X,Y). 4.3.3. 协方差的性质(1) Cov(X,Y)=Cov(Y,X)(2) Cov(X,X)=D(X)(3) Cov(X,c)=0c为任意常数)(4) Cov(aX,bY)=ab Cov(X,Y))a,b是常数);(5) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y) 4.4. 相关系数4.4.1. 相关系数的定义对于随机变量XY,如果X,Y的方差都不等于零,则称𝜌XY=Cov(X,Y)
D(X)D(Y)
为随机变量XY的相关系数,记作𝜌XY(简记为𝜌
4.4.2. 相关系数的性质(1) |𝜌XY|1(2) 𝜌XY=0时,称XY不相关. (2) X,Y相互独立,则𝜌XY=0,反之不成立;(3) |𝜌|=1XY以概率1线性相关.(3) 常数a>0b,使P{X=aY+b}=1,则𝜌XY=1,此时称XY正相关;(3) 常数a<0b,使P{X=aY+b}=1,则𝜌XY=-1,此时称XY负相关; 4.4.3. 随机变量X,Y等价的五个结论(1) XY不相关(2) 𝜌XY=0(3) Cov(X,Y)=0(4) E(XY)=E(X)E(Y)(5) D(X±Y)=D(X)+D(Y) 5. 大数定律与中心极限定理5.1. 切比雪夫不等式设随机变量X具有E(X)D(X),则任给ε>0,有P{|X-E(X)|𝜀}D(X)
𝜀2
,或P{|X-E(X)|<𝜀}1-D(X)
𝜀2
.
5.2. 大数定律5.2.1. 依概率收敛a是一个常数,Xn为一随机变量序列,𝜀>0 P{|Xn-a|<𝜀}=1P{|Xn-a|𝜀}=0,则称{Xn}依概率收敛于a,记为Xn P a. 5.2.2. 伯努利大数定律(即频率依概率收敛于概率)nAn次独立重复试验中事件A发生的次数,P(A)=p,则𝜀>0,有 P{|nA
n
-p|<𝜀}=1或P{|nA
n
-p|𝜀}=0
5.2.3. 辛钦大数定律设随机变量X1,X2,,Xn相互独立,服从同一分布(任意分布),且具有相同的数学期望E(Xk)=𝜇X=1
x
nk=1Xk
,则 𝜀>0,有
P{|1
n
nk=1xk-𝜇|<𝜀}=1
5.2.4. 切比雪夫大数定律设随机变量X1,X2,,Xn相互独立,数学期望E(Xk),方差D(Xk)均存在,且方差有公共的上界即kD(Xk)CX=1
n
nk=1Xk
,则 𝜀>0,有
P{|1
n
nk=1Xk-𝜇|<𝜀}=1
其中𝜇=1
n
nk=1E(Xk)
.
5.3. 中心极限定理5.3.1. 独立同分布中心极限定理X1,X2,,Xn,是独立同分布的随机变量序列,EXi=𝜇,DXi=𝜎2,i=1,2,,则随机变量Yn=ni=1Xi-n𝜇
n𝜎
的分布函数Fn(x),xR,有
Fn(x)=Φ(x)=1
2𝜋
e-t2
2
dt
即,当n充分大时,ni=1Xi近似地服从以它的均值为均值,它的方差为方差的正态分布,即正态分布为N(n𝜇,n𝜎2). 5.3.2. 拉普拉斯中心极限定理nA表示n重伯努利试验中时间A出现次数,P(A)=p,则随机变量Yn=nA-np
np(1-p)
的分布函数Fn(x)xR,有
Fn(x)=Φ(x)=1
2𝜋
e-t2
2
dt
即,当n充分大时,nA近似地服从它的均值为均值,它的方差为方差的正态分布,即正态分布N(np,np(1-p)). 6. 数理统计的基本概念6.1. 常用统计量X是总体,其均值E(X)=𝜇,方差D(X)=𝜎2.6.1.1. 样本均值X=1
n
ni=1Xi
,样本均值的期望与方差分别为E(X)=𝜇D(X)=𝜎2
n
.
6.1.2. 样本方差S2=1
n-1
ni=1(Xi-X)2=1
n-1
[ni=1X2i-nX2]
,样本方差的期望与方差分别为E(S2)=𝜎2D(S2)=2𝜎4
n-1
样本标准差:S=1
n-1
ni=1(Xi-X)2
6.2. 抽样分布6.2.1. 三大分布(1) 卡方分布:𝜒2𝜒2(n)(a) 定义:设X1,X2,,Xn是相互独立同服从N(0,1)分布,则称𝜒2=X21+X22++X2n的分布为服从自由度为n的卡方分布,记为𝜒2𝜒2(n).(b) 𝛼上分位点:如果P(𝜒2>𝜒2𝛼)=𝛼(0<𝛼<1),则称点𝜒2𝛼(n)𝜒2-𝜒2(n)上的𝛼上分位点.在𝜒2-𝜒2(n)上,𝜒2a(n)𝜒21-𝛼(n)之间没有关系.(c) 性质(i) 𝜒21-𝜒2(n1)𝜒22-𝜒2(n2),且𝜒21,𝜒22相互独立,则𝜒21+𝜒22𝜒2(n1+n2).该性质可推广到任意有限个的情况.(ii) 𝜒2𝜒2(n),则E(𝜒2)=nD(𝜒2)=2n.(1) (2) t分布:Tt(n)(a) 定义:设XN(0,1)Y𝜒2(n),且X,Y相互独立,则称T=X
Y
n
的分布为服从参数为nt分布,记为Tt(n).
(b) t分布的概率密度函数为偶函数.(c) 𝛼上分位点:如果P(T>tn(n))=𝛼(0<𝛼<1),则称点t𝛼(n)Tt(n)上的𝛼上分位点.(d) 关系:t1-𝛼(n)=-t𝛼(n)(2) (3) F分布:FF(n1,n2)(a) 定义:设X𝜒2(n1)Y𝜒2(n2),且X,Y相互独立,则称F=X
n1
Y
n2
的分布为服从参数为(n1,n2)F分布,记为FF(n1,n2)
(b) 𝛼分位点:如果P(F>F𝛼(n1,n2))=𝛼(0<𝛼<1),称点F𝛼(n1,n2)FF(n1,n2)上的𝛼分位点.(c) 性质:设FF(n1,n2),则称1
F
F(n1,n2)
(d) 关系:F1-𝛼(n1,n2)=1
F𝛼(n2,n1)
6.3. 关于样本的分布1. 设单正态总体XN(𝜇,𝜎2),其样本为X1,X2,,Xn,样本均值为X,样本方差为S2.a. X-𝜇
𝜎
n
N(0,1)
X-N(𝜇,𝜎2
n
)
b. ni=1(Xi-𝜇)
𝜎2
𝜒2(n)
c. (n-1)S2
𝜎2
𝜒2(n-1)
ni=1(Xi-X)2
𝜎2
𝜒2(n-1)
),且XS2相互独立
d. X-𝜇
S
n
t(n-1)
2. 设双正态总体XN(𝜇1,𝜎21),其样本为X1,X2,,Xn1,样本均值为X,样本方差为S21Y-N(𝜇2,𝜎22),其样本为Y1,Y2,,Yn2,样本均值为Y,样本方差为S22,且样本X1,X2,,Xn1Y1,Y2,,Yn2相互独立.2. a. 𝜎22S21
𝜎21S22
F(n1-1,n2-1)
b. n2𝜎22n1i=1(Xi-𝜇1)2
n1𝜎21n2i=1(Xi-𝜇2)2
F(n1,n2)
c. X-Y-(𝜇1-𝜇2)
𝜎21
n1
+𝜎22
n2
N(0,1)
d. 𝜎21=𝜎22未知时,X-Y-(𝜇1-𝜇2)
Sw1
n1
+1
n2
t(n1+n2-2)
其中Sw=(n1-1)S21+(n2-1)S22
n1+n2-2
7. 参数估计与假设检验7.1. 点估计X1,X2,,Xn为来自总体X的样本,若将样本的某个函数ˆ𝜃(X1,X2,,Xn)作为总体分布中未知参数𝜃的估计,则称ˆ𝜃𝜃的点估计量. 在抽样后,ˆ𝜃的值ˆ𝜃(x1,x2,,xn)称为𝜃的估计值. 点估计分为矩估计量与最大似然估计法. 7.1.1. 矩估计法设总体X的分布中含有m个未知参数𝜃1,𝜃2,,𝜃m,令 E(Xk)=1
n
ni=1Xki,k=1,2,,m
则由上述方程所求得的解:ˆ𝜃k(X1,X2,,Xn),k=1,2,,m称为未知参数𝜃K的矩估计量,简称矩估计,只要掌握m=1,2的情形. 7.1.2. 最大似然估计法设总体X的概率密度为f(x,𝜃1,,𝜃m)(若X为离散型,则用分布律代替),𝜃1,,𝜃m为未知参数,记x1,,xn为样本X1,,Xn的观测值,则称 L(x1,,xn;𝜃1,,𝜃m)=ni=1f(xi;𝜃1,,𝜃m)为似然函数,若有ˆ𝜃(x1,,xn)(i=1,,m)使得 L(x1,,xn;ˆ𝜃1,,ˆ𝜃m)=
max
(𝜃1,⋯,𝜃m)
L(x1,,xn;𝜃1,,𝜃m)
则称ˆ𝜃i(x1,,xn)𝜃1的最大似然估计值,而将ˆ𝜃i(X1,,Xn)称为𝜃i最大似然估计量(i=1,2,,m).只要掌握m=1,2的情形. 对于最大似然估计,其求解步骤为:(1) 写出似然函数L(x1,x2,,xn;𝜃1,,𝜃m)=ni=1f(xi;𝜃1,,𝜃m)(2) 取对数lnL(3) 求偏导数lnL
𝜕𝜃i
,i=1,2,,m;
(4) 判断方程(组)𝜕lnL
𝜕𝜃i
=0
是否有解,若有解,则其解即为所求最大似然估计,若无解,则最大似然估计常在𝜃i的边界上达到。
7.2. 估计量的评选标准7.2.1. 无偏性ˆ𝜃i(X1,,Xn)𝜃的估计量,若E(ˆ𝜃)=𝜃,则称ˆ𝜃𝜃的无偏估计. 7.2.2. 有效性ˆ𝜃1,ˆ𝜃2均为𝜃的无偏估计,若D(ˆ𝜃1)<D(ˆ𝜃2),则称ˆ𝜃1ˆ𝜃2有效. 7.2.3. 一致性ˆ𝜃𝜃的估计量,若对任意的𝜀>0,有 P(|ˆ𝜃-𝜃|<𝜀)=1ˆ𝜃 P 𝜃, n,则称ˆ𝜃𝜃的一致估计量(或相合估计量). 7.3. 区间估计𝜃为总X总的分布中的位置参数,X1,X2,,Xn为取自X的样本,若存在两个统计两ˆ𝜃1(X1,X2,,Xn)ˆ𝜃2(X1,X2,,Xn)使得对给定的a(0<a<1),有 P{ˆ𝜃1𝜃ˆ𝜃2}=1-a则称[ˆ𝜃1,ˆ𝜃2]𝜃的置信度为1-a的置信区间,ˆ𝜃1,ˆ𝜃2分别称为置信下限和置信上限. 正态总体未知参数的置信区间如下页表.
待估参数抽样分布双侧置信区间
𝜇𝜎2已知U=X-𝜇
𝜎
n
N(0,1)
(X-𝜇𝛼
2
𝜎
n
,X+𝜇𝛼
2
𝜎
n
)
P{|U|𝜇𝛼
2
}=𝛼
𝜎2未知T=X-𝜇
S/n
t(n-1)
(X-t𝛼
2
S
n
,X+t𝛼
2
S
n
)
P{|T|t𝛼}=𝛼
𝜎2𝜇已知 W=1
𝜎2
nj=1(Xi-u)2𝜒2(n)
P{W𝜒2a
2
(n)}=P{W𝜒21-a
2
(n)}=a
2
𝜇未知W=(n-1)S2
𝜎2
𝜒2(n-1)
((n-1)S2
𝜒2a
2
(n-1),(n-1)S2
𝜒21-a
2
(n-1)
)
𝜇-𝜇2𝜎21,𝜎22已知U=(X1-X2)-(𝜇1-𝜇2)
𝜎21
n1
+𝜎22
n2
N
a
((X1-X2)-u0
2
𝜎21
n1
+𝜎22
n2
,|
|(X1-X2)+ua
2
𝜎21
n1
+𝜎22
n2
,)
P{|U|ua
2
}=a
已知𝜎21=𝜎22=𝜎2𝜎2未知a
T=(X1-X2)-(𝜇1-𝜇2)
S1
n1
+1
n2
-t(n1+n2-2|
S2=(n1-1)S21+(n2-1)S22
n1+n2-2
a
((X1-X2)-ta
2
(n1+n2-2)S1
n1
+1
n2
|
|(X1-X2)+ta
2
(n1+n2-2)S1
n1
+1
n2
,)
P{|T|ta}=a
𝜎21
𝜎22
F=S21
𝜎21
S22
𝜎22
-F(n1-1,n2-1)
(1
Fa
2
(n1-1,n2-1)
S21
𝜎22
,
Fa
2
(n2-1,n1-1)S21
S22
)
P{FFa
2
(m1-1,n2-1)}=a
2
,
P{1
F
Fa
2
(n2-1,n1-1)}=a
2
,
7.4. 假设检验7.4.1. 显著性检验的基本思想为了对总体的分布类型或分布中的未知参数做出推断,首先对它们提出一个假设H0,然后再H0为真的条件下,通过选取恰当的统计量来构造一个小概率事件,若在一次试验中,小概率事件居然发生了,就完全有理由拒绝H0的正确性,否则没有充分理由拒绝H0的正确性,从而接受H0,这就是显著性检验的基本思想. 7.4.2. 假设检验的基本步骤(1) 由实际问题提出原假设H0(与备选假设H1);(2) 选取适当的统计量,并在H0为真的条件下确定该统计量的分布;(3) 根据问题要求确定显著性水平𝛼(一般题目中会给定),从而得到拒绝域;(4) 由样本观测值计算统计量的观测值,看是否属于拒绝域,从而对H0做出判断. 7.4.3. 两类错误H0本来是正确的,但检验后作出了拒绝H0的判断,这种错误称为第一类错误,也称拒真错误;当H0本来是不正确的,但检验后作出了接受H0的判断,这种错误称为第二类错误,也称受伪错误。 7.4.4. 正态总体未知参数的假设检验(检验水平𝛼
原假设H0H0下的检验统计量及分布H0的拒绝域
一个正态分布𝜇=𝜇0(𝜎2已知)U=X-𝜇0
𝜎/n
N(0,1)
|u|=|x-𝜇0
𝜎/n
|u𝛼
2
𝜇=𝜇0(𝜎2未知) T=X-𝜇0
S/n
t(n-1)
|t|=|x-𝜇0
S/n
|t𝛼
2
(n-1)
𝜎2=𝜎20(𝜇已知) W=ni=1(Xi-𝜇
𝜎0
)2𝜒2(n)
w=ni=1(xi-𝜇
𝜎0
)2𝜒2𝛼
2
(n)
w𝜒21-𝛼
2
(n)
𝜎2=𝜎20(𝜇未知) W=(n-1)S2
𝜎20
𝜒2(n-1)
w=(n-1)S2
𝜎20
𝜒2𝛼
2
(n-1)
w𝜒21-𝛼
2
(n-1)
两个正态分布𝜇1-𝜇2=𝛿(𝜎21,𝜎22已知) U=X1-X2-𝛿
𝜎21
n1
+𝜎22
n2
N(0,1)
|u|=|X1-X2-𝛿
𝜎21
n1
+𝜎22
n2
|u𝛼
2
𝜇1-𝜇2=𝛿(𝜎21,𝜎22未知,但𝜎21=𝜎22) T=X1-X2-𝛿
SW1
n1
+1
n2
t(n1+n2-2)
S2W=(n1-1)S21+(n2-1)S22
n1+n2-1
|t|=|X1-X2-𝛿
SW1
n1
+1
n2
|t𝛼
2
(n1+n2-2)
𝜎21=𝜎22(𝜇1,𝜇2未知) F=S21
S22
F(n1-1,n2-1)
f=S21
S22
F𝛼
2
(n1-1,n2-1)
或fF-1𝛼
2
(n2-1,n1-1)
1长杆变短杆,开口换方向