知识清单

1. 二项分布

二项分布(binomial distribution),是指只有两种可能结果的n此独立重复实验中,出现阳性次数X的一种概论分布

1.1 适用条件

1.2 性质

 
 

1.3 应用

1.3.1 总体率的区间估计与假设检验(精确检验)

n<=50的小样本只能直接查表(如13名手术患者进行治疗,6人痊愈,估计其痊愈率的95%可信区间,并与一疗效为50%的治疗方案有无差异?)

 

参考:
https://stat.ethz.ch/R-manual/R-devel/library/stats/html/binom.test.html
https://stackoverflow.com/questions/21719578/confidence-interval-for-binomial-data-in-r
n较大、p和1-p均不太小,np和n(1-p)均大于5时,可近似正态分布

 

计算1-alpha的可信区间可以近似为:

 

如100人接受药物治疗后55人有效,估计有效率95%可信区间

 
1.3.2 样本率与总体率的比较
直接法

分单侧(优或劣问题)和双侧(是否相同问题),这两种情况的算法截然不同【但是单侧和双侧的基本思想与t检验这些都相同的, 即双侧检验计算小于当前事件概率的所有小概率事件之和得出p值,单侧检验计算小于当前事件并且值大于或者小于当前X值的事件概率之和得出p值】,下面以例题代码演示

 

 
 
正态近似法

条件:n较大,p和1-p均不太小,np和n(1-p)均大于5,二项分布可近似正态分布,其u值计算公式为

 
1.3.3 两样本率的比较

条件:n1与n2均较大,p1、p2、1-p1和1-p2均不太小(n1p1、n1(1-p1)、n2p2、n2(1-p2)均大于5),可利用样本率的分布近似正态分布且独立两正态变量之差也服从正态分布的性质,采用近似正态法对两总体率进行统计检验,u的计算公式为:

 
1.3.4 非遗传疾病的家族聚集性
1.3.5 做群检验
 

2. Poisson分布

Poisson分布是二项分布的一种极端情况,已发展为描述小概率事件发生规律的一种重要分布,如分析发病率低的非传染性疾病发病或人数分布等、单位时间或面积、空间某罕见事物的分布,对应概率为

 

\lambda为总体均数,e=2.71828为一常数

2.1 适用条件

假定在某观测单位内,某事件(如“阳性”)平均发生次数为lambda,且规定改观测单位可等分为充分多的n粉,其样本计数为X(X=0, 1, 2,···),则在满足该条件时,有X~P(lambda):

  1. 普通性
    在充分小的观测单位上X的取值最多为1
  2. 独立增量性
    每个观测单位上X的取值与前面各观测单位无关
  3. 平稳性
    X的取值只与观测单位的大小有关,而与观测单位的位置无关,即每一次使用阳性发生的概率都应相同,为pi=lambda/x,这样阳性数X的取值只与重复试验的次数相关,为合计的阳性总数,可看作是大量独立试验的总结果

2.2 性质和图形

  1. 总体均数与总体方差相等
  2. n很大pi很小,且npi=lambda时,二项分布近似Poisson分布
  3. lambda增大时,Poisson分布渐近正态分布,lambda>=20时可作为正态分布
  4. Possion分布具有可加性(和正态分布类似),但不具有可乘性(可由X取值和均数,方差看出)
  5. Poisson分布的图形,若lambda时整数,则在X=lambda和X=lambda-1处有最大概率
 

2.3 Poisson分布的应用

2.3.1 总体均数的区间估计
查表法(X<=50)

例:1立升空气测得粉尘粒子数为21,估计改车间平均每立升空气粉尘颗粒的95%和99%可信区间

 


参考:
https://artax.karlin.mff.cuni.cz/r-help/library/exactci/html/poisson.exact.html

近似正态法(X>50)

计算1-alpha的可信区间可以近似为:

 

其结果意义为平均每个单位阳性数的1-alpha可行区间。

2.3.2 样本均数与总体均数的比较

有二项分布相同有直接法和近似正态法两种,其分界为lambda>=20

 

正态近似法(lambda>=20),u的计算公式为:

 
2.3.3 两样本均数的比较(正态近似)
1. 两样本观察单位数相等
 
 
2. 两样本观察单位数不相等
 
 

其中

 

3. 负二项分布

概率论中,负二项分布(帕斯卡分布)的期望到底是哪个?
最近在看随机过程,看到负二项分布这部分,X~NB(k,p),发现其期望有两种说法,有的说是EX=k/p,有的说是EX=k(1-p)/p。有点懵,还望大神答疑解惑?

负二项分布NB(k,p), 我在不同的教材和wiki上见过四种定义

目测题主看到的第一种期望是定义1,第二个答案是定义2。具体计算另一个回答已经写了。
作者:张雨萌
链接:https://www.zhihu.com/question/54435013/answer/139334781
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

各种分布的关系图:

来源:
http://www.math.wm.edu/~leemis/chart/UDR/UDR.html