知识点

1. 卡方分布

当自由度趋于无穷大时,图形趋于正态分布

 
 
 
 
 

  1. 定义为:若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于 标准正态分布),则这n个服从标准正态分布的随机变量的平方和服从卡方分布
  2. 可加性:两个服从卡方分布的独立随机变量相加服从自由度为两自由度之和的卡方分布
  3. 卡方检验的基本思想:由于在假设符合某种情况的前提下,样本实际值偏离理论值的偏差服从正态分布,其均值为理论值,方差也为理论值???(有点疑惑)

2. 四格表资料的卡方检验

书上P98例7-2:表格为

组别有效无效合计
胞磷胆碱组46652
神经节苷酯组18826
合计641478

H0:两种药物疗效相同 H1:有效率不等

 
 
 

得到warning "Chi-squared approximation may be incorrect" 因为表格中有T<5, 此时可以采用校正【自动校正】或者fisher.test() 可以用以下代码查看理论值

 
 
 

参考: http://r.789695.n4.nabble.com/In-chisq-test-x-Chi-squared-approximation-may-be-incorrect-td845040.html

3. 四格表资料的Fisher确切概率法

假设两组(预防组和非预防组)的感染率都是9:33【零假设】,则边缘值固定的情况下,相当于在总数33的所有个体中【有9个感染的,24个未感染的】,取22个值作为有效组,在这22个值中,记感染的人数为X,则X~h(22, 9, 24)。 H0: 两个组无查别

 
 
 
 
 
 

4. 配对四格表的卡方检验

 
 
 
 

参考: https://stat.ethz.ch/R-manual/R-devel/library/stats/html/mcnemar.test.html

5. 行*列资料的卡方检验

 
 
 
 

方法2:

 
 

参考: https://www.rdocumentation.org/packages/DescTools/versions/0.99.19/topics/Association%20measures

6. 多个样本率之间的多重比较

7. 频数分布拟合度的卡方检验