留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

卡方检验误用辨析

张平原 王开发

张平原, 王开发. 卡方检验误用辨析[J]. 中华烧伤与创面修复杂志, 2024, 40(5): 1-7. DOI: 10.3760/cma.j.cn501225-20240103-00004.
引用本文: 张平原, 王开发. 卡方检验误用辨析[J]. 中华烧伤与创面修复杂志, 2024, 40(5): 1-7. DOI: 10.3760/cma.j.cn501225-20240103-00004.
Zhang Pingyuan,Wang Kaifa.Analysis of misuse of chi-square test[J].Chin J Burns Wounds,2024,40(5):1-7.DOI: 10.3760/cma.j.cn501225-20240103-00004.
Citation: Zhang Pingyuan,Wang Kaifa.Analysis of misuse of chi-square test[J].Chin J Burns Wounds,2024,40(5):1-7.DOI: 10.3760/cma.j.cn501225-20240103-00004.

卡方检验误用辨析

doi: 10.3760/cma.j.cn501225-20240103-00004
详细信息
    通讯作者:

    王开发,Email:kfwang72@163.com

Analysis of misuse of chi-square test

More Information
  • 摘要: 计数资料在生物医学研究中十分常见,此类资料常常被整理为列联表的形式。对计数资料,常见的研究目的是检验2个因素之间是否独立,因此常用 χ 2检验来进行统计分析,却容易忽略 χ 2检验的适用条件和不同条件下对结果的校正。此外,对计数资料,还有检验2个分类变量之间是否存在线性变化趋势、结果是否一致等研究目的,因此如何根据不同的研究目的选择合适的检验方法,也是实际应用时值得关注的问题。该文通过系列实例比较系统地总结归纳了各类计数资料的常用统计分析方法,并对常见的误用情况进行了辨析。

     

  • 1  2×2列联表资料统计检验方法的选择流程图

    注:N为样本总例数,Aij表示第i行第j列格子的实际频数,Tij表示相应第i行第j列格子的理论频数,i=1,2,j=1,2

    2  R×C列联表资料统计检验方法的选择流程图

    注:R×C里的R和C分别指的是因素A和因素B的水平数;Tij为理论频数;如果Tij<5,f(Tij)=0,否则f(Tij)=1

    表1  2×2列联表的数据格式

    因素B 因素A 合计
    水平1 水平2
    水平1 A 11 ( T 11 % ) A 12 ( T 12 % ) N 1 .
    水平2 A 21 ( T 21 % ) A 22 ( T 22 % ) N 2 .
    合计 N . 1 N . 2 N
    注: N 为样本总例数, A i j 表示第 i 行第 j 列格子的实际频数, T i j 表示相应第 i 行第 j 列格子的理论频数, i = 1,2 , j = 1,2
    下载: 导出CSV

    表2  有德尔菲淋巴结与没有德尔菲淋巴结的甲状腺乳头状癌患者的中央淋巴结转移结果[例(理论频数)]

    德尔菲淋巴结 中央淋巴结转移 合计
    阳性 阴性
    阳性 20(16.82) 10(13.17) 30
    阴性 3(6.17) 8(4.82) 11
    合计 23 18 41
    下载: 导出CSV

    表3  药膏A和药膏B治疗患者皮肤软组织感染的结果[例(理论频数)]

    药膏 疗效 合计
    有效 无效
    药膏A 38(36.61) 1(2.39) 39
    药膏B 8(9.39) 2(0.61) 10
    合计 46 3 49
    下载: 导出CSV

    表4  检测方法A与检测方法B的检测结果(例)

    检测方法A 检测方法B 合计
    阳性 阴性
    阳性 31 14 45
    阴性 40 35 75
    合计 71 49 120
    下载: 导出CSV

    表5  患者末梢血与静脉血乙型肝炎抗原检测结果(例)

    静脉血 末梢血 合计
    阳性 阴性
    阳性 25 9 34
    阴性 20 83 103
    合计 45 92 137
    下载: 导出CSV

    表6  R×C列联表的数据格式

    因素B (分组变量) 因素A(指标变量) 合计
    水平1 水平2 …… 水平 m
    水平1 A 11 ( T 11 % ) A 12 ( T 12 % ) …… A 1 m ( T 1 m % ) N 1 .
    水平2 A 21 ( T 21 % ) A 22 ( T 22 % ) …… A 2 m ( T 2 m % ) N 2 .
    …… …… …… …… …… ……
    水平 n A n 1 ( T n 1 % ) A n 2 ( T n 2 % ) …… A n m ( T n m % ) N n .
    合计 N . 1 N . 2 …… N . m N
    注: N 为样本总例数, A i j 表示第 i 行第 j 列格子的实际频数, T i j 表示相应第 i 行第 j 列格子的理论频数, i = 1,2 , , n , j = 1,2 , , m
    下载: 导出CSV

    表7  某癌症3个亚种患者的地区分布[例(理论频数)]

    癌症类型 地区 合计
    地区1 地区2 地区3
    亚种1 2(3.44) 3(3.93) 10(7.62) 15
    亚种2 8(3.67) 3(4.20) 5(8.13) 16
    亚种3 4(6.89) 10(7.87) 16(15.25) 30
    合计 14 16 31 61
    下载: 导出CSV

    表8  3种药物治疗患者高血压的疗效情况(例)

    药物类型 无效 好转 显效 治愈 合计
    药物A 6 7 20 9 42
    药物B 5 9 11 22 47
    药物C 10 5 8 15 38
    合计 21 21 39 46 127
    下载: 导出CSV

    表9  不同年龄段体检者的高血压分布(例)

    年龄段 高血压 合计
    <18岁 15 85 100
    ≥18岁且<35岁 27 76 103
    ≥35岁且<60岁 75 115 190
    ≥60岁 48 56 104
    合计 165 332 497
    下载: 导出CSV

    表10  2种检测方法的检测结果(例)

    检测方法B 检测方法A 合计
    - + ++
    - 19 10 8 37
    + 4 16 3 23
    ++ 9 13 21 43
    合计 32 39 32 103
    下载: 导出CSV

    表11  不同年龄段的某疾病患者疗效情况(例)

    年龄段 无效 好转 治愈 合计
    <18岁 8 32 45 85
    ≥18岁且<45岁 4 25 37 66
    ≥45岁 11 18 26 55
    合计 23 75 108 206
    下载: 导出CSV

    表12  3种中药方剂对腰间盘突出患者的疗效[例(理论频数)]

    中药方剂类型 疗效 合计
    有效 无效
    方剂A 24(28.56) 20(15.44) 44
    方剂B 20(22.07) 14(11.93) 34
    方剂C 30(23.37) 6(12.63) 36
    合计 74 40 114
    下载: 导出CSV

    表13  3种方剂治疗患者的总体有效率间的两两比较[例(%)]

    对比组 2×2列联表 χ 2 P
    方剂A组与方剂B组 24(54.55) 20(45.45) 0.14 0.706
    20(58.82) 14(41.18)
    方剂A组与方剂C组 24(44.44) 20(55.56) 7.48 0.006
    30(83.33) 6(16.67)
    方剂B组与方剂C组 20(58.82) 14(41.18) 5.15 0.023
    30(83.33) 6(16.67)
    下载: 导出CSV

    表14  按年龄分层的心肌梗死与高血压的病例对照研究结果(例)

    年龄段 分组 高血压 合计
    <35岁 病例组 155 53 208
    对照组 88 43 131
    小计 243 96 339
    ≥35岁 病例组 213 165 378
    对照组 145 254 399
    小计 358 419 777
    合计 601 515 1 116
    下载: 导出CSV
  • [1] 方积乾. 生物医学研究的统计方法[M]. 2版. 北京: 高等教育出版社, 2019.
    [2] 孙振球, 徐勇勇. 医学统计学[M]. 4版. 北京: 人民卫生出版社, 2014.
    [3] 贾俊平,何晓琴,金勇进. 统计学[M]. 7版. 北京: 中国人民大学出版社, 2018.
    [4] 冯国双.分类资料组间比较的思路及误区分析[J].中华全科医师杂志,2017,16(6):490-492.DOI: 10.3760/cma.j.issn.1671-7368.2017.06.022.
    [5] YatesF. Contingency tables involving small numbers and the χ 2 test[J]. Supp J R Stat Soc, 1934, 1(2): 217-235. DOI: 10.2307/2983604.
    [6] FisherRA. The logic of inductive inference[J]. J R Stat Soc, 1935, 98(1): 39-82. DOI: 10.2307/2342435.
    [7] 吴学森,王洁贞.双向有序分类资料线性趋势分析方法的前提条件[J].中国卫生统计,2003,20(2):79-81.DOI: 10.3969/j.issn.1002-3674.2003.02.005.
    [8] 胡纯严,胡良平.如何正确运用χ 2检验——两种单向有序二维列联表资料线性趋势χ 2检验[J].四川精神卫生,2021,34(2):116-120.DOI: 10.11886/scjsws20210316004.
    [9] 金英良,赵华硕,黄水平,等.配对四格表资料的SPSS软件实现及相关结果解读[J].预防医学论坛,2017,23(3):171-173,179. DOI: 10.16406/j.pmt.issn.1672-9153.2017.03.004.
  • 加载中
图(2) / 表(14)
计量
  • 文章访问数:  23
  • HTML全文浏览量:  9
  • PDF下载量:  5
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-01-03
  • 网络出版日期:  2024-04-30

目录

    /

    返回文章
    返回