如何用spss做卡方检验:适配计数数据的组间差异检验实操
上次处理问卷调研的分类数据,需要对比不同人群的选择差异,熬了大半夜琢磨如何用spss做卡方检验,一开始凭着直觉瞎操作,跑出的结果全部无效,反复试错之后,总算摸出了一套新手零弯路的实操流程。我当时手里的数据全是分类计数数据,比如性别、学历、是否认可观点这类非连续变量,根本不适合用T检验、方差分析,卡方检验是唯一适配的分析方式,这也是很多新手最容易搞错的第一步。
最开始的致命错误,全出在数据录入环节。
很多新手包括我当时,图省事直接把汇总好的频数填进SPSS变量表里,比如男生同意30人、不同意20人,女生同意25人、不同意28人,直接把数字敲进去就开始跑检验,最后出来的表格完全错乱,毫无参考价值。折腾好久才搞明白,SPSS的卡方检验不识别汇总频数数据,要么录入每一条原始个案数据,每一行代表一个调研样本,要么开启加权个案功能,这是整个操作最核心的前提,跳过这一步后面所有操作都是白费功夫。
老老实实调整数据格式后,操作流程就变得特别清晰。先在变量视图建好两个分类变量,一个是分组变量,一个是结局变量,全部设置为名义尺度,再回到数据视图,逐条录入原始样本数据,确保每一个样本的两组分类信息都对应准确,没有空值和乱码。数据整理干净之后,后续的软件操作基本不会出问题。
录入完成后,才进入正式操作步骤。
点开顶部菜单栏的分析,找到描述统计下的交叉表选项,这是卡方检验的专属入口,不要在其他功能里乱找。把分组变量放入行框,结局变量放入列框,变量摆放顺序不影响检验结果,只是表格展示样式会不一样。接着点击右侧的统计量,单独勾选卡方选项,很多人会顺手勾选其他无关参数,反而让输出表格杂乱冗余,没必要多此一举。
单元格设置里,一定要勾选观察值和期望值。
这是我当初漏掉的关键步骤,只勾了观察值,看不到期望计数值,就没办法判断检验结果是否有效。全部设置完成后,点击确定,等待软件自动生成分析表格,整个过程几秒钟就能完成,没有复杂的运算等待。
结果出来之后,判读标准是新手最容易混淆的点。之前一直盯着皮尔逊卡方的p值乱判断,完全忽略了样本量的适配条件。后来才反应过来,表格里的期望计数全部大于5、总样本量超过40,直接看皮尔逊卡方的显著性p值就行;如果有1-2个单元格期望计数在1-5之间,就要看连续性修正后的数值;要是存在期望计数小于1的单元格,必须参考费希尔精确检验的结果,强行用皮尔逊卡方得出的结论是完全错误的。
当时按照这个标准重新核对了所有数据,替换了对应的检验参考值,修正了之前的错误结论,最终跑出的结果完全符合数据分析报告的规范,差异显著与否的判断也精准无误。整个流程没有任何复杂技巧,所有问题基本都是新手的细节疏漏导致的。
关掉SPSS窗口的时候,电脑屏幕还亮着交叉分析的结果表格,桌面散落的Excel数据表还停留在最初错误的汇总录入界面。