交叉表分析(三)
McNemar检验、风险分析
P-P图和Q-Q图的应用
———————
上一期给大家分享了各个复选框的用途
今天就带大家一起详细操作一下吧
01
首先,进行数据导入——“精神焦虑与慢性胃病”。一般交叉表分析使用的数据用两种,第一种我们之前用到的原始数据,第二种是对已经整理汇总好的表格数据。
我们将精神焦虑设为1,非精神焦虑设为2,患胃病设为1,未患胃病设为2,在SPSS中的数据形式如下:
我们点击“数据”→“个案加权”。
点击“个案加权系数”,将“频数”导入“频率变量”框内,点击确定。
点击“分析”→“描述统计”→“交叉表”
将焦虑情况导入“行”,患胃病情况导入“列”
点击“统计”,勾选“风险”和“麦克尼马尔”,点击确定。
得到输出结果如下:
可以看到,麦克尼马尔检验的显著性水平为0.小于0.05,认为不同的焦虑情况的人患胃病的可能性有差异,这种差距具有统计学意义。
“风险”是计算相对危险度和比数比,表明事件的发生和某因素之间的关联性,如检验心脏病是否与吸烟有关。如果该系数的置信区间包括1,那么认为事件的发生和这个因素没有关系。当某因素发生的可能性非常小时,使用比数比统计量作为相对危度的测得。
从风险评估表中可得,精神焦虑情况和患胃病情况有关联,焦虑情况(1/2)的比值比,即精神焦虑的人群患胃病的比例是非精神焦虑时的2.倍,这个比值可以由表中的2./0.得到。
02
Kappa复选框的使用
Kappa用来检验对同一对象两种评估的一致性,它仅仅适用于具有相同分类值和相同分类数的列联表,如2X2、3X3的列联表。
搜集了两位医生针对同一批矽肺胸片做出的矽肺分级诊断结果,为了评价两位医生所做出的诊断结果是否一致,采用Kappa检验进行分析。
对数据进行整理,数据形式如下:
点击“数据”→“个案加权”
把频数导入“频率变量”,点击确定”
点击“分析”→“描述统计”→“交叉表”
将A医生导入“行”,B医生导入“列”
点击“统计”,选择“Kappa”
点击确定,得到输出结果如下:
从上图可知,AB两医生诊断的Kappa值为0.。
一般来说:当Kappa值在0.8-1.0之间,比较的两试验结果一致性很好,在0.6-0.8之间,一致性较好,在0..4-0.6之间时,一致性中等,在0.2-0.4之间时,一致性一般,在0.2以下时一致性较差,当Kappa值小于零,说明诊断试验结果完全不一致。
因此,两医生的针对同一批矽肺胸片做出的矽肺分级诊断结果一致性较差。
03
Q-Q图的应用
Q-Q图和P-P图都是根据累积分布函数理论计算的,使用它们可以进行数据是哪种分布的检验,常用于检验数据是否服从正态分布。如果图形中所有点都聚集在直线上,则说明变量分布服从于所要检验的分布。不同的是P-P图根据变量的累计概率绘制散点图,Q-Q图根据变量的分位数绘制散点图。那么如何使用呢?
点击“分析”→“描述统计”→“Q-Q图”
将“hight”变量导入变量框内,点击确定
得到输出结果如下:
所有点都在直线上,表明数据服从正态分布,并且去趋势正态图可以看出个点是无规则的,表明是随机的。
P-P图的应用
首先我们导入数据。
点击“分析”→“描述统计”→“P-P图”,将需要检验的变量导入“变量”框内,选择“正态”并点击确定。
得到输出结果如下:
从图中可以看到,各点的分布没有完全在直线上,因此得出分布不呈正态分布。
那么接下来将这个变量转换成自然对数数据,检验转换后的变量是否服从正态分布。
操作与之前相同,只需要在“转换”栏内勾选“自然对数转换”即可。
由图可知,几乎所有的点都在直线上,因此可以得出转换后的数据分布是近似正态的。结论是对非正态分布的变量,经过转换后呈正态分布,这时就可以用转换后的数据使用正态性假定的方法进行分析了。
作者:马宏乐
扫