spss课件18.ppt
IBM-SPSS,第18章 对数线性模型,对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。对于列联表资料,通常作2 检验,但2 检验无法系统地评价变量间的联系,也无法估计变量间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。对数线性模型分析是把列联表资料的网格频数的对数表示为各变量及其交互效应的线性模型,然后运用类似方差分析的基本思想检验各变量及其交互效应的作用大小。,例18.1:某研究者分析育龄夫妇是否领取独生子女证与所生育的第一个孩子性别的关系,并定量描述第一个孩子的性别对后续生育决策的影响。数据见图18-5,数据库见例18-1.sav,数据库构建样式见图18-6所示。,模块解读1调用常规过程单击“分析”|“对数线性模型”|“常规”命令,弹出图18-1所示的“常规对数线性分析”对话框。,(1)“因子”选项栏:用于选入参与本次分析的因素变量。(2)“单元协变量”:用于选入单元格协变量。(3)“单元结构”:用于放入单元格结构变量,即定义权重变量。(4)“对比变量”:用于选入连续型对照变量,以便计算广义对数比率。,2“单元计数分布”选项栏(1)“泊松”选择项:当分析变量分布符合泊松分布时选用。(2)“多项式分布”:当分析变量符合多项式分布时选用。,3“保存”按钮当单击图18-1右上角“保存”按钮时,弹出图18-2所示的“常规对数线性分析-保存”对话框,其中还有残差、标准残差值、调节的残差值、偏离残差和预测值,当选择后,将会在数据库文件中产生相应的变量。,4“模型”按钮单击“模型”按钮,弹出图18-3所示的“常规对数线性分析-模型”对话框,经过前面的学习,此对话框我们已经非常熟悉,其设置于解释与前面讲的多因素方差分析类似,此处不赘。,5“选项”按钮单击“选项”按钮,弹出图18-4所示的“常规对数线性分析:选项”对话框,包含如下项目。(1)“输出”:用于对输出那些统计量进行设置,此处包括频数、残差、设计矩阵、估计。(2)“图”:用于设置输出图形的相关参数,包括调节的残差值、调节残差值的正态概率、偏差残差以及偏差的正态概率。(3)“置信区间”:用于设置参数的置信区间,软件默认95%。(4)“标准”:用于设置模型构建过程中的迭代参数,包括最大迭代数,收敛性和Delta调整系数。通常采用默认值。,2主要结果解读(1)图18-7所示为构建模型的数据信息与迭代信息,可见有效单元格4个,0缺失,有效加权个案共765人,模型中2个变量均为2分类;收敛信息显示设置的最大迭代次数为20次,收敛容许度0.001,本例迭代次数为2次迭代就达到收敛条件。,(2)图18-8所示为模型拟合优度检验信息,结果可见似然比检验值为10.284,P=0.001,Pearson卡方检验值为10.258,P=0.001,均小于0.05,说明拟合效果不理想。可能2个变量间存在交互效应。,(3)图18-9所示为单元格计数与残差结果,图中包括观测计数、预期计数、残差、标准化残差、调整残差与偏差。其中调整残差被多数学者认为进行残差判断的较好指标,当调整残差的绝对值小于2时,认为残差分布符合正态分布,此处调整残差绝对值均大于3,因此残差分布不符合正态,结论与拟合度检验相互佐证。,(4)图18-10所示为参数估计的结果,图中可见独生子女证与性别的P值分别为0.206、0.263,均无统计学意义。,(5)图18-11所示为调整残差的标准Q-Q图,图18-12所示为调整残差的消除趋势标准Q-Q图,分别对残差进行作图,图中也可见,残差分布不符合正态分布。,(6)因为上述结果暗示存在交互效应,本例再采用饱和模型分析,其他结果不再展示,如图18-13所示为采用饱和模型分析的参数估计结果,图中可见独生子女证=1(领取)与性别=1(男孩)有显著性意义,P=0.001,意味着生男孩的父母易于领取独生子女证。,例18.2:英国男性医生冠心病死亡与抽烟关系研究的资料,请推断冠心病死亡与抽烟、年龄是否有关?数据如图18-14所示,SPSS数据库见例18-2.sav,数据库构建格式如图18-15所示。,1操作步骤(1)单击“数据”|“加权”命令,弹出加权对话框,对变量“死亡人数”进行加权,然后单击“确定”按钮。(2)单击“分析”|“对数线性模型”|“常规”,弹出图18-1所示的对话框。将变量“年龄”和“抽烟”放入“因子”框内,将变量“观察人数”放入单元协变量。,(3)单击“模型”按钮,弹出图18-3所示的“常规对数线性分析-模型”对话框,本例先“自定义模型”,选中变量“年龄”和“抽烟”放入“模型中的项”选项栏,“构建项”类型选择“主效应”。(4)单击“选项”按钮,弹出图18-4所示的“常规对数线性分析-选项”对话框,选择频数、残差、设计矩阵、估计,其他默认,单击“继续”返回。(5)单元计数分布选项:此处选择“泊松”。,2主要结果解读(1)图18-16所示为模型数据信息与收敛信息,结果解释同前。,(2)图18-17所示为模型拟合度检验结果,结果可见似然比检验值为1.946,P=0.584,Pearson卡方检验为1.732,P=0.630,均大于0.05,模型拟合效果较好。,(3)图18-18所示为单元计数与残差结果,解释同前,结果可见调整残差绝对值均小于2,因此残差分布符合正态分布。,(3)图18-19所示参数估计结果,结果可见除年龄=3外,其他均有统计学意义,P均小于0.05。,(4)图18-20所示为残差分布,图18-21所示为残差标准Q-Q图,图18-22趋势标准Q-Q图,分别对模型拟合后的残差进行作图分析,结果可见残差拟合较好。,若列联表资料,各变量间分析不考虑因果关系,可以直接采用上面的General过程;如果考虑某因变量与一个或多个自变量之间对数线性模型拟合,则可以采用Logit过程。,例18.3:某研究者研究到北京郊区游玩游客的个人信息(性别与教育程度)与选择游玩项目的关系,以便针对性开展项目的宣传,资料见SPSS数据库例18-3.sav,数据库构建见图18-24所示。,模块解读,1调用Logit过程:单击“分析”|“对数线性模型”|“Logit”命令,弹出图18-23所示的“常规对数线性分析”对话框。,(1)“因变量”选项栏:用于选入参与本次分析的因变量,必须为分类变量。(2)“因子”选项栏:用于选入参加分析的自变量。(3)“单元协变量”:用于选入单元格协变量。(3)“单元结构”:用于放入单元格结构变量,即定义权重变量。(4)“对比变量”:用于选入连续型对照变量,以便计算广义对数比率。,2主要结果解读(1)图18-26所示为构建模型的数据信息与迭代信息,可见有效加权个案共52人,模型中3个变量均为7、2、2分类;收敛信息显示设置的最大迭代次数为20次,收敛容许度0.001,本例迭代次数为4次迭代就达到收敛条件。,(2)图18-27所示为模型拟合优度检验信息,结果可见似然比检验值为6.414,P=0.378,Pearson卡方检验值为5.640,P=0.465,均大于0.05,说明拟合效果较为理想。采用主效应分析就可以很好解释结果中的变异,理论不必继续采用饱和效应模型。,(3)图18-28所示为单元计数与残差分析结果。在离散分析结果中,熵和集中度均按照可以由模型解释的离散型和不能为模型解释的离散型进行分解。相关性度量中,熵一行所对应的离散型标准进行测量时,因变量对总模型的贡献率为0.089,相当于回归分析中的决定系数R2,本例虽然拟合效果较好,但因变量对总模型贡献率较弱,此处可能样本量较小,性别与文化程度之间可能有相关性。,(4)图18-29所示为单元计数与残差分析,结果可见调整残差绝对值均小于2,效果较好。,(4)图18-30所示为参数估计,此处给出各种可能的参数估计值。,模型选择过程,对于列联表资料,变量间的复杂关系事先通常并不知晓,我们往往需要对各变量关系做一探索性分析,以寻求建立最佳的模型,模型选择过程就可以帮助我们在众多模型中选出最佳的对数线性模型。,模块解读,“模型选择对数线性分析”对话框,单击“分析”|“对数线性模型”|“模型选择”命令,弹出图18-31所示的“模型选择对数线性分析”对话框。,(1)“因子”选项栏:用于放入本次分析的因素变量。每一个放入的变量需要单击“定义范围”按钮,需要将该变量的范围进行设置。(2)“单元格权重”:用于设置权重变量。(3)“建立模型”:提供了向后排除和一步进入两种方法。模型与选项设置同前述。,例18.4:某研究者研究不同性别、教育程度、年龄旅游者对旅游考虑因素的关系,数据库见例18-4.sav。,1操作步骤(1)单击“分析”|“对数线性模型”|“模型选择”命令,弹出图18-31所示的对话框。将变量“年龄”、“性别”、“教育程度”和“考虑因素”放入因子变量框,分别进行范围定义。(2)单击“模型”按钮,采用饱和模型。(3)模型建立:采用向后排除法。(4)选项:选择频率、残差和参数估计,其他默认。,2结果解读,(1)图18-32所示为数据信息列表,摘要了个案数目与变量个数与变量分类类型。,(2)图18-33所示为模型交互判别结果,采用两种方法K-WAY和高阶效果,K-WAY效果,结果可见两种方法反映0阶与1阶交互有统计学意义。两者P=0.000。2阶和3阶交互没有意义,P0.05。,(3)其他结果,看法与前面一样,此处不赘。,THE END,