应用统计学复习.ppt
应用统计学复习,方差分析、回归分析 聚类与判别 主成分分析与因子分析 列联表与对应分析 结构方程模型,重点:软件计算结果的分析,模型分析与比较,一、方差分析,基本概念方差分析的类型单因素方差分析单响应变量方差分析:重复试验/非重复试验多响应变量方差分析协方差分析:当存在非实验因素干扰协方差分析如何确定协变量若因素作用显著,进一步分析工具:多重均值比较LSD,Dunnett法,均值多项式比较输出表的解释,假设检验F检验:F统计量的计算,查临界值,协变量调整后,二、多元线性回归模型,简单相关系数与偏相关系数多元线性回归模型及基本假设OLS估计量的性质线性性、无偏性、有效性OLS估计量方差的性质偏回归系数的含义设定偏误,遗漏重要变量时OLS估计量的性质,模型的检验,经典假设检验:异方差、序列相关、多重共线统计检验:方差分析、拟合优度与方程的显著性检验三种平方和,联合零检验,F统计量单零检验,一般t检验:查表法、精确P值拟合优度R2经济意义检验,SPSS线性回归过程输出表与残差图,多重共线性,概念:什么是多重共线性完全多重共线、非完全多重共线多重共线的后果多重共线的识别存在多重共线时OLS的特征检验方法:方差膨胀倍数、病态指数、辅助回归补救措施:差分,剔除变量,主成分回归,异方差性,什么是异方差性,异方差性经常出现在什么数据中异方差性的后果异方差性的识别非正式方法:残差图异方差性的修正加权最小二乘法,序列相关,什么是序列相关,什么数据容易出现序列相关,一阶自相关模式序列相关的后果序列相关性的检验DW检验序列相关的修正广义差分模型,虚拟变量,虚拟变量的概念含有虚拟变量的回归虚拟变量如何设计级差截距系数的作用是什么、级差斜率系数的作用是什么如何检验虚拟变量的系数是否显著,三、聚类与判别,各类距离与相似系数系统聚类:手算:最长距离法、最短距离法,画谱系图、确定分类数系统聚类和快速聚类的输出表分析,判别分析,两类判别:手算或输出表分析,马氏等距离法、fisher法、贝叶斯法建立判别函数和判别规则,给新样本会做判别多类判别:输出表的解释,写出判别函数和判别规则,给新样本会做判别,四、主成分分析,化简变量的方法基本概念:方差贡献与累计方差贡献主成分载荷与变量共同度主成分提取方法:相关矩阵vs 方差-协方差矩阵解释模型的各种输出表,会确定主成分的个数,主成分的经济意义与样本评价(主成分得分)主成分分析的应用:主成分回归,综合评价指标,五、因子分析,探索性因子分析与确认性因子分析的区别与联系探索性因子分析基本概念:正交因子模型,方差贡献与累计方差贡献,因子载荷与变量共同度与特殊因子方差,因子旋转解释模型的各种输出表,会确定公因子的个数,因子分析适宜度检验与残差检验,因子经济意义与样本评价(因子得分)确认性因子分析载荷t检验、相关性t检验总体检验:2、GFI、AGFI测量模型可靠度分析,六、对应分析,列联表分析与变量相关性检验频数表、频率表(行频率表、列频率表、总频率表)、SPSS输出表解释与分析对应分析行截面、列截面主成分之关系SPSS输出表解释与分析,七、结构方程模型,基本概念潜变量、显变量、内生变量、外生变量、测量模型、结构模型、识别(不可识别、过度识别、恰好识别)路径图与模型的互化模型输出结果的解释与评价结构参数t检验、相关性t检验、合理性分析模型总体检验:2、GFI、AGFI测量模型可靠度分析,