spss相关分析案例多因素方差分析.doc
本次实验采用2005年东部、中部和西部各地区省份城镇居民月平均消费类型划分的数据课本139页,将东部、中部和西部看作三个不同总体,31个数据分别来自于这三个总体.本人对这三个不同地区的城镇居民月平均消费水平进行比较,并选取人均粮食支出、副食支出、烟酒与饮料支出、其他副食支出、衣着支出、日用杂品支出、水电燃料支出和其他非商品支出八个指标来衡量城镇居民月平均消费情况.在进行比较分析之前,首先对个数据是否服从多元正态分布进行检验,输出结果为:表一Tests of NormalityKolmogorov-SmirnovaShapiro-WilkStatisticdfSig.StatisticdfSig.人均粮食支出<元/人>.15631.054.86031.001人均副食支出<元/人>.11231.200*.93231.051人均烟、酒、饮料支出<元/人>.16331.036.82931.000人均其他副食支出<元/人>.19731.004.81331.000人均衣着支出<元/人>.14531.094.94531.117人均日用杂品支出<元/人>.14531.094.93631.063人均水电燃料支出<元/人>.14631.090.89731.006人均其他非商品支出<元/人>.27631.000.72531.000a. Lilliefors Significance Correction*. This is a lower bound of the true significance.如表一,因为该例中样本数n=31<2000,所以此处选用Shapiro-Wilk统计量.由正态性检验结果的sig.值可以看到,人均粮食支出、烟酒与饮料支出、其他副食支出、水电燃料支出和其他非商品支出均明显不遵从正态分布Sig.值小于0.05,拒绝服从正态分布的原假设,因此,在下面分析中,只对人均副食支出、衣着支出和日用杂品支出三项指标进行比较,并认为这三个变量组成的向量都遵从正态分布,并对城镇居民月平均消费状况做出近似的度量.另外,正态性的检验还可以通过Q-Q图来实现,此时应判别数据点是否与已知直线拟合得好.如果数据点均落在直线附近,说明拟合得好,服从正态分布,反之,不服从.具体情况这里不再赘述.下面进行多因素方差分析:一、多变量检验表二Multivariate TestscEffectValueFHypothesis dfError dfSig.Pillai's Trace.9773.696E2a3.00026.000.000Wilks' Lambda.0233.696E2a3.00026.000.000Hotelling's Trace42.6483.696E2a3.00026.000.000Roy's Largest Root42.6483.696E2a3.00026.000.000地区Pillai's Trace.4652.7256.00054.000.022Wilks' Lambda.5552.970a6.00052.000.014Hotelling's Trace.7683.1996.00050.000.010Roy's Largest Root.7196.469b3.00027.000.002a. Exact statisticb. The statistic is an upper bound on F that yields a lower bound on the significance level.c. Design: + 地区由地区一栏的即第二栏所列几个统计量的Sig.值可以看到,无论从那个统计量来看,三个地区的城镇居民月平均消费水平都是有显著差别的Sig.值小于0.05,拒绝地区取值不同,对Y,即城镇居民月平均消费水平的取值没有显著影响的原假设.二、主体间效应检验表三Tests of Between-Subjects EffectsSourceDependent VariableType III Sum of SquaresdfMean SquareFSig.Corrected Model人均副食支出<元/人>11612.395a25806.1988.880.001人均日用杂品支出<元/人>66.367b233.1834.732.017人均衣着支出<元/人>107.540c253.770.238.790人均副食支出<元/人>340978.0691340978.069521.476.000人均日用杂品支出<元/人>3826.88413826.884545.775.000人均衣着支出<元/人>121284.1161121284.116536.028.000地区人均副食支出<元/人>11612.39525806.1988.880.001人均日用杂品支出<元/人>66.367233.1834.732.017人均衣着支出<元/人>107.540253.770.238.790Error人均副食支出<元/人>18308.39428653.871人均日用杂品支出<元/人>196.332287.012人均衣着支出<元/人>6335.41128226.265Total人均副食支出<元/人>389358.56731人均日用杂品支出<元/人>4305.83531人均衣着支出<元/人>130835.11131Corrected Total人均副食支出<元/人>29920.78930人均日用杂品支出<元/人>262.69830人均衣着支出<元/人>6442.95130a. R Squared = .388 <Adjusted R Squared = .344>b. R Squared = .253 <Adjusted R Squared = .199>c. R Squared = .017 <Adjusted R Squared = -.054>如表三,可以看到三个指标地区一栏的即第三栏Sig.值分别为0.001、0.017、0.790,说明三个地区在人均衣着支出指标上没有明显的差别Sig.值大于0.05,不拒绝地区取值不同,对指标的取值没有显著影响的原假设,反之,而在人均副食支出和日用杂品支出指标上有显著差别.三、多重比较表四Contrast Results <K Matrix>地区 Simple ContrastaDependent Variable人均副食支出<元/人>人均日用杂品支出<元/人>人均衣着支出<元/人>Level 1 vs. Level 3Contrast Estimate38.2132.4374.124Hypothesized Value000Difference <Estimate - Hypothesized>38.2132.4374.124Std. Error10.6741.1056.279Sig.001.036.51795% Confidence Interval for DifferenceLower Bound16.349.173-8.738Upper Bound60.0784.70116.985Level 2 vs. Level 3Contrast Estimate-5.059-1.1673.267Hypothesized Value000Difference <Estimate - Hypothesized>-5.059-1.1673.267Std. Error11.6711.2096.866Sig.668.343.63895% Confidence Interval for DifferenceLower Bound-28.967-3.642-10.797Upper Bound18.8491.30917.331a. Reference category = 3如表四,在0.05显著水平下,东部和西部的人均副食支出Sig.值为0.001和日用杂品支出Sig.值为0.036指标有明显差别<小于0.05,拒绝原假设>,而在人均衣着支出Sig.值为0.517指标上没有明显的差别.并且东部的人均副食支出、衣着支出和日用杂品支出三项指标均高于西部地区,说明东部的城镇居民月平均消费水平较西部来说,高出很多,符合实际的情况.另外,中部和西部的人均副食支出、衣着支出和日用杂品支出Sig.值分别为0.668、0.343、0.638,均大于显著水平三个指标均无明显差别,但中部的人均副食支出和日用杂品支出指标低于西部地区,人均衣着支出指标高于西部,说明中、西部的城镇居民月平均消费水平差不多,但消费结构有差异,符合实际的情况.表五Multivariate Test ResultsValueFHypothesis dfError dfSig.Pillai's trace.4652.7256.00054.000.022Wilks' lambda.5552.970a6.00052.000.014Hotelling's trace.7683.1996.00050.000.010Roy's largest root.7196.469b3.00027.000.002a. Exact statisticb. The statistic is an upper bound on F that yields a lower bound on the significance level.表五是上面多重比较可信性的度量,由Sig.的值可以看到均小于0.05,比较检验是可信的.四、协方差阵相等检验表六Box's Test of Equality of Covariance MatricesaBox's M22.979F1.597df112df22.745E3Sig.085Tests the null hypothesis that the observed covariance matrices of the dependent variables are equal across groups.a. Design: + 地区如表六,是协方差阵相等检验,检验统计量是Boxs M,由Sig.值0.085>0.05可以看到,可以认为三个地区总体的协方差阵是相等的.表七Levene's Test of Equality of Error VariancesaFdf1df2Sig.人均副食支出<元/人>1.605228.219人均日用杂品支出<元/人>1.817228.181人均衣着支出<元/人>2.763228.080Tests the null hypothesis that the error variance of the dependent variable is equal across groups.a. Design: + 地区表七给出了各地区同一指标误差的方差检验,在0.05水平下,人均副食支出、衣着支出和日用杂品支出Sig.值分别为0.219、0.181、0.080,均大于0.05三个指标的误差平方在三个地区间均没有显著差别,这说明,除了地区因素外,其他因素对人均副食支出、衣着支出和日用杂品支出三个指标的影响很小.综上所述,对三个地区的城镇居民月平均消费水平进行了具体的比较分析,所得结果表明,东部地区较中、西部地区的城镇居民月平均消费水平差别较大,远高于中、西部两个地区.而中部和西部之间的城镇居民月平均消费水平差别不太明显,主要是消费结构有所不同,这说明西部地区在国家施行西部大开发政策之后发展很快,人民生活水平显著提高,赶上中部地区,体现政策的有效性.