第9章时间序列分析.ppt
第九章 时间序列分析,9-2,第一节 时间序列分析概述第二节 时间序列的水平分析与速度分析第三节 长期趋势的测定第四节 季节变动和循环波动测定第五节 时间序列预测模型,9-3,第一节 时间序列分析概述,时间序列的概念时间序列的种类时间序列的编制原则,9-4,表9-1,9-5,一、时间序列的概念,时间序列(time series)动态数列,把同一现象在不同时间上的观察数据按时间先后顺序排列起来所形成的数列。两个基本要素:时间 t;时间 t 的数据(水平)yt.基期水平与报告期水平;期初水平(y0或y1),期末水平(yn)与中间水平。时间序列是动态分析的依据。,9-6,二、时间序列的种类,(一)绝对数时间序列最基本的时间序列时期序列时点序列(二)相对数时间序列如 第三产业所占比重序列(三)平均数时间序列 如居民消费水平序列,有关的绝对数序列派生的,9-7,(一)绝对数时间序列,又称为总量指标时间序列;是指一系列同类的总量指标数据按时间先后顺序排列而形成的序列,反映现象在各个时间上达到的绝对水平。可分为时期序列和时点序列。时期序列,如国内生产总值序列时点序列,如年末总人口序列,9-8,时期序列和时点序列的特点:,时期序列的各个数据为时期指标(流量),表示现象在各段时期内的总量。时点序列的各个数据为时点指标(存量),反映现象在各个时点上所处的状态和所达到的水平.时期序列中各期数据具有可加性,通过加总即可得到更长一段时间内的总量。时点序列中不同时点上的数据不能相加,即它们相加的结果没有意义。时期序列中数值大小与所属时期长短有直接的关系,时点序列中各时点数值大小与时点间隔长短没有直接的联系。时期序列中各期数据是对每段时间内发生的数量连续登记的结果,时点序列中数据通常不可能也不必要连续登记。,9-9,(二)相对数时间序列和平均数时间序列,相对数时间序列:由一系列同类的相对数按时间先后顺序排列而成的序列。反映现象相对水平或现象之间数量对比关系的动态。平均数时间序列:由一系列同类的平均数按时间先后顺序排列而成的序列。反映现象一般水平的发展变化过程和趋势。,9-10,三、时间序列的编制原则,保证时间序列中各项数据的可比性,是编制时间序列的基本原则。,(一)时间一致时期序列:时期数值的大小与时期长短直接相关,要 求各项数据的时期长短应当一致。时点序列:为准确方便分析现象发展变化过程和规律 性,要求尽可能使时点间隔相等。例如:编制历年粮食库存量序列时,若一些年份用年底数,另一些年份用六月底数,则不具有可比性。(二)总体范围一致指标数值都与现象的总体范围有关。否则各项数值不能直接对比,须进行相应的调整。,9-11,(三)经济内容、计算口径和计算方法一致同一名称的统计指标在不同时间的经济内容、计算口径、计算方法在编制时间序列时应当注意加以调整。例如:自1997年起,我国基本建设、更新改造和其他固定资产投资的统计起点由5万元提高到50万元;我国工业总产值有的年份包括乡村企业工业产值,有的不包括。价值量指标要求价格一致,要么都用现价计算,要么都是按可比价格计算。,9-12,第二节 时间序列的水平分析与速度分析,时间序列分析的水平指标时间序列分析的速度指标水平分析与速度分析的结合与应用,9-13,一、时间序列分析的水平指标,描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少。包括:发展水平(时间序列中各项数据)平均发展水平增长量平均增长量,9-14,(一)平均发展水平,平均发展水平是不同时间上发展水平的平均数。统计上习惯把这种不同时间上数据的平均数称为序时平均数。它将现象在不同时间上的数量差异抽象掉,从动态上说明现象在一定发展阶段的一般水平。不同性质的时间序列,其计算方法也有所不同。,9-15,1.绝对数时间序列的平均发展水平,(1)时期序列的平均发展水平采用简单算术平均法:【例9-1】根据表9-1的数据,计算我国1991-2003年国内生产总值的年平均水平。解:,9-16,(2)时点序列的平均发展水平,连续时点序列用简单算术平均法对社会经济现象而言,已知每天数据可视为连续序列。不连续时点序列计算序时平均数先求分段平均数用来代表相邻两个时点之间各个时点上的水平假定现象均匀变化,分段平均数相邻两点数据的简单算术平均再求全期总平均数求全期总平均数分段平均数的加权算术平均权数 f 时点间的间隔长度,9-17,不连续时点数列计算序时平均数图示,9-18,不连续时点数列计算序时平均数的公式,当时点间隔相等,上式简化为:“首末折半法”,9-19,【例9-2】,某地区2004年生猪存栏数量的几个时点数据,试计算该地区全年的生猪平均存栏数量。,解:,9-20,【例9-3】,根据表9-1中各年年末人口数,计算19912003年这13年间的平均人口数。解:,由不连续时点序列计算平均发展水平的计算公式是有假定条件的(相邻两时点间数量变动均匀)。实际中,计算结果通常只是近似值。一般认为,间隔越短,计算结果就越准确。例如,由一年中各月底数计算的全年平均数,就比只用年初和年末两项数据计算的结果更准确。,9-21,2.相对数(或平均数)序列的平均发展水平,相对数(或平均数)zi yi/xi(yi 和 xi 为总量指标)由于各个zi 的对比基数 xi 不尽相同,所以不能将各期 zi 简单算术平均。正确的计算方法是:分别计算绝对数序列 y 和 x 平均发展水平;再由这两个平均发展水平对比来得到所求的平均发展水平,即:,其实质是对各期的相对数(或平均数)加权算术平均!,9-22,【例9-4】,根据表9-1的数据,试计算19912003年中国人均国内生产总值的平均发展水平。解:年平均国内生产总值为 69238.06 亿元,平均人口数为 122588.23 万人,故人均国内生产总值的平均发展水平(单位:元/人),9-23,1.增长量(增减量)报告期水平基期水平说明现象在观察期内增长的绝对数量;基期不同,有逐期增长量与累计增长量之分:*逐期增长量报告期水平上期水平逐期增长量说明现象逐期增长的数量。*累计增长量报告期水平固定基期水平累计增长量说明一段时期内总共增长的数量。关系:累计增长量相应时期的逐期增长量总和.*同比(年距)增长量报告期水平-上年同期水平,(二)增长量与平均增长量,9-24,2.平均增长量,平均增长量逐期增长量的序时平均数;计算方法采用算术平均法。,9-25,例9-5,解:居民消费水平的年平均增长量为:,根据下表数据,计算我国居民消费水平的增长量和平均增长量。,9-26,二、时间序列分析的速度指标,(一)发展速度 发展速度报告期水平基期水平说明现象在观察期内发展变化的相对程度;有环比发展速度与定基发展速度之分环比发展速度报告期水平上期水平反映现象逐期发展变动的程度,也可称为逐期发展速度。定基发展速度报告期水平固定基期水平反映现象在较长一段时间内总的发展变动程度,也称为发展总速度。,9-27,二者关系:定基发展速度相应时期的环比发展速度之积。相邻两定基发展速度之商相应的环比发展速度。为了消除季节变动因素的影响,可计算:,9-28,(二)增长速度(增长率),增长速度(增减速度)增长量与基期水平之比,说明现象增长变化的相对程度;,基期不同,分环比增长速度与定基增长速度,环比增长速度逐期增长量上期水平 环比发展速度定基增长速度累计增长量固定基期水平 定基发展速度,9-29,二者关系:定基增长速度(总增长速度)不等于相应各环比增长速度之和(积)。几种速度指标之间的相互关系如下所示:,9-30,为了消除季节变动因素的影响,也常常计算:,9-31,速度的表现形式和文字表述,速度指标的表现形式:一般为%、倍数,也有用、番数等等。翻 m 番,则有:报告期水平=基期水平2m,速度的文字表述:发展速度相当于、发展为、增长到、减少到、下降为报告期水平增长为基期水平的%;以基期水平为100%,报告期水平增长为%.增长速度提高(了)、减少(了)、下降(了)报告期水平比基期水平增长(了)的%;以基期水平为100%,报告期水平增长(了)%。,9-32,(三)平均发展速度和平均增长速度,平均增长速度表示逐期增长变动的平均程度,即各期环比增长速度的一般水平,但不能对各环比增长速度直接平均。因为算术平均法或几何平均法都不符合增长速度这种现象的性质。正确的计算方法:平均增长速度平均发展速度 1平均增长速度为正(负)值,表明平均说来现象在考察期内逐期递增(减)。,9-33,平均发展速度的计算方法,1.几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度,根据环比发展速度与总速度的关系,计算平均发展速度可采用几何平均法:,三个计算公式实质上是一致的。可根据所掌握的数据来选择。,环比发展速度个数 时间序列水平项数1,9-34,【例9-7】,根据表9-4的数据,计算中国19952003年居民消费水平的平均发展速度和平均增长速度。解:平均发展速度可根据三种资料来计算:,平均增长速度107.84-1007.84即19952003年间,我国居民消费水平平均每年递增7.84%.,9-35,用所求平均发展速度代表各环比发展速度,推算的最末一期的水平与实际相等推算的总速度(最末一期的定基速度)也与实际相等。几何平均法计算平均发展速度着眼于最末一期的水平,故称为“水平法”。如果关心现象在最后一期应达到的水平时,采用水平法计算平均发展速度比较合适。几何平均法较为简单直观,既便于各种速度之间的推算,也便于预测未来某期的水平,因此有着广泛的应用。,几何平均法的特点:,9-36,平均发展速度的应用:,根据平均速度预测现象经过一段时间以后可能达到的水平。,例如,若我国居民消费水平继续按上面所求出的平均速度递增,则可预测到2010年,居民消费水平可达:y2010y2003(平均发展速度)7 40891.07847=6935.48(元),9-37,利用平均发展速度的原理,还可在年度增长率zy与月增长率 zm(季增长率zs)之间进行换算。它们的关系可表示为:,例如,某地区居民消费总额2003年9月为200亿元,2005年5月为260亿元。则居民消费总额的月平均增长率和年平均增长率分别为:,9-38,2.方程式法计算平均发展速度,各期实际水平的总和为:,以平均发展速度 作为各环比发展速度的代表值,用它来推算各期水平,并能使所推算的各期水平总和与实际相等,则有:,将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示,则上式可变成为:,解上述方程,其正根平均发展速度。,9-39,方程式法计算平均发展速度的特点,方程式法计算结果取决于考察期内各期实际水平的累计总和,所以计算平均发展速度的方程式法又称为“累计法”。特点:以所求平均发展速度代替各期环比发展速度,推算的考察期内各期水平的累计总和与实际相等。着眼于考察全期的累计水平时,就适合用方程式法来计算平均发展速度。例,采用方程式法计算居民消费水平的平均发展速度:,9-40,三、水平分析与速度分析的结合与应用,1.正确选择基期首先要根据研究目的,正确选择基期。基期的选择一般要避开异常时期。例如:分析农村经济体制改革以来的变化,将 19781980年为基期。2.注意数据的同质性不容许有0和负数,否则就不适宜计算速度,而只能直接用绝对数进行水平分析。例如:对利润额、净资产数额等经济指标的分析。如果现象在某各阶段内的发展非常不平衡,大起大落,就会降低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义。,9-41,3.将总平均速度与分段平均速度及环比速度结合分析4.将速度与水平结合起来分析 一般而言,基期水平低,容易产生高速度;基期水平高,速度就相对低。既要考虑速度的快慢,也要考虑实际水平的高低把相对速度与绝对水平结合,可计算增长1%的绝对量。,9-42,增长1%的绝对量是用来补充说明增长速度的.一般只对环比增长速度计算,其计算公式为:,例,,9-43,第三节 长期趋势的测定,时间序列的构成与分解长期趋势的测定方法,9-44,一、时间序列的构成与分解,(一)时间序列的构成因素按照影响的性质和作用形式,将时间序列的众多影响因素归结为 以下四种:长期趋势(Trend)季节变动(Seasonal Fluctuation)循环变动(Cyclical Variation)不规则变动(Irregular Variations),9-45,1.长期趋势(Trend),长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性。它是时间序列中最基本的构成因素;由影响时间序列的基本因素作用形成.,长期趋势有多种不同的类型 按变化方向不同来分,有上升趋势、下降趋势和水平趋势三类。按变化的形态来分,长期趋势可分为线性趋势和非线性趋势两类。,9-46,2.季节变动(Seasonal Fluctuation),季节变动泛指现象在一年内所呈现的较有规律的周期性起伏波动。周期长度可以是一年,也可以小于一年;例如,农产品的生产、销售和储存通常都有淡季和旺季之分,以一年为一个周期;例如,超市的营业额和顾客人数的变动常常以七天为一个周期,每个周末是高峰期。引起季节变动的原因既可能是自然条件(如一年四季的更替),也可能是法规制度和风 俗习惯等(如节假日)。,9-47,3.循环变动(Cyclical Fluctuation),循环变动指在较长时间内(通常为若干年)呈现出涨落相间、峰谷交替的周期性波动。例如,出生人数以2025年为一个周期,太阳黑子数目大约11年为一个周期。,太阳黑子数目的变化,9-48,循环变动与长期趋势的异同都是需要长期观察才能显现的规律性;但长期趋势是沿着单一方向的持续变动,而循环变动是具有循环特征的波动,通常围绕长期趋势上下起伏。循环变动与季节变动的异同都是属于周期性波动,对循环波动的识别和分析更为困难循环变动周期至少在一年以上,周期长短很不固定;波动形态和波幅等规律性也都不是很规则;引起循环变动的原因通常也不那么直观明显。,9-49,4.不规则变动(Irregular Variation),不规则变动(又称为剩余变动)是没有规律可寻的变动,它是从时间序列分离了长期趋势、季节变动和循环变动之后剩余的因素。可细分为随机扰动和异常变动两种类型:随机扰动是短暂的、不可预期的和不可重复出现的众多细小因素综合作用的结果。表现为以随机方式使现象呈现出方向不定、时大时小的起落变动,但从较长观察时间内的总和或平均来看,一定程度上可以相互抵消。异常变动则是指一些具有偶然性突发性的重大事件如战争、社会动乱和自然灾害等引起的变动,其单个因素的影响较大,不可能相互抵消,在时间序列分析中往往需要对这种变动进行特殊处理。注:后面所讲的不规则变动一般仅指随机扰动。,9-50,(二)时间序列因素分解的模型,按照四种构成因素相互作用的方式不同,可以将上述关系设定为不同的合成模型,实际中最常用的有乘法模型和加法模型。以 Y 表示序列的数值,T 表示趋势值,S 表示季节变动值,C 表示循环变动值,I 表示不规则变动值,下标 t 表示时间(t=1,2,n).,9-51,加法模型:,假定四种因素的影响是相互独立的。每种因素的数值均与 Y 的计量单位和表现形式相同.如绝对数序列中各种因素的数值都为绝对量。季节变动和循环变动的数值有正有负,在它们各自的一个周期范围内,正负数值相互抵消,因而总和或平均数为零;不规则变动的数值也是有正有负,但只有从长时间来看其总和或平均数才趋于零。对各因素的分离采用减法。如(Yt St)表示从序列中剔除季节变动的影响。,9-52,乘法模型:,假定四种因素的影响作用大小是有联系的。只有趋势值与Y 的计量单位和表现形式相同(一般为绝对量);其余各种因素的数值均表现为以趋势值为基准的一种相对变化率,通常以百分数表示。各个时间上的季节变动和循环变动数值在100上下波动,在它们各自的一个周期范围内,其平均值为100;不规则变动值也是在100上下波动,但只有从长时间来看其平均值才趋于100。对各因素的分离则采用除法。例如(Yt/St)表示从时间序列中剔除季节变动的影响。,9-53,二、长期趋势的测定方法,长期趋势的测定和分析,是时间序列分析中最主要的一项任务。测定长期趋势,不仅可以认识现象发展变化的基本趋势和规律性,并作为预测的重要依据,而且也是准确地测定其他构成因素的基础。(一)时距扩大法 将原序列中若干项数据合并,使数据所包含的不规则变动在一定程度上被相互抵消了,由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势。对于包含季节变动的序列,若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据),可使季节变动也相互抵消。,9-54,【例9-8】,某企业历年的产品销售量数据如表9-5所示,用时距扩大法,依次将每三年的销售量进行合并,得到新的销售量序列,可更清楚地看出销售量不断增长的长期趋势。,时距扩大法的优点:计算非常简单直观;局限性:新序列的项数大大减少,丢失了原时间序列所包含的大量信息,不能详细反映现象的变化过程,不利于进一步的深入分析。,9-55,(二)移动平均法,移动平均法(Moving Average)是采用逐项递进的办法,将原时间序列中的若干项数据进行平均,通过平均来消除或减弱时间序列中的不规则变动和其他变动,从而呈现出现象发展变化的长期趋势。若平均的数据项数为K,就称为K 期(项)移动平均。分为简单移动平均法和加权移动平均法两种。简单移动平均法将各项数据等同看待,计算每个移动平均值时采用简单算术平均。加权移动平均法给各期观测值赋予不同的权数,采用加权算术平均来计算每个移动平均值。,9-56,【例9-9】,9-57,移动平均法的特点:,1.移动平均法对原时间序列具有修匀或平滑的作用,平均的时距项数 k 越大,移动平均的修匀作用越强。2.移动平均值代表的是所平均数据的中间位置上的趋势值即中心化移动平均法平均项数 k 为奇数时,只需一次移动平均即得各期趋势值当 k 为偶数时,则需对移动平均的结果进行中心化处理,即再作一次两项移动平均。,9-58,3.当序列包含周期性变动时,平均的项数 k 应与周期长度一致在消除不规则变动的同时,也消除周期性波动,使移动平均值序列只反映长期趋势。季度数据通常采用4 期移动平均,月度数据通常采用12 期移动平均。4.移动平均值序列的项数比原序列少,首尾缺少对应的趋势值平均项数 k 为奇数时,新序列首尾各减少(k-1)/2 项;k为偶数时,首尾各减少 k/2 项。,9-59,5.当现象呈非线性趋势时,加权移动平均比简单移动平均效果为好。确定权数通常遵循“近大远小”的原则;采用中心化移动平均法,其权数一般呈“中间大、两端小”的对称结构。例如5期移动平均中5个观测值的权数可分别为1,2,3,2,1;或者也可以是1,3,5,3,1,等等。6.移动平均法不能直接进行外推预测。只有在现象发展变化呈水平趋势的情况下,移动平均值才能用于预测预测时通常将移动平均值放在平均时距的最末一期上。,9-60,(三)趋势方程拟合法,根据时间序列,拟合以时间 t 为解释变量、所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)。1.线性趋势方程 当时间序列的逐期增长量大致相同、长期趋势可近似地用一条直线来描述时,就称时间序列具有线性趋势。线性趋势方程形式为:,9-61,线性趋势方程,a 为趋势线的截距,表示 t=0 时的趋势值(即既定时间序列长期趋势的初始值。b 为趋势线的斜率,表示当时间 t 每变动一个单位,趋势值的平均变动量。估计参数a、b的方法通常采用最小二乘法。与直线回归方程中参数的计算公式相同。,9-62,【例9-10】,解:根据最小二乘法拟合的趋势方程为:=46.10606+4.84266 t,根据趋势方程可计算各期趋势值及残差,根据趋势方程也可进行外推预测,9-63,2.非线性趋势方程(1)K 次曲线,当现象的 K 级增长量大体接近一常数时,可拟合 K 次曲线趋势方程。二级增长量(二次差)对逐期增长量序列再求逐期增长量三级增长量(三次差)对二级增长量序列再求逐期增长量以次类推,可计算时间序列的 K 级增长量。,K 次曲线趋势方程:,9-64,二次曲线和三次曲线,实际中最常用的是二次曲线和三次曲线:,9-65,(2)指数曲线,当现象的逐期发展速度或增长速度大体相同时,即现象大致按几何级数递增或递减时,其长期趋势可拟合为指数曲线方程:,a 相当于时间序列长期趋势的初始值,b 相当于平均发展速度。若b 1,呈递增趋势,b 1,时间序列呈递减趋势.估计参数 a 和 b,可通过对数变换来线性化。,或:,9-66,EXCEL中的“添加趋势线”功能,非线性趋势方程中参数的求解方法:通过线性变换(再利用EXCEL中的“回归”功能);直接运用EXCEL中的“添加趋势线”功能,它可以拟合多种趋势模型。其操作方法是:先绘制出时间序列的折线图,然后在折线上任意一处点击右键,选择“添加趋势线”,在随即弹出的对话框中选择趋势线类型,确定即可。若在对话框的选项中选择了“显示公式”和“输出R平方值”,图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数R2。,9-67,【例9-11】,19892003年中国海关出口商品总额的数据如表9-9所示,试测定其长期趋势。解:从折线图可见,出口总额呈现不断上升的趋势,其长期趋势可用二次曲线来拟合。,决定系数:R2=0.9576,9-68,指数趋势:,也可用指数曲线来拟合长期趋势:,或,决定系数:R2=0.9833从R2看,指数曲线的拟合效果更好。,9-69,(3)其它非线性趋势曲线,用来拟合现象非线性趋势的曲线还有修正指数曲线、龚泊兹曲线和逻辑斯蒂曲线等等。修正指数曲线的方程形式为:,(0b1),数学特征:变量值的一次差的环比比率相等。直观的曲线特征:现象初期增长迅速、随后增长率逐渐下降直至最终以常数 K 为增长的极限。,9-70,龚泊兹曲线(Compertz curve),龚泊兹曲线的方程形式为:,(K0),数学特征:变量值的对数一次差的环比比率相等。直观的趋势特征:初期增长缓慢、随后逐渐加快,达到一定程度后增长率又逐渐下降,直至接近一条水平线 Y=K。取对数,可转化为修正指数曲线.,9-71,逻辑斯蒂曲线(Logistic curve),逻辑斯蒂曲线的方程形式为:,数学特征:变量值倒数的一次差的环比比率相等。所适合的场合与龚泊兹曲线的适合场合比较类似。,(K0,a0,1b0),9-72,第四节 季节变动和循环波动测定,季节变动的测定方法循环变动的测定方法不规则变动的测定方法,9-73,一、季节变动的测定方法,测定季节变动的意义掌握现象的季节变动规律,为决策和预测提供重要依据;从原序列中剔除季节变动的影响,更好地分析其他因素。季节变动的测定乘法模型中,季节变动的测定和分离都通过季节指数实现.按是否消除长期趋势影响来分,测定方法可分为两大类:一是不考虑长期趋势的影响,直接根据原序列去测定常用方法是同期平均法;二是先剔除长期趋势,然后根据趋势剔除后的序列来测定常用方法是移动平均趋势剔除法。至少要有三个以上季节周期的数据。如果季节变动的规律性不是很稳定,则所需要的数据还应更多一些为好。,9-74,(一)同期平均法,基本原理是:假定时间序列呈水平趋势,通过对多年同期的数据进行简单算术平均,以消除不规则变动,再将各季节水平(同期平均数)与水平趋势值对比,即可得到季节指数。一般步骤:1.计算同期平均数(i=1,2,L)即将不同年份同一季节的多个数据进行简单算术平均。其目的是消除不规则变动的影响。一般要先将各年同一季节的数据对齐排列.2.计算全部数据的总平均数用以代表消除了季节变动和不规则变动之后的全年平均水平,亦即整个时间序列的水平趋势值。3.计算季节指数(也称为季节比率)Si.,9-75,季节指数,Si100,表示现象在第 i 期处于旺季,即第 i 期水平高于全年平均水平;Si100,表示第 i 期是个淡季,即该季节的水平低于全年平均水平。在一个完整的季节周期中,季节指数的总和等于季节周期的时间项数,或季节指数的均值等于1。,或,否则就要进行调整(即归一化处理)。调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)。,9-76,季节指数图,【例9-12】,某企业生产的一种学生学习用复读机的销售量数据如表9-10所示,试用同期平均法计算各月的季节指数。,同期平均法简单,易理解,但只适用于呈水平趋势的序列。当现象呈现出明显上升(下降)趋势时,总会高估(低估)年末季节指数,相应地低估(高估)年初季节指数。,9-77,(二)移动平均趋势剔除法,趋势剔除法的基本原理:首先测定出各期趋势值,然后从原序列中消除趋势成份,最后再通过平均的方法消除不规则变动,从而测定出季节变动程度。最常用的趋势剔除法是移动平均趋势剔除法.采用移动平均法测定长期趋势,剔除趋势后再计算季节指数。实质上,此方法也适用于包含循环变动的场合。,9-78,移动平均趋势剔除法的步骤,1.计算移动平均值(M)。对原序列计算平均项数等于季节周期 L 的中心化移动平均值。旨在可消除原序列中的季节变动 S 和不规则变动 I。若序列不包含循环变动即Y=TS I,则 M=T。假定时间序列也包含循环变动即Y=TSCI,则MTC,可称之为趋势-循环值。2.剔除原序列中的趋势成份(或趋势-循环成份)。Y/M,得到只含季节变动和不规则变动的比率序列,即:,或,9-79,3.消除不规则变动 I。将各年同期(同月或同季)的比率(SI)进行简单算术平均,可消除不规则变动 I,从而可得到季节指数 S。4.调整季节指数。对所求季节指数进行归一化处理。,9-80,【例9-13】,9-81,例(续),9-82,二、循环变动的测定方法,循环变动通常很难识别和分解:周期往往不固定,其规律性不很明显,它需要相当长时间的观察数据必须借助于定性分析(一)直接法用同比发展速度或年距发展速度的波动来粗略地描述循环变动的特征。优劣性:简便直观,但没有消除不规则波动的影响,往往也不能真正消除长期趋势和季节变动的影响,很难准确描述循环波动的峰、谷和振荡幅度等特征。,9-83,例:,9-84,(二)剩余法(分解法),基本思想:以因素构成模型为基础,分别从时间序列中分离出长期趋势和季节变动因素,再消除不规则变动,则剩余的成份就是时间序列的循环变动。步骤:假定因素构成模型为 Y=TSCI。第一,消除季节变动,得到无季节影响的序列;第二,由无季节影响序列计算出各期趋势值T,再剔除趋势,求得循环和不规则变动序列 CI。最后,对 CI 进行移动平均,消除 I,求得 C。,9-85,优劣性:剩余法思路清晰。但计算复杂,其准确性受其他各因素分离效果的影响。对 CI 的移动平均以多长时距为宜,理论上也无法一概而论,实际应用中难免出现一定的随意性.,9-86,三、不规则变动的测定,不规则变动没有规律可寻,不可能像其他因素那样可以直接进行测定,因此只能从时间序列中逐一将长期趋势、季节变动和循环变动分离出去,之后剩余的因素统统归结为不规则变动,又称为剩余变动或残余变动。不规则变动,无法预测其未来确切的波动方向和具体数值,只能在事后进行测定和分析。对不规则变动的事后分析,有利于分析现象变化的具体原因,以便在以后的决策和行动中采取有效的防范措施和应对措施。,9-87,【例9-15】,根据表9-12的数据,用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动。,9-88,第五节 时间序列预测模型,其中最主要的是长期趋势的预测,其常用的方法有:趋势外推预测移动平均和指数平滑预测自回归预测,时间序列预测通常是建立在时间序列因素分解之基础上的。分别对各种构成因素进行预测后,再合成所研究现象的预测值。时间序列预测模型最一般的形式为:,9-89,一、趋势外推预测,趋势外推预测利用趋势方程去预测现象在未来时间上的长期趋势值。按原来的时间顺序将预测期的时间变量值 t 代入趋势方程中,即可计算出预测期的趋势值。趋势外推法简单方便。但必须注意,该方法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用。注:实际应用中,须认真分析影响趋势的基本因素是否会显著变化,而且外推时间不宜太远。,9-90,【例9-16】,根据例9-15中所拟合的趋势直线方程,并结合季节指数(见表9-15)预测第六年各季度的饮料销售额。解:趋势直线方程为:预测值依次为:,9-91,二、移动平均和指数平滑预测,(一)移动平均预测就是用移动平均值作为下一期的预测值。有简单移动平均预测和加权移动平均预测两种。与测定趋势的移动平均法有所不同:每个K期移动平均值不是代表观测值中间一期的趋势值,而是第K+1期的趋势预测值。移动平均值的位置也不再是居中放置,而是置于第K 期(所平均数据末尾一期)或直接置于第K+1期(预测期).加权移动平均法用于预测时,按“近大远小”的原则确定权数,即离预测期较远的数据给以较小的权数,而离预测期较近的数据给以较大的权数。,9-92,公式:,简单移动平均预测第 t+1 期预测值的公式为:,加权移动平均预测第 t+1 期预测值的公式为:,wi为观测值 yi 的权数,且wt wt-1 wt-k+1。常常取自然数 K,K-1,2,1。,9-93,移动平均预测的局限性只具有预测未来一期趋势值的预测功能,只适用于呈水平趋势的时间序列。如果现象的发展变化具有明显的上升(或下降)趋势,则移动平均预测的结果就会产生偏低(或偏高)的滞后偏差,即预测值的变化滞后于实际趋势值的变化。移动平均的项数K越大,滞后偏差就越大。,9-94,(二)指数平滑预测,1.指数平滑法(Exponential smoothing)的基本原理用 Et 表示第 t 期的指数平滑值,其计算公式为:,为平滑系数(01)。指数平滑具有递推性质.展开后:,E0为初始值,通常设E0=y0。t时,最后一项系数趋近于0,其余各项的系数构成一个无穷递减等比数列,该数列总和为1.可见,指数平滑值 Et 实质上是以前各期观测值的加权算术平均数,各期观测值的系数就是其权数,权数呈指数形式递减。,9-95,指数平滑法的主要优点,按“近大远小”原则给各期观测值赋予了不同的权数,既充分利用了以前各期观测值的信息,又突出了近期数据的影响,能够及时跟踪反映现象的最新变化。它采用递推公式,更便于连续计算,因为实际计算时不必保留以前全部信息,只需上期的平滑值和最新的观测值两项数据即可。其权数确定也较为简便,只需确定最新一期数据的权数,其他各项观测值的权数可自动生成。,9-96,平滑系数的选择,的选择是指数平滑法的关键,一般可从以下几个方面来考虑:(1)如果认为时间序列中随机波动成份较大,为了尽可能消除随机波动的影响,可选择较小的;反之,若认为随机波动成份较小,为了及时跟踪现象的变化,突出最新数据的信息,可选择较大的。(2)如果现象趋势的变化很平缓,可选择较小的;如果现象趋势的变化比较剧烈,例如呈阶梯式特征,应选择较大的。(3)通过大小不同的值进行试算,使得预测误差最小的值就是最合适的平滑系数。,9-97,2.一次指数平滑预测模型,当时间序列呈水平趋势或没有明显波动规律时,可以用一次指数平滑进行短期预测:,或:,9-98,一次指数平滑预测的基本思想:如果第t期的预测没有误差,则第 t 期预测值仍然是第t+1期的预测值;如果有预测误差,则不外乎:一部分是随机波动所引起的误差,预测时应尽可能予以剔除;另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误差,对此须及时跟踪反应,这就要求根据预测误差调整预测值。值实质上体现了预测者对预测误差中实质性变化所占比重的估计。,9-99,【例9-16】,要求用移动平均法和指数平滑法进行预测.解:采用5日移动平均,加权移动平均预测中各期数据的权数由近到远分别为5,4,3,2,1。指数平滑法预测取=0.4。,9-100,3.二次指数平滑的预测模型,二次指数平滑 E(2)是对第一次指数平滑值序列 E(1)再计算指数平滑值,即:,当现象有明显上升或下降趋势时,指数平滑值 E(1)与趋势值 之间存在明显的滞后偏差,E(2)与 E(1)之间也存在着同样的滞后偏差。根据三者之间滞后偏差的数量关系,可得出线性趋势模型中参数估计值 at 和 bt 的计算公式,并由此得到相应的线性趋势预测模型。,9-101,利用二次指数平滑建立的线性趋势预测模型及其参数估计值的计算公式为:,(K=1,2,),二次指数平滑预测模型是以最近一期的一、二次指数平滑值来估计线性趋势预测模型的参数,因此,其参数估计值是根据数据的最新变化而不断修正的。此预测方法适宜对现象进行短中期预测。,9-102,【例9-17】,根据表9-5的数据,利用指数平滑法进行预测.解:取=0.45,两次平滑的初始值都取为y1。参数估计值为:,2005年和2006年的销售量预测值为:,9-103,9-104,三、自回归预测,同一时间序列前后观测值之间的相关关系称为自相关。观测值 yt 对其以前若干期观测值 yt-k(k=1,2,)的回归称为自回归。根据自回归模型进行预测就是自回归预测。yt-k也称为滞后期观测值,k 称为滞后期。若考虑 p个滞后期观测值,则自回归模型称为 p 阶自回归模型,通常记为AR(p),可写为如下形式:,9-105,p 阶自回归模型AR(p),模型中:a 为常数项在自回归模型的识别和参数估计过程中,通常要求先将观测值作零均值化处理,所以自回归模型通常不含常数项 a1,2,p是模型的参数;t 为随机误差项。对自回归预测最直观的解释就是:时间序列 第t 期的水平可以根据其以前若干期观测值的线性组合来预测。,9-106,自回归预测的基本步骤,第一步,预测模型的识别。对时间序列的特性进行识别,判断是否适合建立自回归模型、自回归模型的滞后期是多长。识别的依据主要是自相关系数和偏自相关系数。第二步,估计模型参数。可将自回归模型视为多元线性回归模型,可使用最小二乘法来估计其参数。第三步,模型的检验。即根据残差的分布、估计量的 t 统计量、模型的判定系数R2等,对所估计的模型进行检验,经过检验认为适用的模型方能用于预测。,9-107,【例9-18】,根据例9-16的价格时间序列建立自回归模型。解:通过计算知可建立二阶自回归预测模型AR(2)。,根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值。该预测模型的R2=0.607,标准误差为0.0788):,9-108,四、预测误差,预测误差是指现象的实际值与预测值之差。误差小,预测结果的精度就高。要衡量一个预测模型的质量优劣,就只能分析预测模型在原时间序列范围内的预测误差大小。衡量预测模型的误差常用的指标有:1.平均绝对误差(MAE):,2.平均相对误差(MPE):,这两种误差受异常值的影响较小,对多个模型的预测误差进行比较时,采用平均相对误差可以避免绝对水平和计量单位不同的影响。,9-109,3.均方误差(MSE),4.均方根误差(RMSE):,均方误差和均方根误差由于取误差的平方来计算,因此受异常值的影响较大。,9-110,结束语,所有的时间序列预测都有一个关键的假定前提,那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变,从而要求影响现象的各种主要影响因素的作用和结构基本不变。只有在这种前提下,对原时间序列预测误差小的预测模型,才能对现象的未来具有较强的预测能力。,