白噪声序列arima

2019-07-26   来源:诚信名言

时间序列模型分析的各种stata命令
篇一:白噪声序列arima

时间序列模型

结构模型虽然有助于人们理解变量之间的影响关系,但模型的预测精度比较低。在一些大规模的联立方程中,情况更是如此。而早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测,因此随着Box and Jenkins(1984)等奠基性的研究,时间序列方法得到迅速发展。从单变量时间序列到多元时间序列模型,从平稳过程到非平稳过程,时间序列分析方法被广泛应用于经济、气象和过程控制等领域。本章将介绍如下时间序列分析方法,ARIMA模型、ARCH族模型、VAR模型、VEC模型、单位根检验及协整检验等。

一、基本命令

1.1时间序列数据的处理

1)声明时间序列:tsset 命令

use gnp96.dta, clear list in 1/20 gen Lgnp = L.gnp

tsset date list in 1/20 gen Lgnp = L.gnp

2)检查是否有断点:tsreport, report

use gnp96.dta, clear tsset date

tsreport, report drop in 10/10 list in 1/12 tsreport, report

tsreport, report list /*列出存在断点的样本信息*/

3)填充缺漏值:tsfill

tsfill

tsreport, report list list in 1/12

4)追加样本:tsappend

use gnp96.dta, clear tsset date list in -10/-1 sum

tsappend , add(5) /*追加5个观察值*/ list in -10/-1 sum

5)应用:样本外预测: predict

reg gnp96 L.gnp96 predict gnp_hat list in -10/-1

6)清除时间标识: tsset, clear

tsset, clear

1.2变量的生成与处理

1)滞后项、超前项和差分项 help tsvarlist

use gnp96.dta, clear tsset date

gen Lgnp = L.gnp96 /*一阶滞后*/ gen L2gnp = L2.gnp96

gen Fgnp = F.gnp96 /*一阶超前*/ gen F2gnp = F2.gnp96

gen Dgnp = D.gnp96 /*一阶差分*/ gen D2gnp = D2.gnp96 list in 1/10 list in -10/-1

2)产生增长率变量: 对数差分

gen lngnp = ln(gnp96) gen growth = D.lngnp

gen growth2 = (gnp96-L.gnp96)/L.gnp96

gen diff = growth - growth2 /*表明对数差分和变量的增长率差别很小*/ list date gnp96 lngnp growth* diff in 1/10

1.3日期的处理

日期的格式 help tsfmt

基本时点:整数数值,如 -3, -2, -1, 0, 1, 2, 3 .... 1960年1月1日,取值为 0;

1)使用 tsset 命令指定显示格式

use B6_tsset.dta, clear tsset t, daily list白噪声序列arima。

use B6_tsset.dta, clear tsset t, weekly list

2)指定起始时点 cap drop month

generate month = m(1990-1) + _n - 1 format month %tm list t month in 1/20

cap drop year

gen year = y(1952) + _n - 1 format year %ty list t year in 1/20

3)自己设定不同的显示格式

日期的显示格式 %d (%td) 定义如下: %[-][t]d<描述特定的显示格式> 具体项目释义:

“<描述特定的显示格式>”中可包含如下字母或字符 c y m l n d j h q w _ . , : - / ' !c C Y M L N D J W 定义如下:

c and C 世纪值(个位数不附加/附加0)

y and Y 不含世纪值的年份(个位数不附加/附加0) m 三个英文字母的月份简写(第一个字母大写) M 英文字母拼写的月份(第一个字母大写) n and N 数字月份(个位数不附加/附加0)

d and D 一个月中的第几日(个位数不附加/附加0) j and J 一年中的第几日(个位数不附加/附加0) h 一年中的第几半年 (1 or 2)

q 一年中的第几季度 (1, 2, 3, or 4) w and W 一年中的第几周(个位数不附加/附加0) _ display a blank (空格) . display a period(句号) , display a comma(逗号) : display a colon(冒号) - display a dash (短线) / display a slash(斜线)

' display a close single quote(右引号) !c display character c (code !! to display an exclamation point)

样式1:

Format Sample date in format ----------------------------------- %td 07jul1948 %tdM_d,_CY July 7, 1948 %tdY/M/D 48/07/11 %tdM-D-CY 07-11-1948 %tqCY.q 1999.2 %tqCY:q 1992:2 %twCY,_w 2010, 48

----------------------------------- 样式2:

Format Sample date in format ---------------------------------- %d 11jul1948 %dDlCY 11jul1948 %dDlY 11jul48 %dM_d,_CY July 11, 1948 %dd_M_CY 11 July 1948 %dN/D/Y 07/11/48 %dD/N/Y 11/07/48 %dY/N/D 48/07/11 %dN-D-CY 07-11-1948

----------------------------------

clear

set obs 100白噪声序列arima。

gen t = _n + d(13feb1978) list t in 1/5

format t %dCY-N-D /*1978-02-14*/ list t in 1/5

format t %dcy_n_d /*1978 2 14*/ list t in 1/5

use B6_tsset, clear list

tsset t, format(%twCY-m) list

4)一个实例:生成连续的时间变量 use e1920.dta, clear list year month in 1/30 sort year month gen time = _n tsset time

list year month time in 1/30

generate newmonth = m(1920-1) + time - 1 tsset newmonth, monthly

list year month time newmonth in 1/30

1.4图解时间序列 1)例1: clear

set seed 13579113

sim_arma ar2, ar(0.7 0.2) nobs(200) sim_arma ma2, ma(0.7 0.2) tsset _t

tsline ar2 ma2

* 亦可采用 twoway line 命令绘制,但较为繁琐 twoway line ar2 ma2 _t

2)例2:增加文字标注 sysuse tsline2, clear tsset day

tsline calories, ttick(28nov2002 25dec2002, tpos(in)) /// ttext(3470 28nov2002 "thanks" ///

3470 25dec2002 "x-mas", orient(vert)) 3)例3:增加两条纵向的标示线 sysuse tsline2, clear tsset day

一阶差分后的ARIMA 模型
篇二:白噪声序列arima

一:作出数据的散点图:

data cj;

input x@@;y=sqrt(abs(x-6590.47));z=dif(y);

t=intnx('year','01jan1980'd,_n_-1);format t year4.;

cards;

4517.8 4862.4 5294.7 5934.5 7171 8964.4 10202.2

11962.5 14928.3 16909.2 18547.9 21617.8 26638.1 34634.4

46759.4 58478.1 67884.6 74462.6 78345.2 82067.5 89442.2

97314.8 118020.7 135822.8 159878.3 183217.4 211923 249530

;

proc gplot;plot x*t y*t z*t;symbol i=join v=dot c=red;

proc arima;identify var=y(1) nlag=12 minic p=(0:5) q=(0:5); estimate p=(1) method=cls;

forecast lead=5 id=t out=caijing;

proc gplot data=caijing;

plot y*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay;

symbol1 c=blue i=none v=star;

symbol2 c=red i=join v=none l=1 w=1;

symbol3 c=green i=join v=none l=2 w=2;

run;

得到如下图形:

分析{y}数据的散点图可以看出其呈现出显著的线性趋势,故对数据进行一阶差分得到{z}即{▽y},然后再作出差分后的时间序列的散点图如下:

可以看出数据已大体平稳,下面利用自相关函数进行平稳性检验:

二:平稳性检验

proc arima;identify var=y(1) nlag=12白噪声序列arima。

其自相关函数和偏自相关函数都是截尾的,所以差分后的时间序列是平稳的。同时对数据进行的白噪声结果显示的该数据不是纯随机序列,故后面的研究具有意义和价值。

三:模型的建立:

根据自相关函数和偏自相关函数的特点,进行ARMA 模型的检验

proc arima;identify var=y(1) nlag=12 minic p=(0:5) q=(0:5);

得到如下结果:

根据BIC越小模型拟合的越好的原则,应建立AR(5)模型。

添加程序:estimate p=5

method=cls;

从输出结果可以看出,有些系数不显著,我们进行调整,修改程序为: estimate p=(1

) method=cls;

调整后除常数项系数不显著外,其它参数的系数非常显著,而且AIC和BIC也比其他模型的小,另外它的残差检验结果也显示延迟6期时残差数据已近似为纯随机序列,说明数据信息已经充分提取。所以这个模型是适应的,该模型为:

Yt1.998Yt10.99Yt2t

四:预报:

程序如下:

forecast lead=5 id=t out=caijing;

proc gplot data=caijing;

plot

y*t=1

forecast*t=2 l95*t=3 u95*t=3/overlay; symbol1 c=blue i=none v=star;

symbol2 c=red i=join v=none l=1 w=1;

symbol3 c=green i=join v=none l=2 w=2;

得到如下结果:

从上述图形可以看出该模型拟合的比较精准。

时间序列ARIMA模型在R中的实现
篇三:白噪声序列arima

江苏省餐饮业零售总额分析预测

学校:江苏大学 学院:财经学院 班级:统计1201

组员:韩亚琼3120812015 马海燕3120812022 顾君颖3120812020 王培培3120812009 陆金龙3120812029 白卓3120812028

完成时间:2014年12月13日星期六

一、

二、

三、

摘要

引言

数据分析

原始数据的获取:

本文所有的样本数据均来自《江苏统计年鉴——2014》 (/retype/zoom/653ed0c8b52acfc788ebc9c7?pn=2&x=0&y=0&raww=643&rawh=658&o=jpg_6_0_______&type=pic&aimh=491.1975116640746&md5sum=9fa1e164f1e68208d9bdaf1cf8387309&sign=9de390c871&zoom=&png=14594-15246&jpg=0-86040" target="_blank">

这里我们仅用到第三列数据,为了方便分析,我们将餐饮业零售总额序列命名为caterts。

第一步序列的平稳性检验

为判断一个序列是否平稳,我们主要通过时序图以及自相关图进行检验。 对caterts做时序图,有图形发现有明显的指数趋势,序列非平稳,也可以初步发现江苏省的餐饮业零售总额逐年递增,尤其是在新世纪以后,人们的生活水平逐年提高,对餐饮业的贡献也增大:

图1 caterts序列时序图

因为原序列有明显的指数趋势,故先对数列进行对数变换得到新的数列

logcatets,序列图如下,具有明显的非线性增长趋势:

图2 对数化后的时序图

对具有明显线性趋势的数列常用的平稳化措施是差分,我们对logcaterts序列进行一阶差分得到新的数列difflogcaterts,时序图如下:

图3 对数化和一阶差分后的时序图

通过对时序图分析发现数列具有平稳性,为了方便分析,我们对difflogcaterts序列进行中心化处理,得到新的数列x。对x进行ADF检验(单位根检验)。

白噪声序列arima。

R

语言中有专门的fUnitRoots包,里面有urdftest功能,是专门进行序列的ADF单位根检验,通过R软件得到如下结果:

Title:Augmented Dickey-Fuller Unit Root Test Test Results:

Test regression none Call:

lm(formula = z.diff ~ z.lag.1 - 1 + z.diff.lag) Residuals:

Min 1Q Median 3Q Max -0.224894 -0.051073 0.006261 0.043257 0.242110 Coefficients:

Estimate Std. Error t value Pr(>|t|)

z.lag.1 -0.59259 0.19455 -3.046 0.0047 ** z.diff.lag 0.02909 0.18067 0.161 0.8731 ---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.08821 on 31 degrees of freedom

Multiple R-squared: 0.2853, Adjusted R-squared: 0.2392 F-statistic: 6.188 on 2 and 31 DF, p-value: 0.005481 Value of test-statistic is: -3.046 Critical values for test statistics: 1pct 5pct 10pct

tau1 -2.62 -1.95 -1.61

从结果可以看出ADF统计量为-3.046,在1%,5%,10%的置信水平下均拒绝原假设,认为序列x平稳。 第二步模型的识别与定阶

模型的识别与定阶主要是通过对序列的自相关和偏自相关观察得到的。通过R软件的到序列x的自相关和偏自相关图:

图4 序列x的自相关图

SAS学习系列39. 时间序列分析Ⅲ—ARIMA模型
篇四:白噪声序列arima

39. 时间序列分析Ⅱ——ARIMA模型

随着对时间序列分析方法的深入研究,人们发现非平稳序列的确定性因素分解方法(如季节模型、趋势模型、移动平均、指数平滑等)只能提取显著的确定性信息,对随机性信息浪费严重,同时也无法对确定性因素之间的关系进行分析。

而非平稳序列随机分析的发展就是为了弥补确定性因素分解方法的不足。时间序列数据分析的第一步都是要通过有效手段提取序列中所蕴藏的确定性信息。Box和Jenkins使用大量的案例分析证明差分方法是一种非常简便有效的确定性信息的提取方法。而Gramer分解定理则在理论上保证了适当阶数的差分一定可以充分提取确定性信息。

(一)ARMA模型

即自回归移动平均移动模型,是最常用的拟合平稳时间序列的模型,分为三类:AR模型、MA模型和ARMA模型。 一、AR(p)模型——p阶自回归模型 1. 模型:

xt01xt1pxtpt

其中,p0,随机干扰序列εt为0均值、2方差的白噪声序列(E(ts)0, t≠s),且当期的干扰与过去的序列值无关,即E(xtεt)=0.

由于是平稳序列,可推得均值

0

11p

. 若00,称为

中心化的AR(p)模型,对于非中心化的平稳时间序列,可以令

0(11p),xt*xt转化为中心化。

记B为延迟算子,p(B)I1BpBp称为p阶自回归多项式,则AR(p)模型可表示为:p(B)xtt.

2. 格林函数

用来描述系统记忆扰动程度的函数,反映了影响效应衰减的快慢程度(回到平衡位置的速度),Gj表示扰动εt-j对系统现在行为影响的权数。

例如,AR(1)模型(一阶非齐次差分方程),Gj1j, j0,1,2, 模型解为xtGjtj.

j0

3. 模型的方差

2对于AR(1)模型,Var(xt)GVar(tj). 2

11j0

2

j

4. 模型的自协方差

对中心化的平稳模型,可推得自协方差函数的递推公式:

用格林函数显示表示:

(k)GiGjE(tjtkj)

i0j0



2

G

j0

jk

Gj

对于AR(1)模型,

2

(k)(0)2

11

k1

k1

5. 模型的自相关函数 递推公式:

对于AR(1)模型,(k)1k(0)1k.

平稳AR(p)模型的自相关函数有两个显著的性质: (1)拖尾性

指自相关函数ρ(k)始终有非零取值,不会在k大于某个常数之后就恒等于零;

(2)负指数衰减

k随着时间的推移,自相关函数ρ(k)会迅速衰减,且以负指数(其i

中i为自相关函数差分方程的特征根)的速度在减小。

6. 模型的偏自相关函数

自相关函数ρ(k)实际上并不只是xt与xt-k之间的相关关系,它还会受到中间k-1个随机变量xt-1, …, xt-k+1的影响。为了能剔除了中间k-1个随机变量的干扰,单纯测度xt与xt-k之间的相关关系,引入了滞后k偏自相关函数(PACF),计算公式为:

其中,

滞后k偏自相关函数实际上等于k阶自回归模型第k个回归系数kk:

两边同乘以xt-k,求期望再除以(0)得到

取前k个方程构成的方程组:

称为Yule-Walker方程,可以解出kk.

可以证明平稳AR(p)模型,当k>p时,kk0. 即平稳AR(p)模型的偏自相关函数具有p步截尾性。

注:实际上样本的随机性使得偏自相关函数不是严格截尾,例如上面两图都1阶显著不为0,1阶之后都近似为0.

白噪声序列arima

http://m.myl5520.com/mingrenmingyan/97757.html

展开更多 50 %)
分享

热门关注

诚信名言警句的句子范文三篇

诚信名言

诚信名言(合集3篇)

诚信名言

诚信名言优质

诚信名言

那些耳熟能详的诚信名言(通用2篇)

诚信名言

从古至今的诚信名言警句范文二篇

诚信名言

岗位奖惩制度

诚信名言

洗手间关心语

诚信名言

白噪声序列arima

诚信名言

净化空调岗位清洁记录

诚信名言

无人机数据格式

诚信名言