您好,欢迎来到华佗健康网。
搜索
您的当前位置:首页实验二数据预处理及时序图绘制

实验二数据预处理及时序图绘制

来源:华佗健康网


实验二 数据预处理及时序图绘制

一、 实验目的:了解GPLOT过程的使用,利用GPLOT绘制时序图并对时序图进行 分析。了解ARIMA过程的使用,利用ARIMA进行平稳性分析及纯随机性检验。 二、 实验内容

(1)Gplot 过程

生成高分辨率图形的PROC GPLOT过程的一般使用格式如下:

Porc Gplot DATA=数据集 ; 纵坐标变量Y*横坐标变量X… …</选项列表>; Plot Symbo ln <选项列表> ; Axis n Run ; <选项列表> ;

使用PROC GPLOT过程和PROC PLOT过程的区别是,对于PROC GPLOT语句, PROC PLOT语句中的VPCT和HPCT等选项不可使用。两者的PLOT语句使用方法 基本相同。最主要的区别是,在 PROC GPLOT过程中,可使用SYMBOLn语句和 AXISn语句。

SYMBOLn语句的主要作用:可以定义数据点的符号,可以定义数据点之间的连 接方式,可以定义数据点和线的颜色。

SYMBOLn语句的n取值范围从1到99,缺

省值是1, n代表Y*X两个变量形成数据连线的系列数。一些主要选项如下:

V=数据点图形符号 一一数据点的符号有 NONE (没有)、PLUS (缺省值加号)、STAR

(星号)、SQUAR (小方块)、DIAMOND (小菱形)、TRANGLE (三角形)、CIRCLE (小圆圈)。

1=数据点间连接方式 一一常用的连接有 NONE (没有)、JOIN (直线)、SPLINE (平 滑)、NEEDLE (从数据点到横坐标画垂直线)、HILOC (最高、最低、收盘价)、RL (直线回归线)、BOX25 (盒形线)。

W=连线的线宽 ——例如,w=5。 H=图形符号的高度 一一例如,h=2.5。 L=定义连线的类型 例如,l=2。 C=定义颜色 ----- 例如,c=red。

FONT=定义一种字体 例如,font=swissb。

SYMBOLn语句所定义的各种选项,由于数量众多, 用户一般很难记忆,我们上 面所列出的仅仅是一小部分。通常可以在命令输入框中发布

SYMBOL命令,调出

14

SYMBOL窗口,在选项参数的横线上键入?后,在参数对话框中选择参数。共有 项参数选项,每项中还有许多参数值。

一个SYMBOLn语句一旦被定义就一直保持有效,直到重新定义或者退出

SAS

系统。执行一个不带任何选项的 SYMBOLn语句将取消SYMBOLn的全部定义,并 不影响其他的SYMBOL语句。如果想要取消所有的 SYMBOL语句定义,提交下面 的语句:

goptions reset=symbol ;

2.1975-1980 年夏威夷岛莫那罗亚火山( Mau na loa )每月释放的C02数据如下(单位:ppm), 见表2-7.

330.45 331.9 331.63 333.05 332.81 334.65 334.66 336.25 335. 337.41 337.81 339.25

330.97 330.05 332.46 330.87 333.23 332.41 335.07 334.39 336.44 335.71 338.16 337.19

331. 328.58 333.36 329.24 334.55 331.32 336.33 332.44 337.63 333.68 339.88 335.49

332.87 328.31 334.45 328.87 335.82 330.73 337.39 332.25 338. 333.69 340.57 336.63

333.61 329.41 334.82 330.18 336.44 332.05 337.65 333.59 339.06 335.05 341.19 337.74

333.55 330.63 334.32 331.5 335.99 333.53 337.57 334.76 338.95 336.53 340.87 338.36

cards ; (1)

绘制序列时序图,并判断该系列是否平稳。

data example2_1; in put price@@; time=intnx( 'month' , '01jan1975'd ,_n_- 1); format time date.;

330.45 330.97 331. 332.87 333.61 333.55 331.90 330.05 328.58 328.31 329.41 330.63 331.63 332.46 333.36 334.45 334.82 334.32 333.05 330.87 329.24 328.87 330.18 331.50 332.81 333.23 334.55 335.82 336.44 335.99 334.65 332.41 331.32 330.73 332.05 333.53 334.66 335.07 336.33 337.39 337.65 337.57 336.25 334.39 332.44 332.25 333.59 334.76 335. 336.44 337.63 338. 339.06 338.95 337.41 335.71 333.68 333.69 335.05 336.53 337.81 338.16 339.88 340.57 341.19 340.87

339.25 337.19 335.49 336.63 337.74 338.36 proc gplot data =example2_1; plot price*time= 1; symboll c=black v=star i =join; run ;

time

时序图给我们的提供的信息非常明确, 夏威夷岛莫那罗亚火山(

Mau na loa )每月释放的co2时

间序列图有明显的递增趋势,所以它不是平稳序列。 (2 )计算该序列的样本自相关系数

{(k =1,2,…,24)。

data example2_1; in put price@@; time=intnx( 'month' , '01jan1975'd ,_n_- 1); format time date.; cards ;

330.45 330.97 331. 332.87 333.61 333.55 331.90 330.05 328.58 328.31 329.41 330.63 331.63 332.46 333.36 334.45 334.82 334.32 333.05 330.87 329.24 328.87 330.18 331.50 332.81 333.23 334.55 335.82 336.44 335.99 334.65 332.41 331.32 330.73 332.05 333.53 334.66 335.07 336.33 337.39 337.65 337.57 336.25 334.39 332.44 332.25 333.59 334.76 335. 336.44 337.63 338. 339.06 338.95 337.41 335.71 333.68 333.69 335.05 336.53 337.81 338.16 339.88 340.57 341.19 340.87

339.25 337.19 335.49 336.63 337.74 338.36 proc arima data =example2_1; iden tify var =price; run ;

Correlati on

0.90751 0.72171 0.51252

0.34982 0.2469 0.20309 0.21021 0.229 0.333 0.48472 0.58456 0.60198 0.51841 0.36856 0.20671 0.08138 0.00135 -0.03248

(3)绘制该样本自相关图,并解释该图形。

Aut ocorreht i ans

Coverience

0 1

9.832752 9.014050 7 J6S604 5.090716 3.4747CC 2.452361 2.0172C5 £.087944

Correlat 伽

1JOOOO 0.30751 0.72171 0.51252 0.34S62 0.24C90 0.2D309 0.21021 0.229 D.3B433 0.48472 0.58456 o.eoias 0.51841 0.36356 0.20671 0.00136 0.00135 '.03248

HfiLfi^iUiUiUiUiLiiLjiLiiJii^iiiiikJikiiLiikiijHihiiii ipiipi ipiipiip up iiriirnT>>T,,i'H

,,,,,,,,,,,

■■r1 ■1JTTTTT

ikikiUiUiUiUiLiiLi Juiki^iJuijLiikiikiiiiiiiili ip i ip i ip i ip i ip up up up ii| ii | iipuf up iTirJirJiiriiT1

Std Error 0

0.117051 0.191744 0.226850 0.241932 0.24SBG8 0.252237 0.2498 0.25BB 0.2B0B47 0.2B7B27 0.2796 0.29B045 0.312S84 0.324306 0.330072 0.331GB6 0.382142 0.332142

***** ,

■ Uiki^iUiUiUiUiiu

i| ii| i ifiifiif iif iif i if i ifi I f 11 f > 'T1 ■ ■■■

2 3

4 5 6

常**出*册谢册出谢

**** ・

***** ,

1 e

S 10 II

匸血1佃

4.814571 G.SDG3DB 5.9733C6 5 J492 3.6604 2.05B220 0.606334 0.013455 -0.822607

■ ■ ■

***********

\\2 13

14 15 IE 17 18

**卡卡张张张张张***

**** ’

■ *

\".\"marks two standard errors

自相关图显示序列子相关系数长期位于零轴的一边,这是具有单调趋势序列的典型特征,同时 自相关图呈现出明显的正弦波动规律,这是具有周期变化规律的非平稳序列的典型特征。自相 关图显示出来的这两个性质和该序列时序图显示的带长期递增趋势的周期性质是非常吻合的。

3.1945-1950年费城月度降雨量数据如下(单位: mm)

74.9 84.6 101.1 69.3 80 40.9

38.4

2.3 96.8 1.5 137.7 0.5

568.6

55.6 68

105.2 80.5 144.3

37.1 171.7 .9 62.5 49.5

148.6 18.7 220.5 19.4 174.8 24

211

225 131.6 63.2 86.4 165.9 148.6

95.3 112.8 181.6 136.9 106.7 159.3

100.6 81.8 73.9 4.8 31.5 5.3 92.2

48.3 31 6

144.5 47.5

0.1

28.3 744

(1)

计算该序列的样本自相关系数

&(k =1,2,…,24)

166.9 38 112.3 63

data example2_2; in put price@@; time=intnx( 'month' , '01jan1945'd ,_n_- 1); format time yymmdd10.; cards ; 69.3 74.9 84.6 101.225 95.3 48.3 144.5 80 40.9 100.6

1 28.3

38.4 52.3 37.1 148.6 218.7 131.6 31 47.5 68.6 112.8 81.8

70.1 96.8 61.5 55.6 171.7 220.5 119.4 63.2 73.9 .8 181.6

166.9 48 137.7 80.5 105.2 .9 174.8 124 86.4 136.9 31.5 35.3 112.3

43 ]

97 80.5 62.5 158.7.6 165.9 106.7 92.2 63.2 160.8 26.2

2 77 !

52.3 105.4 144.3 49.5 .1 148.6 159.3 85.3 67.3 116.1

112.8 59.4

proc arima data =example2_2; iden tify var =price; run ;

(2) 判断该序列的平稳性 data example2_2; in put price@@; time=intnx( 'month' , '1jan1945'd format time yymmdd10. ; cards ; 69.3 40.9 74.9 80.0

144.5 28.3 38.4 52.3 37.1 68.6

47.5 70.1 96.8 61.5 55.6 171.7

166.9 48.0 137.7 80.5 105.2 .9

112.3 43.0 160.8 97.0 80.5 62.5

77.0 52.3 105.4 144.3 49.5

112.8 59.4 ; proc gplot data =example2 2; plot price*time= 1; symbol1 c=black v=star i =join; | run ; |

,n- 1); 84.6

101.1

225.0 131.6 63.2 86.4

95.3

100.6

48.3

148.6

218.7

112.8

81.8

31.0

220.5

119.4

181.6

73.9

.8

174.8

124.0

136.9

31.5

35.3

158.2

7.6 .1

165.9

106.7

92.2

63.2

26.2 67.3

116.1

148.6 159.3 85.3

price 300

time

该序列的时序图如上,图上可以看出该序列在一个常值附近上下波动,且不具有周期性,判断 该序列为平稳序列。

5表2-9数据是某公司在2000-2003年期间每月的销售量。 销售量 2000 年 2001 年 2002年 2003 年

153 134 145 117 1月

2月 3月

4月 5月 6月 7月 8月 9月 10月 11月 12月

(1)

187

234 212 300 221 201 175 123 104 85 78

175 243 227 298 256 237 165 124 106 87 74

203 1 214 295 220 231 174 119 85 67 75

178 149 178 248 202 162 135 120 96 90 63

绘制该序列时序图及样本自相关图。

1•时序图

data example2_3; in put price@@;

time=intnx( 'month' , '1jan2000'd ,n- 1); format time yymmdd10. ; cards ;

153 187 234 212 300 221 201 175 123 104 85 134 175 243 227 298 256 237 165 124 106 87 145 203 1 214 295 220 231 174 119 85 67 117 178 149 178 248 202 162 135 120 96 90

78

74 75 63

proc gplot data =example2_3; plot price*time= 1;

symboll c=black v=star i =join; run ;

time

2.自相关图

/kitoccrrelit ions

0

1

2 9

Ctiva「i ance Correlation

1.000^0 4202.873

S108.014

1320.888

1 33763?1012345671

ill Hi KII ■!■ ifi Hi ifa di dr ill di ri|i di ■■■ ■■■ ifa Hi il i , liili ~irfi lap i]' ■ iTi'T

1

T・*T・ iiT1 u IT™ T1 ■T1 \"11 I^I c 11 ■11 ill iLi iL-ili ila di da sli ill ■!■ ill ■ !■ rp ^ji aji ■(■ ■]■ ip i|nr|i rp q|i rp rp igi a屮督些*屮■屮” ■ |i 1 |i■ \"i«pviRi i\"-i|ii|s

Std Error

0

0.14493S 0.208852 0.223741 0.223342 0.238466 0.269853 0.307374

4 ^1345.16&

341.394

5

6 7 0 g

-2600 J31 -8080.1C8

0.73950 0.45704 D.OB12E -.32006 -.61630

»

* 昭出囂附當咐

■<

■I ■

弗岩卅榊出駅笊:!:窃律常

iyi if

ill il\"

yi11 ■. -s1111™.111

-24.955

-1427.30?

47.S4W4 1402.672 2^36.848 3071.9GB

1

-.72088 -.62932

10

11 12

-.33960 0.01190 01.33372 0.57869 0,7303:

0.333136

iiljH|idh^jiiiilj ita ■^7rp~[i»p«girp

.

4

0.340274

0.340282 0.347083 0.366652

marks two siand&rd errors

(1) 判断该序列的平稳性

答:该序列在一个常值附近上下波动,但据周期性,因此判定该序列为不平稳序列。

6. 1969年1月至1973年9月在芝加哥海德公园内每 10 14 33 26 9 16

15 18 33 21 11 8

10 3 12 17 17 8

10 9 19 19 12 7

12 11 16 13 8 12

10 10 19 20 14 6

7 6 19 24 14 10

7 12 12 12 12 8

28天发生的抢包案件表如下 10 14 34 6 5 10

14 10 15 14 8 5

8 25 36 6 10

17 29 29 12 3

time

时序图

Autoccrrelat ions

Covariance

0

1 2

4202.87S 8108.014 1920.888 341.390 -1345.I&6 -2G00.731 -3080.188 -24.955 -1427.902 47.843424 1402.572 243C.343 3071

Correlation

1.00000 0.78S50 0.45704 0.08123 -.32006 -.61360 -.72098 -.G2932 -.33960 0.01198 0.33372 0.57963 0.73092

a 111111 L» i.l J Sid Error 0.144338

0.208852

3 4

5 e ? s 9 10

0.228741

0.22934?

■ 1 ■ i!■ ill■ JL>LL* 山mg山JL> ■Ti E下*n豪萨甲秤沪ip ip

ih .n*X*^lr'X.1'X* 山山 ™Tp rps rp f|Wp rps rfi efi

0.23846&

A

ai

出寧笊:|{那樓氷

山山*X*St 山 m毋RM卉聞R-iPMEipm

B

11

12

9

弗:

HHcH{咄席側弗浪溶臨常脚

0.2S985S

0.307374 0.383139 0.340274 0.340232 0.347033 0.366652

\"marks two stftndard errors

自相关图

该序列在一个常值附近上下波动,且不据周期性,且该序列的自相关图显示自相关数在 后,俊落入2倍标准差范围以内,因此判定该序列为平稳序列。 该序列纯随机性检验:

To Lag

$ 12

3阶之

Chi-

Square

.02

OF & 12

Pr >

ChiSq

Autocorre1 at Ions ---------------------------------------

0.506

C0001

<.0001

0.639

0.270

0.374 0,178 0.291 0.25S 1.258 0,207 0.148 0,226

检验结果显示,在各阶延迟下 LB检验统计量的 P值都非常小(<0.0001),所以可以很大的把

%二人-Xtv并判断序列{ y }的平稳性及纯随机性。

握(置信水平>99.999%)判定该序列为非白噪声序列,即非纯随机序列。

(2)对该序列进行函数运算:

{ yt }时序图: data example2_5; in put price@;

time=intnx(

format time cards ; 19 -7 j -17 7

'mon th' ,‘1ja n2000'd

yymmdd10.;

,_n_- 1);

2 15 -12 -10 - 3 -5 9 5 0 -9 1 10 0 - 57 - 4 5 -3 - 5 4

2- 9

1 - 6 - 8 0 13

5

-10 -4 2 0 0 0 -4 6 20 -28 -1 5 0 5 - 1 - 6 - 3 20

11 -30 4 19

-17 -9

price

time

proc gplot data =example2_5; plot price*time= 1; symbol1 c=black v=star i =join; run ;

^□tocorreht ions

L$容 Covariance

0 1 2 3 4 5 6 7 S 9 10 11 12 13 14

100J21

-5.826136 -53.595009 -ejsseoe 19.257774 22.2192S9 -6.660430 -10.4S47IG -2L200Se0

e.555523 33.0657S6 -1LB135 -2L0490 '3J02369 15.612275

Correiat 丨 on

1.00000 -.08816 -.53470 -.08748 0.19235 0.22192 -.06652 -.10452 -.21175 0.06E48 0.33028 -J 1825 -.21024 -.03099 0.15593

* ** Std Error

0

■ ■

匾®*A1® ⑹电血血 ■ ii ii if if ■■

11 ii ■■

■■ ii i

出出窗就 + 出谢出就 *

阳 * *

■ ** ■ a A *

■ # Hitt*

0.192453 0.133479 0.166879 0.167681 0.171503 0.1774 0.17&9U 0.177994 0.182360 0.182772 0.192958 0.194226 0.198177 0.198262

marks two standard errors

自相关图

该序列在一个常值附近上下波动,且不据周期性,且该序列的自相关图显示自相关数在 后,俊落入2倍标准差范围以内,因此判定该序列为平稳序列。 该序列纯随机性检验:

1阶之

To

Chi-

Pr >

DF E 12

Lag

6 12

Square

24.25

44.48

ChiSq

0.0006 <,0001

Autocorrelat ions -

-0*067 0,065

0.19J 0.330

-O.OG8 -0J05

-0.535 -0.212

0*222 -0.118

-0.067 -0J10

检验结果显示,在各阶延迟下

LB

检验统计量的 P值都非常小( <0.05 )所以可以很大的把握判

定该序列为非白噪声序列,即非纯随机序列。

实验小结:判断一个序列是否为平稳序列,我们可以通过时序图来判定,平稳的随机序列一定 是在一个常值附近上下波动,如果出现周期变换,则不平稳。而该序列是否为白噪声序列可以 通过P值来检验。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.com 版权所有 湘ICP备2023021991号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务