数据挖掘实验报告(参考).docx

下载文档

14
0
约2.97千字
约 8页
2023-09-12 发布于山东
举报
版权申诉
保障服务

数据挖掘实验报告(参考).docx

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

时间序列的模型法和数据发掘两种方法比较剖析研究实验目的:经过实验能对时间序列的模型法和数据发掘两种方法的原理和优弊端有更清楚的认识和比较. 实验内容:采纳1952-2006年的中国GDP,分别对之用自回归挪动均匀模型 (ARIMA)和时序模型的数据发掘方法进行剖析和展望 ,并对两种方法的趋向和展望结果进行比较并给出解说. 实验数据:本文研究采纳 1952-2006年的中国GDP，其资料以下日期国内生产总值(亿元) 日期国内生产总值(亿元) 2006-12-31 209407 1997-12-31 74772 2005-12-31 183085 1996-12-31 2004-12-31 136515 1995-12-31 2003-12-31 1994-12-31 2002-12-31 1993-12-31 2001-12-31 1992-12-31 2000-12-31 89404 1991-12-31 1999-12-31 82054 1990-12-31 1998-12-31 79553 1989-12-31 1988-12-31 1969-12-31 1987-12-31 1968-12-31 1986-12-31 1967-12-31 1985-12-31 1966-12-31 1868 1984-12-31 7171 1965-12-31 1983-12-31 1964-12-31 1454 1982-12-31 1963-12-31 1981-12-31 1962-12-31 1980-12-31 1961-12-31 1220 1979-12-31 1960-12-31 1457 1978-12-31 1959-12-31 1439 1977-12-31 1958-12-31 1307 1976-12-31 1957-12-31 1068 1975-12-31 1956-12-31 1028 1974-12-31 1955-12-31 910 1973-12-31 1954-12-31 859 1972-12-31 1953-12-31 824 1971-12-31 1952-12-31 679 1970-12-31 表一国内生产总值（GDP）是指一个国家或地域所有常住单位在一准时期内生产活动的最后成就。这个指标把公民经济所有活动的产出成就归纳在一个极为简洁的统计数字之中为评论和衡量国家经济状况、经济增加趋向及社会财产的经济表现供给了一个最为综合的尺度，能够说，它是影响经济生活以致社会生活的最重要的经济指标。对其进行的剖析展望拥有重要的理论与现实意义。实验步骤: 1.采纳1952年到2001年这50个数据参加自回归挪动均匀模型(ARIMA)建模(所用的工具是 Eviews).依据博克斯-詹金斯提出的建模思想,详细步骤为: 对原序列进行安稳性查验。在以年份为横轴，以山东省GDP为纵轴的坐标系中作曲线图如图1所示。图一从图1中能够看出全国的GDP不拥有显然的周期变化和季节颠簸，但体现出显然的增加趋势，他的有关系数和偏有关系数如图二所示图二从图二中能够看到，他的自有关系数是拖尾的，而偏有关系数是截尾的。对样本数据用ADF进行单位根查验的到结果如图三图三这里ADF值大于三个不一样查验水平下的临界值，故而能够判断出，我国GDP序列是非安稳的。这就需要对GDP序列进行差分以使序列变得安稳。由图一能够看出，GDP序列显然带有指数性质，所以现对该序列进行对数变换在eviews中输入genrlngdp=ln(gdp)生成新的序列lngdp，并对新序列进行安稳性查验。Lngdp的有关系数和偏有关系数如图四所示，图四对lngdp用ADF进行单位根查验的结果如图五图五这里lngdp的ADF变为了，依旧大于三种不一样查验水平下的临界值。从中能够看出，对GDP 序列进行对数办理后，序列lngdp序列依旧不安稳。需要再对lngdp序列进行差分办理。在 eviews中输入genrdlngdp=d(lngdp)生成新序列dlngdp。并对dlngdp进行安稳性剖析。其自有关系数和偏自有关系数如图六所示图六其ADF查验如图六图六这是ADF值为小于在1%校验水平下的临界值，即能够得出dlngdp序列为安稳序列的结论。 (2)经过计算能够描绘序列特点的一些统计量（如自有关系数或非自有关系数），来确立 ARMA模型的结束p和q，并初始计算时选择尽可能少的参数。从dlngdp序列的自有关系数和偏自有关系数图中能够看出，该序列能够用ARMA模型来表示，且因为自有关系数与偏自有关系数都是一阶截尾的，故取p=1，q=1，采纳ARIMA（1，1）模型。第三步，预计模型的未知参数，并查验参数的明显性