商务智能 上机实验报告1 运用SPSS完成数据挖掘过程.pdfVIP

商务智能 上机实验报告1 运用SPSS完成数据挖掘过程.pdf

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(商务智能)实验报告

班级学号姓名成绩

实验名称商务智能1实验地点603实验时间2015-5-25

1.实验目的:

(1)将教学讲解数据上机运行增强理解

(2)运用SPSS独立完成一个完整数据挖掘过程。

2.实验内容:

(1)数据清洗

(2)数据集成

(3)数据转换

(4)数据选择

(5)数据挖掘

(6)模式评估

(7)知识呈现

3.实验要求:

(1)实验内容中每个步骤采用SPSS中的一项或多项功能;

(2)记录整个实验过程;

(3)记录实验中出现的问题及解决方法;

(4)记录实验结论和体会。

4.实验准备

PC机、SPSS,

注:SPSS安装在“综合实验系统”实验平台

5.实验过程:

在Spss11.5中实现导入xls格式的数据(失败的可能是打开了表格或是时间应为

2011-05-08)

1、数据清洗:有以下四种方法

(1)排序(升序或降序)data-sortcases:将大数据按照指定列进行升或降序排列

结果:以v5列按升序排列

(2)更替缺失值transform-replacemissingvalues:将某列中缺失的值用均值、中值

或中间填补

以v8为例,选择平均值方法

结果:多了一列v8_1,1、5行的原空值处添上了77

(3)删除方法见4、数据选择

(4)双重排序data-splitfile:将大数据以两列的条件进行排序

选第二个comparegroups

例如选v2、v5,ok

结果:v2列排了顺序、v5在v2的基础上进行了排序

2、数据集成将两个sav文件和并在一起,进行横向或纵向的叠加,便于两文件数据

间进行比较

先另存两份sav(1、22)

(1)纵向合并data-mergefiles-addcases:打开一个另存的文件

例如选择v3、v5、v6、v7

更改*号(源文件里的名字)的名字rename,在空白行中显示

结果:在原有数据下方出现了与原数据行数列数相同的数据

(2)横向合并:data-mergefiles-addvariables

结果:在原有数据右方出现了以参照为列的数据列

3、数据转换Tansform——compute:将现有数据转换为另外的格式或数据

(1)普通:直接输入简单数学表达式

Tragetvalue为新的列名(例如设为v11,表达式为V5+V6)

结果:v11列为新增列,且数值为v5+v6的合计值

)有条件的求和:在普通的基础上选择if条件,选择includeifcase

satisfiescondition(例如增加if条件为v580)

结果:仅将v580情况下的数据进行求和

3)使用函数(functions):在普通或if条件的基础上选择各种函数,(例如ABS

(绝对值)函数,加入v5,ok)

结果:v11列为v5的绝对值

4)转换不同值transform-recode-intodifferentvariables:将统一标准的数

据转换成另一个标准的数据

进入oldannewvalues(例如将一百分制为标准的转换为一五分制为标准,在V555

中体现)

选Range:lowestthought输入70,value为3,add,countiue

name的555前加个v

结果:v555列为新增列,将70以下的数变为3

Data-selectcases:从大数据里根据条件选择需要的文件或是删除不

想要的文件

选择ifconditionissatisfied

进入if,设置限值(例如v570,continue)

将不符合条件的删除掉(或

文档评论(0)

134****8018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档