- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(商务智能)实验报告
班级学号姓名成绩
实验名称商务智能1实验地点603实验时间2015-5-25
1.实验目的:
(1)将教学讲解数据上机运行增强理解
(2)运用SPSS独立完成一个完整数据挖掘过程。
2.实验内容:
(1)数据清洗
(2)数据集成
(3)数据转换
(4)数据选择
(5)数据挖掘
(6)模式评估
(7)知识呈现
3.实验要求:
(1)实验内容中每个步骤采用SPSS中的一项或多项功能;
(2)记录整个实验过程;
(3)记录实验中出现的问题及解决方法;
(4)记录实验结论和体会。
4.实验准备
PC机、SPSS,
注:SPSS安装在“综合实验系统”实验平台
5.实验过程:
在Spss11.5中实现导入xls格式的数据(失败的可能是打开了表格或是时间应为
2011-05-08)
1、数据清洗:有以下四种方法
(1)排序(升序或降序)data-sortcases:将大数据按照指定列进行升或降序排列
结果:以v5列按升序排列
(2)更替缺失值transform-replacemissingvalues:将某列中缺失的值用均值、中值
或中间填补
以v8为例,选择平均值方法
结果:多了一列v8_1,1、5行的原空值处添上了77
(3)删除方法见4、数据选择
(4)双重排序data-splitfile:将大数据以两列的条件进行排序
选第二个comparegroups
例如选v2、v5,ok
结果:v2列排了顺序、v5在v2的基础上进行了排序
2、数据集成将两个sav文件和并在一起,进行横向或纵向的叠加,便于两文件数据
间进行比较
先另存两份sav(1、22)
(1)纵向合并data-mergefiles-addcases:打开一个另存的文件
例如选择v3、v5、v6、v7
更改*号(源文件里的名字)的名字rename,在空白行中显示
结果:在原有数据下方出现了与原数据行数列数相同的数据
(2)横向合并:data-mergefiles-addvariables
结果:在原有数据右方出现了以参照为列的数据列
3、数据转换Tansform——compute:将现有数据转换为另外的格式或数据
(1)普通:直接输入简单数学表达式
Tragetvalue为新的列名(例如设为v11,表达式为V5+V6)
结果:v11列为新增列,且数值为v5+v6的合计值
)有条件的求和:在普通的基础上选择if条件,选择includeifcase
satisfiescondition(例如增加if条件为v580)
结果:仅将v580情况下的数据进行求和
3)使用函数(functions):在普通或if条件的基础上选择各种函数,(例如ABS
(绝对值)函数,加入v5,ok)
结果:v11列为v5的绝对值
4)转换不同值transform-recode-intodifferentvariables:将统一标准的数
据转换成另一个标准的数据
进入oldannewvalues(例如将一百分制为标准的转换为一五分制为标准,在V555
中体现)
选Range:lowestthought输入70,value为3,add,countiue
name的555前加个v
结果:v555列为新增列,将70以下的数变为3
Data-selectcases:从大数据里根据条件选择需要的文件或是删除不
想要的文件
选择ifconditionissatisfied
进入if,设置限值(例如v570,continue)
将不符合条件的删除掉(或
文档评论(0)