- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、上机目的及内容
目的:
1.理解数据挖掘的基本概念及其过程;
2.理解数据挖掘与数据仓库、OLAP 之间的关系
3.理解基本的数据挖掘技术与方法的工作原理与过程,掌握数据挖掘相关工具的使用。
内容:
将创建一个数据挖掘模型以训练销售数据,并使用“Microsoft 决策树”算法在客户群中找出购
买自行车模式。请将要挖掘的维度(事例维度)设置为客户,再将客户的属性设置为数据挖掘算法
识别模式时要使用的信息。然后算法将使用决策树从中确定模式。下一步需要训练模型,以便能够
浏览树视图并从中读取模式。市场部将根据这些模式选择潜在的客户发送自行车促销信息。
要求:
利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的
各种问题和解决的方法与过程,并根据实验案例绘出模型及操作过程。实验完成后,应根据实验情况写
出实验报告。
二、实验原理及基本技术路线图(方框原理图或程序流程图)
关联分析:关联分析是从数据库中发现知识的一类重要方法。
时序模式:通过时间序列搜索出重复发生概率较高的模式。
分类:分类是在聚类的基础上对已确定的类找出该类别的概念描述,代表了这类数据的整体信息,既该
类的内涵描述,一般用规则或决策树模式表示。
三、所用仪器、材料(设备名称、型号、规格等或使用软件)
1 台 PC 及 Microsoft SQL Server 套件
四、实验方法、步骤(或:程序代码或操作过程)及实验过程原始记录( 测试数据、图表、
计算等)
创建 Analysis Services 项目
1. 打开 Business Intelligence Development Studio。
2. 在“文件”菜单上,指向“新建”,然后选择“项目”。
3. 确保已选中“模板”窗格中的“Analysis Services 项目”。
4. 在“名称”框中,将新项目命名为 AdventureWorks。
5. 单击“确定”。
-1-
更改存储数据挖掘对象的实例
1.
2.
3.
在“目标”选项部分,验证数据库名称是否为 localhost。如果使用的是其他实例,请键入该实例
的名称。单击“确定”。
1.
系统将打开数据源向导。
2.
在“欢迎使用数据源向导”页面中,单击“下一步”按钮。
3.
4.
在“连接管理器”的“提供程序”列表中,选择“本机 OLE DB\Microsoft OLE DB Provider for
SQL Server”。
5.
6.
7.
8.
9.
10.
11. 单击“完成”。
1.
系统将打开数据源视图向导。
2.
3.
在“欢迎使用数据源视图向导”页上,单击“下一步”。
在“选择数据源”页的“关系数据源”下,系统将默认选中您在上一个任务中创建的 Adventure
Works DW 数据源。 单击“下一步”。
4.
在“选择表和视图”页上,选择下列各表,然后单击右箭头键,将这些表包括在新数据源视图中:
dbo.ProspectiveBuyer
?
?
dbo.vAssocSeqLineItems
?
?
?
dbo.vTimeSeries
5.
单击“下一步”。
6.
在“完成向导”页上,默认情况下,系统将数据源视图命名为 Adventure Works DW。 单击“完
成”。
1.
在解决方案资源管理器中,右键单击“挖掘结构”并选择“新建挖掘结构”启动数据挖掘向导。
2.
3.
在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,再单击“下一步”。
4.
在“创建数据挖掘结构”页的“您要使用何种数据挖掘技术?”下,选择“Microsoft 决策树”。
5.
单击“下一步”。
6.
在“选择数据源视图”页上,请注意已默认选中 Adventure Works DW。在数据源视图中,单
击“浏览”查看各表,然后单击“关闭”返回该向导。
7.
8.
单击“下一步”。
在“指定表类型”页上,选中 vTargetMail 表旁边“事例”列中的复选框,再单击“下一步”。
9.
如果数据源视图中的源表表示一个键,则数据挖掘向导将自动选择该列作为模型的键。
10. 选中 BikeBuyer 列旁边的“输入”和“可预测”。
11. 单击“建议”打开“提供相关列建议”对话框。
只要选中至少一个可预测属性,即可启用“建议”按钮。“提供相关列建议”对话框将列出与可预测列
关联最密切的列,并按照与可预测属性的相互关系对属性进行排序。值大于 0.05 的列将被自动选
中,以包括在模型中。
Age
?
?
CommuteDistance
EnglishEducation
EnglishOccupation
FirstName
?
?
?
?
?
?
?
?
?
?
?
?
?
Gender
GeographyKe
您可能关注的文档
- 最新-2018年广东省中考英语真题及答案 精品.docx
- 保险合同法:损失补偿原则习题与答案.docx
- 层次分析练习答案.docx
- 百度竞价中级认证-广告监测与数据分析 试题+答案(3).docx
- 小学生体检分析报告.docx
- 质量员(土建)答案.docx
- 处方药与非处方药及包装标签和说明书的管理(一)-2_真题-无答案.docx
- 外接球习题及答案.docx
- 对交通肇事案的调研分析调研报告.docx
- 桥梁工程问答题及答案.docx
- 10《那一年,面包飘香》教案.docx
- 13 花钟 教学设计-2023-2024学年三年级下册语文统编版.docx
- 2024-2025学年中职学校心理健康教育与霸凌预防的设计.docx
- 2024-2025学年中职生反思与行动的反霸凌教学设计.docx
- 2023-2024学年人教版小学数学一年级上册5.docx
- 4.1.1 线段、射线、直线 教学设计 2024-2025学年北师大版七年级数学上册.docx
- 川教版(2024)三年级上册 2.2在线导航选路线 教案.docx
- Unit 8 Dolls (教学设计)-2024-2025学年译林版(三起)英语四年级上册.docx
- 高一上学期体育与健康人教版 “贪吃蛇”耐久跑 教案.docx
- 第1课时 亿以内数的认识(教学设计)-2024-2025学年四年级上册数学人教版.docx
文档评论(0)