数据仓库与数据挖掘实验报告.docxVIP

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、上机目的及内容 目的: 1.理解数据挖掘的基本概念及其过程; 2.理解数据挖掘与数据仓库、OLAP 之间的关系 3.理解基本的数据挖掘技术与方法的工作原理与过程,掌握数据挖掘相关工具的使用。 内容: 将创建一个数据挖掘模型以训练销售数据,并使用“Microsoft 决策树”算法在客户群中找出购 买自行车模式。请将要挖掘的维度(事例维度)设置为客户,再将客户的属性设置为数据挖掘算法 识别模式时要使用的信息。然后算法将使用决策树从中确定模式。下一步需要训练模型,以便能够 浏览树视图并从中读取模式。市场部将根据这些模式选择潜在的客户发送自行车促销信息。 要求: 利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的 各种问题和解决的方法与过程,并根据实验案例绘出模型及操作过程。实验完成后,应根据实验情况写 出实验报告。 二、实验原理及基本技术路线图(方框原理图或程序流程图) 关联分析:关联分析是从数据库中发现知识的一类重要方法。 时序模式:通过时间序列搜索出重复发生概率较高的模式。 分类:分类是在聚类的基础上对已确定的类找出该类别的概念描述,代表了这类数据的整体信息,既该 类的内涵描述,一般用规则或决策树模式表示。 三、所用仪器、材料(设备名称、型号、规格等或使用软件) 1 台 PC 及 Microsoft SQL Server 套件 四、实验方法、步骤(或:程序代码或操作过程)及实验过程原始记录( 测试数据、图表、 计算等) 创建 Analysis Services 项目 1. 打开 Business Intelligence Development Studio。 2. 在“文件”菜单上,指向“新建”,然后选择“项目”。 3. 确保已选中“模板”窗格中的“Analysis Services 项目”。 4. 在“名称”框中,将新项目命名为 AdventureWorks。 5. 单击“确定”。 -1- 更改存储数据挖掘对象的实例 1. 2. 3. 在“目标”选项部分,验证数据库名称是否为 localhost。如果使用的是其他实例,请键入该实例 的名称。单击“确定”。 1. 系统将打开数据源向导。 2. 在“欢迎使用数据源向导”页面中,单击“下一步”按钮。 3. 4. 在“连接管理器”的“提供程序”列表中,选择“本机 OLE DB\Microsoft OLE DB Provider for SQL Server”。 5. 6. 7. 8. 9. 10. 11. 单击“完成”。 1. 系统将打开数据源视图向导。 2. 3. 在“欢迎使用数据源视图向导”页上,单击“下一步”。 在“选择数据源”页的“关系数据源”下,系统将默认选中您在上一个任务中创建的 Adventure Works DW 数据源。 单击“下一步”。 4. 在“选择表和视图”页上,选择下列各表,然后单击右箭头键,将这些表包括在新数据源视图中: dbo.ProspectiveBuyer ? ? dbo.vAssocSeqLineItems ? ? ? dbo.vTimeSeries 5. 单击“下一步”。 6. 在“完成向导”页上,默认情况下,系统将数据源视图命名为 Adventure Works DW。 单击“完 成”。 1. 在解决方案资源管理器中,右键单击“挖掘结构”并选择“新建挖掘结构”启动数据挖掘向导。 2. 3. 在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,再单击“下一步”。 4. 在“创建数据挖掘结构”页的“您要使用何种数据挖掘技术?”下,选择“Microsoft 决策树”。 5. 单击“下一步”。 6. 在“选择数据源视图”页上,请注意已默认选中 Adventure Works DW。在数据源视图中,单 击“浏览”查看各表,然后单击“关闭”返回该向导。 7. 8. 单击“下一步”。 在“指定表类型”页上,选中 vTargetMail 表旁边“事例”列中的复选框,再单击“下一步”。 9. 如果数据源视图中的源表表示一个键,则数据挖掘向导将自动选择该列作为模型的键。 10. 选中 BikeBuyer 列旁边的“输入”和“可预测”。 11. 单击“建议”打开“提供相关列建议”对话框。 只要选中至少一个可预测属性,即可启用“建议”按钮。“提供相关列建议”对话框将列出与可预测列 关联最密切的列,并按照与可预测属性的相互关系对属性进行排序。值大于 0.05 的列将被自动选 中,以包括在模型中。 Age ? ? CommuteDistance EnglishEducation EnglishOccupation FirstName ? ? ? ? ? ? ? ? ? ? ? ? ? Gender GeographyKe

文档评论(0)

鱼干 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档