- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
体系架构题目要求预备知识提交要求MSMiner数据挖掘子
MSMiner课程项目介绍 多策略数据挖掘平台软件MSMiner 背景介绍 MSMiner体系架构 MSMiner功能特点 MSMiner启动时欢迎界面 MSMiner登录界面——MSMiner控制台 MSMiner数据仓库管理子系统MSMetaData MSMiner ETL子系统MSETL MSMiner联机分析处理子系统MSOLAP MSMiner数据挖掘子系统MSDM 课程项目内容要求 对MSMiner数据挖掘子系统进行扩展开发,选择实现下列某种算法: 1.聚类算法:k-means、k-harmonic 2.分类算法:C4.5、SVM、GA 3.关联规则:Apriori、FP-tree 4.神经网络 提交要求和项目流程 提交要求和项目流程如下: 1)可以两至三人为一小组工程实现; 2)实现结果为符合MSMiner数据挖掘子系统挖掘算法DLL接口规范要求的DLL文件。 3)开发完毕,在机房MSMiner环境下进行测试。 4)最后提交程序源码和实验报告,在实验报告中要写清算法步骤、说明以及心得体会等,源码要求有清晰明确的注释。 课程项目预备知识 以下为完成此项目的预备知识: 深刻掌握一种或几种数据挖掘算法,如聚类、分类、关联规则、神经网络算法等,能够用 C/C++ 编程实现。 熟悉 VC++6.0 IDE 编程环境,掌握 MFC 编程机制及其用法。 了解组件编程技术,能够开发简单的 DLL 程序。 数据库基础知识、熟悉 SQL 语句。 课程项目提供的资源 可供参考的资源: (/shizz/AAI-project.html) 1)MSMiner数据挖掘 子系统挖掘算法DLL的 接口详细说明 2)两个算法DLL开发示例 (BP算法、SOM算法) 3)算法DLL公共代码框架 (一组工程文件,工程名为AssocALG) 4)训练数据与测试数据 5)书:史忠植 著 . 知识发现 . 清华大学出版社 .2002. P295~326,可帮助了解 MSMiner 体系设计、编程架构等背景知识。 常见问题解答 几个常见问题的说明: 谢谢大家! 多策略数据挖掘平台MSMiner 常见问题 Copyright ? 2006 中国科学院计算技术研究所 课程项目内容要求 资源清单 课程项目提供资源 背景介绍 界面展示 MSMiner简介 体系架构 题目要求 预备知识 提交要求 多策略数据挖掘平台MSMiner 中科院计算所智能信息处理重点实验室智能科学组 MSMiner( Multi-Strategies Data Miner)是一个针对决策支持的以数据仓库为基础的通用数据挖掘平台软件,同时提供了一个轻量级的数据仓库解决方案。 MSMiner是什么? 数据仓库的设计、建模 第三方工具如PowerDeginer 数据转换与集成 MSETL 数据存储与管理 第三方工具 如 Oracle, SQLServer等 数据分析和展现 MSOLAP 采用第三方查询、报表工具 如BO。 数据仓库的维护和管理 MSMetaData 一个数据仓库解决方案主要包括: 统计分析或数据挖掘工具 MSDM MSMiner由中科院计算所智能信息处理重点实验室从1999年开始设计和实现,经历了早期的VB版本,后来又用VC重新实现,目前正在开发3.0版本。 MSMiner体系结构 外部事务型数据库 数据仓库 元 数 据 管 理 数据抽取、转换、装载(Extract Transform Load) 主题2 主题1 主题n OLAP及可视化工具 数据挖掘模块 ... MSMiner的数据仓库以功能强大的元数据管理MetaServer为调度中心 数据仓库管理工具 MSMetaData ETL(数据抽取、装载、转换)工具 MSETL OLAP(联机分析处理)工具MSOLAP 数据挖掘(Data Mining)工具 MSDM MSMiner的若干特点: 1)通过ODBC接口将数据存储在第三方关系数据库(如Oracle、Sybase、SQL Server、Informix和IBM DB2等),支持多种不同的数据源; 2)采用DLL形式封装数据挖掘算法,从而可以灵活扩充,这样就提供了丰富的挖掘策略。 3)以对话框向导引导用户建立ETL和数据挖掘任务,以面向对象的方式来组织和执行ETL和数据挖掘任务 4)在挖掘任务执行引擎中,提供了任务调度功能,可以定时定期地执行挖掘任务,同时采用多线程技术并发地执行挖掘任务和任务中的步骤。 1)Q:为什么要实现DLL程序,可以实现成可执行程序吗? A:因为本次实验要开发算法DLL程序,目的正是用于封装数据挖掘算法,并最
您可能关注的文档
最近下载
- 德邦快递_销售体系优化项目_销售体系现状分析报告v1.0_20150413汇报版.pptx VIP
- 最新子宫颈高级别上皮内病变管理的中国专家共识2022(完整版).pdf
- 雨棚清单报价表格.docx
- 光电图像处理-PPT课件(全).pptx
- 《初中英语阅读课“教-学-评”一体化的实践研究》课题研究方案.doc
- YC_T 10.4-2018烟草机械 通用技术条件 第4部分:灰铸铁件.pdf
- 一种应用于港口无人集卡的路径调度仿真测试方法、系统及介质.pdf VIP
- 人教版八年级地理上册《4-3 工业》教学课件PPT初二优秀公开课.pptx
- 5.2吸收借鉴优秀道德成果.pptx
- 消费者债务清理条例 - 司法院.doc VIP
文档评论(0)