数据挖掘主要工具软件简介.pdfVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据挖掘主要工具软件简介

Dataminning指一种透过数理模式来分析企业内储存的大量资料,以找出不

同的客户或市场划分,分析出消费者喜好和行为的方法。前面介绍了报表软件选

购指南,本篇介绍数据挖掘常用工具。

市场上的数据挖掘工具一般分为三个组成部分:

a、通用型工具;

b、综合/DSS/OLAP数据挖掘工具;

c、快速发展的面向特定应用的工具。

通用型工具占有最大和最成熟的那部分市场。通用的数据挖掘工具不区分具

体数据的含义,采用通用的挖掘算法,处理常见的数据类型,其中包括的主要工

具有IBM公司Almaden研究中心开发的QUEST系统,SGI公司开发的

MineSet系统,加拿大SimonFraser大学开发的DBMiner系统、SAS

EnterpriseMiner、IBMIntelligentMiner、OracleDarwin、SPSSClementine、

UnicaPRW等软件。通用的数据挖掘工具可以做多种模式的挖掘,挖掘什么、

用什么来挖掘都由用户根据自己的应用来选择。

综合数据挖掘工具这一部分市场反映了商业对具有多功能的决策支持工具

的真实和迫切的需求。商业要求该工具能提供管理报告、在线分析处理和普通结

构中的数据挖掘能力。这些综合工具包括CognosScenario和Business

Objects等。

面向特定应用工具这一部分工具正在快速发展,在这一领域的厂商设法通过

提供商业方案而不是寻求方案的一种技术来区分自己和别的领域的厂商。这些工

具是纵向的、贯穿这一领域的方方面面,其常用工具有重点应用在零售业的KD1、

主要应用在保险业的Option&Choices和针对欺诈行为探查开发的HNC软件。

下面简单介绍几种常用的数据挖掘工具:

1.QUEST

QUEST是IBM公司Almaden研究中心开发的一个多任务数据挖掘系统,

目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。系统具

有如下特点:

(1)提供了专门在大型数据库上进行各种开采的功能:关联规则发现、序列模

式发现、时间序列聚类、决策树分类、递增式主动开采等。

(2)各种开采算法具有近似线性(O(n))计算复杂度,可适用于任意大小的

数据库。

(3)算法具有找全性,即能将所有满足指定类型的模式全部寻找出来。

(4)为各种发现功能设计了相应的并行算法。

2.MineSet

MineSet是由SGI公司和美国Standford大学联合开发的多任务数据挖掘

系统。MineSet集成多种数据挖掘算法和可视化工具,帮助用户直观地、实时

地发掘、理解大量数据背后的知识。MineSet2.6有如下特点:

(1)MineSet以先进的可视化显示方法闻名于世。MineSet2.6中使用了6

种可视化工具来表现数据和知识。对同一个挖掘结果可以用不同的可视化工具以

各种形式表示,用户也可以按照个人的喜好调整最终效果,以便更好地理解。

MineSet2.6中的可视化工具有SplatVisualize、ScatterVisualize、Map

Visualize、TreeVisualize、RecordViewer、StatisticsVisualize、Cluster

Visualizer,其中RecordViewer是二维表,StatisticsVisualize是二维统计图,

其余都是三维图形,用户可以任意放大、旋转、移动图形,从不同的角度观看。

(2)提供多种数据挖掘模式。包括分类器、回归模式、关联规则、聚类归、

判断列重要度。

(3)支持多种关系数据库。可以直接从Oracle、Informix、Sybase的表

读取数据,也可以通过SQL命令执行

文档评论(0)

精品文档 + 关注
实名认证
文档贡献者

有多年的一线教育工作经验 欢迎下载

1亿VIP精品文档

相关文档