- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
weka数据预处理 Weka平台设计的研究和其数据预处理功能的改进_图文
weka数据预处理 Weka平台设计的研究和其数据预处理功能的改进_图文
导读:就爱阅读网友为您分享以下“Weka平台设计的研究和其数据预处理功能的改进_图文”的资讯,希望对您有所帮助,感谢您对92的支持!
第2章相关理沦知识
北京交通大学顶上学位论文
注:在此表中.为7摊舨.我们龋除7A个低予lo票的统计行,其中2∞4年数据豹也=_f、全蕴程到2004年11局份的调查结瓢
面对各种数据挖掘工具,如何选择满足需要的数据挖掘工具已成为一个问题【3】。具体的选择标准应从以下几方面考虑:
(1)解决复杂问题的能力:数据量的增大,对模式精细度、准确度要求的增高都会导致问题复杂性的增大。
(2)验证方法:在评估模式时采用多种校验方法,从而达到最大的准确度。
(3)可视化:可视化工具提供了直观、简洁的方法,方便了用户,更有助于定位重要的数据,评价模式的质量,从而减少建模的复杂性。
(4)数据选择和转换:模式通常被大量的数据项隐藏。有些数据是冗余的,有些数据是完全无关的。而这些数据项的存在会影响到有价值的
12
第2章相关理论知识
模式的发现。数据挖掘系统的一个很重要功能就是能够处理数据复杂性,提供工具,选择正确的数据项和转换数据值。
(5)扩展性:为了更有效的提高处理大量数据的效率,数据挖掘系统的扩展性十分重要。要了解数据挖掘系统能否充分利用硬件资源?是否支持并行性能?支持那种并行计算机?当处理器的数量增加时,计算规模是否相应增长?是否支持数据并行存储?为单处理器的计算机编写的数据挖掘算法不会在并行计算机上自动以更快的速度运行。为充分发挥并行计算的优点,需要编写支持并行计算的算法。
(6)操作性能:操作性能的好坏是一个至关重要的因素。图形界面友好的工具可以方便用户,引导用户执行任务,为用户节省时间。提供嵌入技术的工具更是它的可取之处,通过嵌入到应用程序中,缩短了开发时间。既可以将模式运用到已存在或新增加的数据上,也可以把模式导出到程序或数据库中。
(7)数据存取能力:好的数据挖掘工具可以使用sQL语句直接从DBMs中读取数据。这样可以简化数据准备工作,并且可以充分利用数据库的优点。没有一种工具可以支持大量的DBMs,但可
您可能关注的文档
- stm8s003fp6 stm8s003f.doc
- struck by lightning Key to Unit 7 When Lightning Struck.doc
- stt企业培训师 STT企业培训师全面提升(TTT实战加强版).doc
- sql2008语句大全 sql 2008 sql查询语句大全.doc
- super easy learning Easy Learning.doc
- swisse护肝片价格 【护肝片价格】_图文.doc
- SXG型振弦式锚杆应力计.doc
- T3财务通专业版11.2发版说明.doc
- T6全线产品售前解决方案参考(2012年)_图文.doc
- T81加热器使用说明书_图文.doc
文档评论(0)