基于自然语言的Apriori关联规则的视觉挖掘方法 数据挖掘ACM论文翻译-附录为英文原文.docx

基于自然语言的Apriori关联规则的视觉挖掘方法 数据挖掘ACM论文翻译-附录为英文原文.docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于自然语言的Apriori关联规则的视觉挖掘方法摘要:抽象-可视化数据挖掘技术可以以图形方式向用户展示数据挖掘过程,从而使用户更易于理解挖掘过程及其结果,而且在数据挖掘中也非常重要。然而,现在大多数视觉数据挖掘都是通过可视化的结果而进行的。 同时,它不适用于关联规则的可视化处理的图形显示。 鉴于上述缺点,本文采用自然语言处理方法,以自然语言视觉地进行Apriori关联规则的整体挖掘过程,包括数据预处理,挖掘过程和挖掘结果的可视化显示 为用户提供了一套具有更多感知和更易于理解的特征的集成方案关键字:apriori 关联规则 数据挖掘 可视化1 引言 视觉数据挖掘技术是可视化技术和数据挖掘技术的结合。使用计算机图形、图像处理技术等方法将数据挖掘的源数据,中间结果和最终挖掘结果转换成易于理解的图形或图像,然后进行贯穿的理论,方法和技术交互式处理。根据数据挖掘应用中可视化的不同阶段,数据挖掘的可视化可以分为源数据可视化,挖掘过程可视化和结果可视化。源数据可视化 源数据可视化方法在数据挖掘之前,以可视化的形式将整个数据集呈现给用户。 目的是使用户能够快速找到有趣的地区,从而实现挖掘目标和目标的下一步。过程可视化 过程可视化实现起来相当复杂。 主要有两种方法 - 一种是在采矿过程中可视化地呈现中间结果,并使用户根据中间结果的反馈方便地调整参数和约束。 另一种方法是以图标和流程图的形式保持整个数据挖掘过程,根据用户可以观察数据源,数据集成,清理和预处理过程以及采矿结果的存储和可视化等等。(3)结果可视化 数据挖掘结果可视化是指在采矿过程结束时以图形和图像的形式描述挖掘结果或知识,以提高用户对结果的理解,并使用户更好地评估和利用 采矿结果。2、国外家庭视觉数据挖掘研究状况 目前,视觉数据挖掘技术的研究在国内外都处于起步阶段,如何使用可视化技术来显示利用各种数据挖掘算法生成后的模型。该方向的主要研究内容是通过一些特殊视觉图形中的关联规则、决策树和聚类等算法向用户显示生成的结果,以帮助用户更好地了解结果数据挖掘模型。典型的业务应用程序是IBM SPSS Modeler,开源工具包括Weka、Orange、GGobi和KNIME,以及Google Visual Public Platform:Public Data Explorer。视觉数据挖掘工具是一种很好的数据分析工具,在行业应用中,使用可视化数据挖掘工具显示数据挖掘更为明确,结合数据挖掘技术,更有利于分析的数据挖掘结果。 目前,关联规则的可视化研究主要集中在可视化数据和关联规则结果上,而挖掘过程可视化存在很多缺陷。特别是在视觉演示过程中,基本采用图形形式。在实践中已经发现,图形方法不适合在过程中显示关联规则及其结果。因为对于关联规则,我们的目的是找到频繁的项目集,最好的结果显示它们是文本,同时对于最终获得的关联规则,图形应用程序不能够很好地显示,最好的方法是用基于自然语言的方式显示应用程序。 本文提出了基于自然语言的Apriori关联规则的视觉挖掘方案。该方案的预处理,中间过程和采矿结果各个方面均可视化。旨在通过最可接受的自然语言作为工具,实现整个采矿过程的视觉演示。 3 基于APRIORI协会规则的可视化采矿的基本理念 本文提出的关联规则的视觉挖掘基本思想是在数据挖掘的整个过程中,提前提出关联规则的视觉挖掘基本上是关于采矿结果可视化的,很少涉及中间和预处理过程中的可视化。对于结果可视化,图形方法是主要采用的显示方式,如使用平行坐标法,有向图法等。 然而,对于关联规则,通过频繁项目集和关联规则的方式进行图形显示似乎无能为力。协会只是反映规则,规则最直接的形式是使用自然语言,而奥术公式和图形对于那些非常专业的人员而言是可以理解的,不适合普及。而且,当然,充分运用反映关联规则的自然语言对实现有一定困难。 在本文中,采用自然语言的形式,以视觉方式展示了整个采矿过程。可视化过程如图1所示图1关联规则的视觉过程 表1 数学分数变换规则序号条件等级A1Math=85优A2Math=60 and Math=85中A3Math60差(1)数据预处理 数据预处理是整个数据挖掘的关键,也是第一步,一般程序自动完成工作并显示差异。 本文采用完全互动的预处理操作可视化方法,首先构建用户定义的自然语言转换规则库,易于编辑规则,其最终目标是将属性值转换为自然语言。例如,表1可以被定义为这样的规则,根据得分值,不同的分数可以被转换成不同的代码。(2)采矿过程 挖掘过程的可视化主要体现在中间挖掘结果的视觉显示和用户与系统之间的相互作用。 对于关联规则,中间挖掘结果体现在频繁项集合的显示中,

文档评论(0)

店小二 + 关注
实名认证
内容提供者

包含各种材料

1亿VIP精品文档

相关文档