医药信息分析与决策-第8章关联规则.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医药信息分析与决策-第8章关联规则

8.2.3 关联规则分类 2.基于规则中数据的抽象层次。 基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。在单层的关联规则中,所有的变量都没有考虑到现实的数据是具有多个不同的层次的;而在多层的关联规则中,对数据的多层性已经进行了充分的考虑。例如:IBM台式机=Sony打印机,是一个细节数据上的单层关联规则;台式机=Sony打印机,是一个较高层次和细节层次之间的多层关联规则。 8.2.3 关联规则分类 3.基于规则中涉及到的数据的维数。 关联规则中的数据,可以分为单维的和多维的。在单维的关联规则中,我们只涉及到数据的一个维,如用户购买的物品;而在多维的关联规则中,要处理的数据将会涉及多个维。换成另一句话,单维关联规则是处理单个属性中的一些关系;多维关联规则是处理各个属性之间的某些关系。例如:啤酒=尿布,这条规则只涉及到用户的购买的物品;性别=“女”=职业=“秘书”,这条规则就涉及到两个字段的信息,是两个维上的一条关联规则。 第8章 关联规则 主要内容 关联规则概述 关联规则算法 关联规则应用案例 8.1 关联规则概述 8.1.1啤酒与尿布 在美国沃尔玛超市的货架上,尿片和啤酒赫然地摆在一起出售。为啥…? 每逢周末,啤酒和尿片的销量都很大 有孩子的家庭中,太太经常嘱咐丈夫下班后要买尿片,而丈夫们在买完尿片以后又顺手买啤酒 8.1.1啤酒与尿布 搞清原因后,沃尔玛的工作人员打破常规,尝试将啤酒和尿片摆在一起,结果使得啤酒和尿片的销量双双激增,为商家带来了大量的利润 在顾客同一次购物活动中,对其所购买商品组成的相关性进行研究的方法学 8.1.2 基本概念与规则度量 项目与项集:数据库中不可分割的最小信息单位,称为项目,用符号 i表示。项目的集合称为项目集,简称项集。设集合 是项集, I中项目的个数为 n ,则集合 称为 n -项集。例如,集合{啤酒,尿布,牛奶}是一个3-项集。 8.1.2 基本概念与规则度量 事务与事务集: 设 是由数据库中所有项目构成的集合,一次处理所含项目的集合用 表示,是 I 的子集,称为一个事务。事务的集合 包括 k 个事务,称为事务集。 8.1.2 基本概念与规则度量 关联规则: 关联规则是形如 的蕴含式,其中事务 X, Y 分别是 I 的真子集,并且 。 X称为规则的前提, Y称为规则的结果。关联规则反映 X中的项目出现时, Y中的项目也跟着出现的规律。 8.1.2 基本概念与规则度量 关联规则的支持度(support):关联规则的支持度是事务集中同时包含X 和Y的事务数与所有事务数之比,记为support ( ),即: support ( ) = support = 。 支持度反映了 X和 Y中所含项在事务集中同时出现的频率。 8.1.2 基本概念与规则度量 关联规则的置信度(confidence):关联规则的置信度是事务集中包含 X和 Y 的事务数与所有包含X的事务数之比,记为confidence( ), 即: 置信度反映了包含X 的事务中,出现Y 的条件概率。 8.1.2 基本概念与规则度量 最小支持度与最小置信度: 用户为了达到一定的要求,需要指定规则必须满足的支持度和置信度阈值,当support ( ) 、confidence( ) 分别大于等于各自的阈值时,认为 是有价值的,被称为最小支持度阈值(minsupport)和最小置信度阈值(mincontinence)。其中,minsupport描述了关联规则的最低重要程度,minconfidence规定了关联规则必须满足的最低可靠性。 8.1.2 基本概念与规则度量 频繁项集: 设 为项目的集合,且 , , 对于给定的最小支持度minsupport,若 的支持度support minsupport,则称 为频繁项目集,否则,称 为非频繁项目集。 8.1.2 基本概念与规则度量 强关联规则: 关联规则称为强关联规则, 必须 且

文档评论(0)

000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档