机器学习导论.pptVIP

  1. 1、本文档共96页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
“尿布与啤酒”—典型关联分析案例 采用关联模型比较典型的案例是“尿布与啤酒”的故事。在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,超市也因此发现了一个规律,在购买婴儿尿布的年轻父亲们中,有30%~40%的人同时要买一些啤酒。超市随后调整了货架的摆放,把尿布和啤酒放在一起,明显增加了销售额。同样的,我们还可以根据关联规则在商品销售方面做各种促销活动。 * 精选文档整理合集 一、基本概念 给定: 项的集合:I={i1,i2,...,in} T={t1,t2…tn}是数据库中事务的集合,每个事务ti则是项的集合,使得 则 为T中的关联规则。 其中 并且 * 精选文档整理合集 规则度量:支持度和置信度 Customer buys diaper Customer buys both Customer buys beer 对所有满足最小支持度和置信度的关联规则 支持度s是指事务集T中包含 的百分比 置信度c是指T中包含A同时也包含B的事务占包含A的事务的百分比 最小支持度 min_sup 最小置信度 min_conf * 精选文档整理合集 强关联规则:如果事务集合T中的关联规则A?B同时满足 support(A?B)min_sup, confidence(A?B)min_conf, 则A?B称为T中的强关联规则。 * 精选文档整理合集 频繁K-项集 k-项集:包含k个项的集合 {牛奶,面包,黄油}是个3-项集 如果K—项集的频率(即支持计数)大于最小支持计数(最小支持度×T中的事务总数n),则称该项集为频繁K-项集 * 精选文档整理合集 3.2 关联规则挖掘步骤 大型数据库中的关联规则挖掘包含两个过程: 找出所有频繁项集 大部分的计算都集中在这一步 由频繁项集产生强关联规则 即满足最小支持度和最小置信度的规则 * 精选文档整理合集 3.3 Apriori算法 定理一 如果某k-项集不是频繁k-项集,则包含IK的(k+1)--项集也不是频繁(k+1)--项集。该性质称为Apriori性质。 * 精选文档整理合集 相关资源 会议 Neural Information Processing Systems Uncertainty in Artificial Intelligence International Conference on Machine Learning European Conference on Machine Learning Computational learning Theory International Joint Conference on Artificial Intelligence * 精选文档整理合集 习题 机器学习方法的种类有哪些?每一类请举例。 假设我们的既定目标是构建识别垃圾邮件的系统,请问垃圾邮件中的什么特征使得我们能够确认它为垃圾邮件?计算机如何通过语法分析来发现垃圾邮件?如果发现了垃圾邮件你希望计算机如何处理它? * 精选文档整理合集 分组题目 1 关联规则(Apropri) 2 贝叶斯网络 3 参数方法 最大似然估计 伯努利密度 高斯(正态分布) 4 聚类 K均值聚类 期望最大化 层次聚类 5 非参数方法 直方图 核估计 K最近邻 6 决策树 7 人工神经网络 8 增强学习 9 遗传算法 * 精选文档整理合集 第二章 监督学习 Chapter 2. Supervised Learning 2.1 由实例学习类 2.2 VC维(Vapnik-Chervonenkis Dimension) 2.3 概率逼近正确学习 2.4 噪声 2.5 学习多类 2.6 回归 * 精选文档整理合集 2.1 由实例学习类 学习“家用汽车”类C 现有一组汽车实例和一组被测人,展示汽车,被测人对汽车标记: 正例:标记为家用汽车 负例:其他类型汽车 机器学习后预测未见过的汽车是否为家用 汽车特征包括 价格、发动机功率、座位数量、车身颜色等。 * 精选文档整理合集 2.1 由实例学习类 仅考虑价格(x1)和发动机功率(x2) 对于每一辆观测的汽车,可以表示为 所有观测的汽车样本表示为 * 精选文档整理合集 我们发现价格和发动机功率在某个确定范围内的是家用汽车。 (P1=价格=p2) AND (e1= 发动机功率=e2) * 精选文档整理合集 我们的目标是找出假设类H 尽可能的与C接近---找出定义H的四个参数。 假设h * 精选文档整理合集 经验误差 经验误差是h的预测值与x中给定的预期值不同的训练实例所占的比例: 假正 假负 * 精选文档整理合集 最特殊假设S 和 最一般假设G

文档评论(0)

159****1262 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档