机器学习导论.pptVIP

下载本文档

88
0
约8.91千字
约 96页
2020-05-29 发布于湖北
举报
版权申诉

机器学习导论.ppt

1、本文档共96页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

“尿布与啤酒”—典型关联分析案例采用关联模型比较典型的案例是“尿布与啤酒”的故事。在美国，一些年轻的父亲下班后经常要到超市去买婴儿尿布，超市也因此发现了一个规律，在购买婴儿尿布的年轻父亲们中，有30%～40%的人同时要买一些啤酒。超市随后调整了货架的摆放，把尿布和啤酒放在一起，明显增加了销售额。同样的，我们还可以根据关联规则在商品销售方面做各种促销活动。 * 精选文档整理合集一、基本概念给定：项的集合：I={i1,i2,...,in} T={t1,t2…tn}是数据库中事务的集合，每个事务ti则是项的集合，使得则为T中的关联规则。其中并且 * 精选文档整理合集规则度量：支持度和置信度 Customer buys diaper Customer buys both Customer buys beer 对所有满足最小支持度和置信度的关联规则支持度s是指事务集T中包含的百分比置信度c是指T中包含A同时也包含B的事务占包含A的事务的百分比最小支持度 min_sup 最小置信度 min_conf * 精选文档整理合集强关联规则：如果事务集合T中的关联规则A?B同时满足 support(A?B)min_sup, confidence(A?B)min_conf, 则A?B称为T中的强关联规则。 * 精选文档整理合集频繁K-项集 k－项集：包含k个项的集合 {牛奶，面包，黄油}是个3－项集如果K—项集的频率(即支持计数)大于最小支持计数（最小支持度×T中的事务总数n），则称该项集为频繁K-项集 * 精选文档整理合集 3.2 关联规则挖掘步骤大型数据库中的关联规则挖掘包含两个过程：找出所有频繁项集大部分的计算都集中在这一步由频繁项集产生强关联规则即满足最小支持度和最小置信度的规则 * 精选文档整理合集 3.3 Apriori算法定理一如果某k-项集不是频繁k-项集，则包含IK的(k+1)--项集也不是频繁(k+1)--项集。该性质称为Apriori性质。 * 精选文档整理合集相关资源会议 Neural Information Processing Systems Uncertainty in Artificial Intelligence International Conference on Machine Learning European Conference on Machine Learning Computational learning Theory International Joint Conference on Artificial Intelligence * 精选文档整理合集习题机器学习方法的种类有哪些？每一类请举例。假设我们的既定目标是构建识别垃圾邮件的系统，请问垃圾邮件中的什么特征使得我们能够确认它为垃圾邮件？计算机如何通过语法分析来发现垃圾邮件？如果发现了垃圾邮件你希望计算机如何处理它？ * 精选文档整理合集分组题目 1 关联规则（Apropri） 2 贝叶斯网络 3 参数方法最大似然估计伯努利密度高斯（正态分布） 4 聚类 K均值聚类期望最大化层次聚类 5 非参数方法直方图核估计 K最近邻 6 决策树 7 人工神经网络 8 增强学习 9 遗传算法 * 精选文档整理合集第二章监督学习Chapter 2. Supervised Learning 2.1 由实例学习类 2.2 VC维（Vapnik-Chervonenkis Dimension） 2.3 概率逼近正确学习 2.4 噪声 2.5 学习多类 2.6 回归 * 精选文档整理合集 2.1 由实例学习类学习“家用汽车”类C 现有一组汽车实例和一组被测人，展示汽车，被测人对汽车标记：正例：标记为家用汽车负例：其他类型汽车机器学习后预测未见过的汽车是否为家用汽车特征包括价格、发动机功率、座位数量、车身颜色等。 * 精选文档整理合集 2.1 由实例学习类仅考虑价格（x1）和发动机功率（x2）对于每一辆观测的汽车，可以表示为所有观测的汽车样本表示为 * 精选文档整理合集我们发现价格和发动机功率在某个确定范围内的是家用汽车。 (P1=价格=p2) AND (e1= 发动机功率=e2) * 精选文档整理合集我们的目标是找出假设类H 尽可能的与C接近---找出定义H的四个参数。假设h * 精选文档整理合集经验误差经验误差是h的预测值与x中给定的预期值不同的训练实例所占的比例：假正假负 * 精选文档整理合集最特殊假设S 和最一般假设G