- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
人工智能技术与应用1.2使用简单线性回归预测广告投入的收入-数据分析
课程概况—基本情况PART01数据分析项目概述开发流程机器学习
人工智能概述项目背景:公司统计了近期公司在微信、微博、电视和其他广告媒体上的投入,现在需要预测在广告媒体上投入多少资金,公司能获得多大的收益。数据集:特征:wechat、weibo、others标签:sales
处理流程-加载数据加载数据:Pandasread_csv函数:打开CSV文件,返回一个data.frame对象使用head()、info()、describe()函数查看数据:
处理流程-相关性分析数据相关性分析:corr()函数:检查两个变量之间变化趋势的方向以及程度,值范围-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大相关性越。可以使用热力图heatmap来显示相关系数
处理流程-相关性分析数据相关性分析:使用seaborn绘制pairplot图,也可以分析出单个特征和标签之间的一种关系。例如“wechat”微信的投入基本和收益呈现一种线性关系。
处理流程-选取数据选取数据:通过对数据现相关性的分析,我们够可以从数据集中取出“wechat”微型的数据作为X,“sales”作为y建立一个线性模型并训练模型。
处理流程-选取数据选取数据:张量-tensor是现代机器学习的基础。它的核心是一个数据容器,多数情况下,它包含数字,有时候它也包含字符串,但这种情况比较少。因此把它想象成一个数字的水桶。0维度张量--标量--一个数字1维度张量—向量—1维数组—1个人单列或者单行的数据2维度张量—矩阵—2维数组—由行和列构成的数据3维度张量—三个轴(axis)—3阶(Rank)—秩为3的数组*张量的维度为轴,轴的个数为阶,numpy中也叫秩
处理流程-选取数据选取数据:张量-tensor750x7502维度张量黑白照片(750,750)750x7503维度张量彩色照片(750,750,3)750x7504维度张量15秒(4500帧视频)(4500,750,750,3)
处理流程-线性回归线性回归模型:简单线性回归也称为一元线性回归,也就是回归模型中只含一个自变量,否则称为多重线性回归。简单线性回归模型为:y=a*x+b有时候也可这样表述y=weight*x+bias,其中weight-权重,bias-偏置值。我们需要根据给定的y-企业的收入和x-企业的广告收入,去预测w和b,最终得到一个一元线性方程,通过这个方程,可以预测出企业投入的广告资金大概可以获得多大的收益,
处理流程-选取数据选取数据:通过对数据现相关性的分析,我们够可以从数据集中取出“wechat”微型的数据作为X,“sales”作为y建立一个线性模型并训练模型。使用narray转为张量
处理流程-拆分数据集数据集:训练集-----------学生的课本;学生根据课本里的内容来掌握知识。验证集------------作业,通过作业可以知道不同学生学习情况、进步的速度快慢。测试集-----------考试,考的题是平常都没有见过,考察学生举一反三的能力
处理流程-数据归一化数据归一化:在机器学习中,为何要经常对数据做归一化,归一化后加快了梯度下降求最优解的速度。归一化有可能提高精度。我们在这里使用线性归一化。
处理流程-数据归一化数据归一化:min-max标准化(Min-MaxNormalization)归一化也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0-1]之间。转换函数如下:
处理流程-数据归一化数据归一化:min-max标准化(Min-MaxNormalization)归一化也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0-1]之间。转换函数如下:
敬请指导!
您可能关注的文档
- 《机器学习项目案例开发》课件 1.1人工智能概述.pptx
- 《机器学习项目案例开发》课件 2.1使用多元线性回归预测广告收入-数据分析.pptx
- 《机器学习项目案例开发》课件 3.1项目3:使用scikit-learn预测广告收入.pptx
- 《机器学习项目案例开发》课件 6.1机器学习分类.pptx
- 《机器学习项目案例开发》课件 6.2逻辑回归-判定边界 - 心脏病.pptx
- 《机器学习项目案例开发》课件 6.2逻辑回归-判定边界.pptx
- 《机器学习项目案例开发》课件 8.1聚类-KMeans.pptx
- 《机器学习项目案例开发》课件 8.2聚类-DBSCAN.pptx
- 《机器学习项目案例开发》课件 9.1决策树算法-基础.pptx
- 《机器学习项目案例开发》课件 9.2决策树-构造.pptx
最近下载
- 2024官方兽医考试更新题库及答案.doc
- 八年级数学平方差公式20题(含答案).doc
- 市政工程分部分项划分表(全套)最新版.docx
- (中职)Access数据库应用技术教案课题: 任务6 创建操作查询.docx
- 通达信筹码峰左右画线主图通达信指标公式源码.docx
- 《GBT 24421.2-2023服务业组织标准化工作指南 第2部分:标准体系构建》最新解读.pptx
- GB 55009-2021 燃气工程项目规范.pdf
- 法医临床学试题.docx VIP
- 河北对口单招第十类职业适应性测试(计算机)-第一章计算机基础知识课件ppt.pptx VIP
- 九年级语文下册 第8课《假如我有九条命》课件 上海五四制版.ppt VIP
文档评论(0)