机器学习与人工智能考试复习习题汇总.docxVIP

机器学习与人工智能考试复习习题汇总.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1.机器学习分为哪几类?

按照训练模型的算法、输入数据的类型、需要完成的任务或需要解决的问题,我们可以将机器学习分为有监督学习、半监督学习、无监督学习和强化学习四个大类。

2.强化学习关注什么样的问题?

强化学习关注一个软智能体在环境中采取什么样的行动以获得最大累积回报。

3.什么样的学习是端对端的学习?

深度学习与强化学习的结合,深度强化学习。

4.主成分分析中,协方差矩阵的本征值和本征向量有什么意义?

本征值是主成分Z1Z2…,Zm的方差,最大的特征值对应的主成分为第一主成分,一次类推。本征向量(l11l12…,l1m)正是特征值相应的特征向量。

5.一个深度卷积神经网络的隐层主要有哪些基本单元?

卷积层、池化层、全连接层、损失(代价)函数层等

6.过拟合和欠拟合分别指的是什么?

7.训练深度学习时,训练的停止点设在什么地方?

我们选择这个在验证集上损失的转折点作为训练的停止点。

8.残差网络中,如果恒等映射的输出通道数和残差层的输出通道数不一致该怎么办?

采用1x1的卷积取代捷径上的恒等映射,使其输出的通道数和残差层的输出通道数一致,还要保证两个通道的特征图的尺寸一致,只有这样才能进行两个通道的特征图按位求和。

9.怎样度量两个相同维度向量之间的线性相关性?

散点图分布在一条斜率大于0的直线上。

10.怎样度量分布p和分布q之间的距离?

11.随机梯度下降中随机性是怎样实现的?

训练集的尺寸小得多的数,比方说1到几百,即使训练集非常大,也是如此。

12.怎样画出Logistic回归的ROC曲线?

13.为什么能用ROC曲线下的面积作为评价二分类性能的一个指标?

ROC曲线下的面积通常被缩写为AUC,显然AUC1通常认为AUC越接近1,分类器越好。故ROC曲线下的面积也能作为二分类性能的一个指标。

14.模型训练过程中为什么要进行交叉验证?

具有良好的表现。

15.为什么模型的训练和测试要用独立的数据集?

具有良好的泛化能力。在训练集上表现非常好的模型可能在测试集上的性能不是很好,用独立同分布的数据集能更好的检验模型的泛化能力。

16.机器学习是一门什么样的学问?

机器学习是一门关于计算机针对特定的任务,根据“训练数据”学习预测或决策模型方面的学问。

17.对于有监督学习和无监督学习,二者输入的数据间有什么区别?

有监督学习中,训练数学模型时所采用的的数据包含了模型正确输出项,也叫标签,在建模时扮演了监督者的角色。无监督学习中,训练数学模型的输入数据中不包含输出项,也就是每一条输入数据都不带输出标签。

18.深度卷积神经网络是重要的深度学习方法,给网络输入数据,它能学到什么?

深度学习通过多处理层组成的计算机模型学习数据的多层抽象表征。通过反向传播算法,深度学习在大数据中发现错综复杂的结构,指示机器应该怎样调整它的内部参数,这些参数用来从上一层的表征计算出下一层的表征。表征学习是一套给机器注入原始数据,然后机器自动发现分类所需要的表征的学习方法。

19.第一主成分有什么意义?

20.模型训练过程中怎样进行交叉验证?

型的数据集是估计集,验证集不参加模型的训练,只用于模型的验证。一个合理的建议是将训练集的80%作为估计集,剩余的20%作为验证集。

*21.强化学习的思想是,在智能体得到反馈信号的同时将信用或责任分配到所采取的所有行动。

*22.机器学习是从已有知识中学习模型,用重现已有知识的能力来评价其性能的优劣;而数据挖掘的主要任务是从数据中发现未知知识。机器学习可以使有监督的,也可以是无监督的;而数据挖掘只能是无监督的。

*23.代价函数表征学习好的模型的预测值和真实值之间的差异。机器学习关注的是模型的泛化能力,也就是模型的预测能力,目标在于预测准确性;而最优化的目标是在训练集上获得代价函数的最小值。

1.有两组数据{x1x2,…xn}、{y1y2…,yn}对它们进行标准化处理。证明标准化处理后的两组数据的协方差就是将它两看成向量时这两个向量的内积。

2.给出应用Logistic回归进行数据二分类的主要步骤,并说明怎样生成画ROC曲线的数据。

有了决策值,改变阈值。就能够得到不同的灵敏度和特异度,进而画出ROC曲线。

3.给出准确度(Accuracy)、灵敏度(Sensitivity)、特异性(Specificity)、马修相关系数(MCC)的公式。

4.叙述主成分分析的主要步骤。

①数据标准化。将初始变量标准化,使每一变量的n个观察值均值为0,方差为1.写出协方差矩阵。

②数据矩阵的正交变换。对数据矩阵进行线性变换,Z=LX

文档评论(0)

bookst + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档