机器学习期末复习题.pdf.docx

  1. 1、本文档共69页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

1

机器学习复习题

一、单选题

1.属于监督学习的机器学习算法是(A)

A.贝叶斯分类器

B.主成分分析

C.K-Means

D.高斯混合聚类

2.属于无监督学习的机器学习算法是(C)

A.支持向量机

B.Logistic回归

C.层次聚类

D.决策树

3.二项式分布的共轭分布是(C)

A.正态分布

B.Dirichlet分布

C.Beta分布

D.指数分布

4.多项式分布的共轭分布是(B)

A.正态分布

B.Dirichlet分布

C.Beta分布

D.指数分布

5.朴素贝叶斯分类器的特点是(C)

A.假设样本服从正态分布

B.假设样本服从多项式分布

C.假设样本各维属性独立

D.假设样本各维属性存在依赖

6.下列方法中没有考虑先验分布的是(D)

A.最大后验估计

B.贝叶斯分类器

C.贝叶斯学习

D.最大似然估计

7.对于正态密度的贝叶斯分类器,各类协方差矩阵相同时,决策函数为(A)

A.线性决策函数

B.非线性决策函数

C.最小距离分类器

D.以上都有可能

2

8.下列属于线性分类方法的是(B)

A.决策树

B.感知机

C.最近邻

D.集成学习

9.下列方法不受数据归一化影响的是(D)

A.SVM

B.神经网络

C.Logistic回归

D.决策树

10.下列分类方法中不会用到梯度下降法的是(C)

A.感知机

B.最小二乘分类器

C.最小距离分类器

D.Logistic回归

11.下列方法使用最大似然估计的是(C)

A.线性鉴别分析

B.感知机

C.Logistic回归

D.SVM

12.关于线性鉴别分析的描述最准确的是,找到一个投影方向,使得(B)

A.类内距离最大,类间距离最小

B.类内距离最小,类间距离最大

C.类内距离最大,类间距离最大

D.类内距离最小,类间距离最小

13.SVM的原理的简单描述,可概括为(C)

A.最小均方误差分类

B.最小距离分类

C.最大间隔分类

D.最近邻分类

14.SVM的算法性能取决于(D)

A.核函数的选择

B.核函数的参数

C.软间隔参数C

D.以上所有

15.支持向量机的对偶问题是(C)

3

A.线性优化问题

B.二次优化

C.凸二次优化

D.有约束的线性优化

16.以下对支持向量机中的支撑向量描述正确的是(C)

A.最大特征向量

B.最优投影向量

C.最大间隔支撑面上的向量

D.最速下降方向

17.假定你使用阶数为2的线性核SVM,将模型应用到实际数据集上后,其训练准确率和测试准确率均为100%。现在增加模型复杂度(增加核函数的阶),会发生以下哪种情况(A)

A.过拟合

B.欠拟合

C.什么都不会发生,因为模型准确率已经到达极限

D.以上都不对

18.避免直接的复杂非线性变换,采用线性手段实现非线性学习的方法是(A)A.核函数方法

B.集成学习

C.线性鉴别分析

D.Logistic回归

19.关于决策树节点划分指标描述正确的是(B)

A.类别非纯度越大越好

B.信息增益越大越好

C.信息增益率越小越好

D.基尼指数越大越好

20.以下描述中,属于决策树策略的是(D)

A.最优投影方向

B.梯度下降方法

C.最大特征值

D.最大信息增益

21.集成学习中基分类器的选择如何,学习效率通常越好(D)

A.分类器相似

B.都为线性分类器

C.都为非线性分类器

D.分类器多样,差异大

22.集成学习中,每个基分类器的正确率的最低要求(A)

4

A.50%以上

B.60%以上

C.70%以上

D.80%以上

23.下面属于Bagging方法的特点是(A)

A.构造训练集时采用Bootstraping的方式

B.每一轮训练时样本权重不同

C.分类器必须按顺序训练

D.预测结果时,分类器的比重不同

24.下面属于Boosting方法的特点是(D)

A.构造训练集时采用Bootstraping的方式

B.每一轮训练时样本权重相同

C.分类器可以并行训练

D.预测结果时,分类器的比重不同

25.随机森林方法属于(B)

A.梯度下降优化

B.Bagging方法

C.Boosting方法

D.线性分类

26.假定有一个数据集S,但该数据集有很多误差,采用软间隔SVM训练,阈

文档评论(0)

165720323137e88 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档