南开大学《数据挖掘》在线作业5.pdfVIP

南开大学《数据挖掘》在线作业5.pdf

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

《数据挖掘》在线作业

()很费时,并且当数据集很大、缺失很多值时,该方法可能行不通。

A:人工填写缺失值方法

B:全局常量填充

C:自动填充

D:删除

参考选项:A

数据仓库和OLAP工具基于多维数据模型。该模型将数据看作()形式。

A:数据立方体(datacube)

B:整数

C:离散

D:不同

参考选项:A

DBSCAN在最坏情况下的时间复杂度是()。

A:O(m)

B:O(m2)

C:O(logm)

D:O(m*logm)

参考选项:B

()可以用来把数据变换到多个粒度层。例如,关于销售的数据挖掘模式除了在

单个分店挖掘之外,还可以针对指定的地区或国家挖掘。

A:概念分层

B:聚类

C:数据变换

D:数据归约

参考选项:A

以下属于可伸缩聚类算法的是()。

A:CURE

B:DENCLUE

C:CLIQUE

D:OPOSSUM

参考选项:A

只有非零值才重要的二元属性被称作()。

A:计数属性

B:离散属性

C:非对称的二元属性

D:对称属性

1

参考选项:C

()用替代的、较小的数据表示形式替换原数据。

A:维归约

B:数量归约

C:离散

D:聚集

参考选项:B

下列()不是将主观信息加入到模式发现任务中的方法。

A:与同一时期其他数据对比

B:可视化

C:基于模板的方法

D:主观兴趣度量

参考选项:A

()是KDD。

A:数据挖掘与知识发现

B:领域知识发现

C:文档知识发现

D:动态知识发现

参考选项:A

()通常以可变长度的字节串存储,并且为便于数据的引用,数据片段要相互链接

或建立多维方式的索引。

A:文本数据

B:多媒体数据

C:时间数据

D:空间数据

参考选项:B

设X={1,2,3}是频繁项集,则可由X产生()个关联规则。

A:4

B:5

C:6

D:7

参考选项:C

假定用于分析的数据包含属性age。数据元组中age的值如下(按递增

序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46

,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第

二个箱子值为()。

A:18.3

2

B:22.6

C:26.8

D:27.9

参考选项:A

有关数据仓库的开发特点,不正确的描述是()。

A:数据仓库开发要从数据出发

B:数据仓库使用的需求在开发出去就要明确

C:数据仓库的开发是一个不断循环的过程,是启发式的开发

D:在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据

仓库中数据分析和处理更灵活,且没有固定的模式

参考选项:A

决策树中不包含以下哪种结点?()

A:根结点(rootnode)

B:内部结点(internalnode)

C:外部结点(externalnode)

D:叶结点(leafnode)

参考选项:C

考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队

1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是

主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为()。

A:0.75

B:0.35

C:0.468

D:0.574

参考选项:C

()将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝

聚层次聚类技术。

A:MIN(单链)

B:MAX(全链)

C:组平均

D:Ward方法

参考选项:C

以下关于人工神经网络(ANN)的描述错误的有()。

A:神经网络对训练数据中的噪声非常鲁棒

B:可以处理冗余特征

C:训练ANN是一个很耗时的过程

D:至少含有一个隐藏层的多层神经网络

参考选项:A

3

聚类技术把()看做对象。

A:数据

B:数据库

C:簇

D:数据元组

参考选项:D

()是一种不使用目标变量(至少不明确使用)的数据挖掘。

A:无指导数据挖掘

B:有指导数

文档评论(0)

153****9248 + 关注
实名认证
文档贡献者

专注于中小学教案的个性定制:修改,审批等。本人已有6年教写相关工作经验,具有基本的教案定制,修改,审批等能力。可承接教案,读后感,检讨书,工作计划书等多方面的工作。欢迎大家咨询^

1亿VIP精品文档

相关文档