《大数据技术原理与应用》考试复习题库(含答案).docx

《大数据技术原理与应用》考试复习题库(含答案).docx

  1. 1、本文档共155页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《大数据技术原理与应用》考试复习题库(含答案) 一、单选题 1. 【单选】 关于表的说法不正确的是()? A、用户只可以用 JavaString 指定表的名称 B、HBase 的面向列的存储格式允许你存储很多细节到相同的表中,而在关系型 数据库模型中,将会被分成很多单独的表 C、在 HBase 中数据最终会存储在一张表或多张表中,使用表的主要原因是控制 表中的所有列以达到共享表内的某些特性的目的 D、用户可以用一个名称或已经存在的描述符(descriptor)创建一个表 答案: A 2. 【单选】 下列哪项不是对缺失值数据的处理方式? A、数据量少的时候,可采用人工的方式进行删除 B、用模型计算值来代替缺失值(回归、极大似然估计) C、根据数据的分布情况,可以采用均值、中位数、或者众数进行数据填充 D、如果样本数据较大,可直接删除缺失值对应的记录 答案: A 3. 【单选】 有关MapReduce 的输入输出,说法错误的是() A、把输入数据划分为分片,分片数目和大小任意定义 B、每个 reduce 需将它的输出写入自己的文件中,输出无需分片 C、想完全禁止输出,可以使用 NullOutputFormat D、链接多个 MapReduce 作业时,序列文件是首选格式 答案: A 4. 【单选】 关于API 建表的相关方法错误的是()? A、voidcreateTable(HTableDescriptordesc, byte[]startKey, byte[]endKey, i ntnumRegions) B、voidcreateTable(HTableDescriptordesc, byte[][]splitKeys) C、voidcreateTable(HTableDescriptordesc) D、voidcreateTableAsync(HTableDescriptordesc) 答案: D 5. 【单选】 以下关于Hadoop 说法正确的是() A、Hadoop 支持数据的随机读写 B、因为HDFS 中采用了备份的机制,所以不存在单点故障 C、Hadoop默认调度器策略为 FIFO D、NameNode 负责管理 metadata,client 端每次读写请求, NameNode 都需要从 磁盘中读取或者写入metadata 信息 答案: C 6. 【单选】 关于 HDFSShelI 操作不正确的是() A、hadoopfs-moveFromLocal/a.txt/aaa/从本地剪切粘贴到 hdfs B、hadoopfs-appendToFile./hello.txthdfs://hello.txt 追加一个文件到已经 存在的文件末尾 C、hadoopfs-tail/weblog/access log.1显示一个文件的末尾 D、hadoopfs-mv/aaa/jdk.tar.gz/将 hdfs 目录中的文件移动到本地文件夹中 答案: D 7. 【单选】 下面选项中哪两个进程是分别负责管理HDFS 数据存储和备份元数据信息的?() A、NameNode、DataNode B、NameNode、Jobtracker C、Datanode, SecondaryNameNode D、NameNode、SecondaryNameNode 答案: D 8. 【单选】 关于HDFSAPI的说法不正确的是() A、Configuration 提供了对配置参数的访问 B、FileSystem基于configuration 创建FileSystem 对象,为了调用FileSyst em里面的相关方法对应具体的操作 C、Path在 FileSystem 中仅提供文件的路径 D、FSDatalnputStream 和 FSDataOutputStream 这两个分别是 HDFS 中的输入和 输出流 答案:C 9. 【单选】 关于ResultScanner类说法错误的是()? A、当用户扫描到尾或到终止行时,由于没有足够的行来填充数据,返回的结果 数组可能会小于既定长度 B、ResultScanner 把扫描操作转换为类似的 get操作,它将每一行数据封装成 一个 Result 实例,并将所有的Result 实例放入一个迭代器中 C、扫描操作通过一次RPC 请求返回所有匹配的行 D、调用close() 方法释放所有由扫描控制的资源 答案:C 10. 【单选】 关于HDFS 的文件写入,正确的是() A、用户可以在文件任意位置进行修改 B、复制的文件块默认都存在同一机架上 C、支持多用户对同一文件的写操作 D、默认将文件块复制成三份存放 答案: D 11. 【单选】 下列关于Hama 的启动进程说法正确的是()

您可能关注的文档

文档评论(0)

文友资料 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档

相关课程推荐