- 1、本文档共24页,其中可免费阅读8页,需付费100金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 实现单一输出文件的MapReduce 编程模型研究
3.1引言
在Hadoop生态系统中El, MapReduce编程模型⑷和HDFS存储系统⑸
是整个生态系统的基础和核心。经典MapReduce编程模型⑹的执行流程可
描述为:一个map阶段和一个reduce阶段,其中map阶段由多个mapper实
现并行的mapping, reduce阶段由多个reducer实现并行的reducing,输出文
件数量与reducer 的数量相同。这种模型给Hadoop大数据应用带来的四个
主要问题:
probleml:编程模型不简洁⑺。通常情况下,应用需要的是单
文档评论(0)