当前位置:
官方文档是最好的入门:***s://hadoop.apache.org/docs/r1.0.4/cn/mapred_tutorial.html 一、MapReduce 概述1.1 MapReduce 定义MapReduce 是一个 分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。
基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的方式并行处理上T级别的数据集。
MapReduce 核心功能是将 用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个 Hadoop …。