Hadoop性能模型（6）

第三步：磁盘和内存中的文件全部合并。

排序阶段的消耗是：

3.3 Reduce和Write阶段模型

最终，用户定义的reduce函数被执行，输出结果写入HDFS。

reduce函数的输入依靠内存和磁盘上的shuffle文件（在shuffle和Sort阶段生成）。

整个Write阶段的消耗：

3.4 整个Reduce任务模型

上面的模型是单个reduce任务，整个单个reduce任务的消耗：

1,084次阅读

发表回复取消回复

要发表评论，您必须先登录。