Hadoop中mapred包和mapreduce包的区别

如题所述

举报该问题

推荐答案 2016-04-08

å½ç»å¦ä¸ï¼
1. é¦åç¬¬ä¸æ¡ï¼ä¹æ¯å°èä»å¤©ç¢°å°è¿äºé®é¢çåå ï¼æ°æ§APIä¸å¼å®¹ãæä»¥ï¼ä»¥åç¨æ§APIåçhadoopç¨åºï¼å¦ææ§APIä¸å¯ç¨ä¹åéè¦éåï¼ä¹å°±æ¯ä¸é¢æçç¨åºéè¦éåï¼å¦ææ§APIä¸è½ç¨çè¯ï¼å¦æçä¸è½ç¨ï¼è¿ä¸ªæç¹å¿å°éæ¾ï¼

2. æ°çAPIå¾åäºä½¿ç¨æ½è±¡ç±»ï¼èä¸æ¯æ¥å£ï¼ä½¿ç¨æ½è±¡ç±»æ´å®¹ææ©å±ãä¾å¦ï¼æä»¬å¯ä»¥åä¸ä¸ªæ½è±¡ç±»ä¸æ·»å ä¸ä¸ªæ¹æ³(ç¨é»è®¤çå®ç°)èä¸ç¨ä¿®æ¹ç±»ä¹åçå®ç°æ¹æ³ãå æ¤ï¼å¨æ°çAPIä¸ï¼MapperåReduceræ¯æ½è±¡ç±»ã

3. æ°çAPIå¹¿æ³ä½¿ç¨context object(ä¸ä¸æå¯¹è±¡)ï¼å¹¶åè®¸ç¨æ·ä»£ç ä¸MapReduceç³»ç»è¿è¡éä¿¡ãä¾å¦ï¼å¨æ°çAPIä¸ï¼MapContextåºæ¬ä¸åå½çJobConfçOutputCollectoråReporterçè§è²ã

4. æ°çAPIåæ¶æ¯æ"æ¨"å"æ"å¼çè¿ä»£ãå¨è¿ä¸¤ä¸ªæ°èAPIä¸ï¼é®/å¼è®°å½å¯¹è¢«æ¨mapperä¸ï¼ä½é¤æ¤ä¹å¤ï¼æ°çAPIåè®¸æè®°å½ä»map()æ¹æ³ä¸æåºï¼è¿ä¹éç¨äºreducerãåæ¹å¤çè®°å½æ¯åºç¨"æ"å¼çä¸ä¸ªä¾åã

5.
æ°çAPIç»ä¸äºéç½®ãæ§çAPIæä¸ä¸ªç¹æ®çJobConfå¯¹è±¡ç¨äºä½ä¸éç½®ï¼è¿æ¯ä¸ä¸ªå¯¹äºHadoopéå¸¸çConfigurationå¯¹è±¡çæ©å±ã
å¨æ°çAPIä¸ï¼è¿ç§åºå«æ²¡æäºï¼æä»¥ä½ä¸éç½®éè¿Configurationæ¥å®æãä½ä¸æ§å¶çæ§è¡ç±Jobç±»æ¥è´è´£ï¼èä¸æ¯JobClientï¼å¹¶ä¸
JobConfåJobClientå¨æ°çAPIä¸å·²ç»è¡ç¶æ åãè¿å°±æ¯ä¸é¢æå°çï¼ä¸ºä»ä¹åªæå¨mapredä¸ææJobconfçåå ã

6. è¾åºæä»¶çå½åä¹ç¥æä¸åï¼mapçè¾åºå½åä¸ºpart-m-nnnnnï¼èreduceçè¾åºå½åä¸ºpart-r-nnnnnï¼è¿énnnnnæçæ¯ä»0å¼å§çé¨åç¼å·ã

è¿æ ·äºè§£äºäºèçåºå«å°±å¯ä»¥éè¿ç¨åºçå¼ç¨åæ¥å¤å«æ°æ§APIç¼åçç¨åºäºãå°èå»ºè®®æå¥½ç¨æ°çAPIç¼åhadoopç¨åºï¼ä»¥é²æ§çAPIè¢«æå¼ï¼

温馨提示：答案为网友推荐，仅供参考

当前网址：http://77.wendadaohang.com/zd/YGGqW8GYNvGqGY8pp3N.html

相似回答

Hadoop中mapred包和mapreduce包的区别答：新旧的区别，mapred包封装的不好，所以就是用mapreduce来代替mapred包了，不过只是一些面向开发者的接口被重新封装了，很多内部的类还是使用的mapred

Hadoop,MapReduce,YARN和Spark的区别与联系答：最终启动的map数目，就是切片的结果数目。具体来看一、如果使用是自定义的inputformat，那么启动多少个map，是由你实现的publicInputSplit[]getSplits(JobConfjob,intnumSplits)方法决定的，返回的切片有多少个就启动多少个map任务。二、如果是使用系统系统的TextInputFormat（或FileInputFormat）那么，一个...

Hadoop,MapReduce,YARN和Spark的区别与联系答：YARN是在Hadoop MapReduce基础上演化而来的，在MapReduce时代，很多人批评MapReduce不适合迭代计算和流失计算，于是出现了Spark和Storm等计算框架，而这些系统的开发者则在自己的网站上或者论文里与MapReduce对比，鼓吹自己的系统多么先进高效，而出现了YARN之后，则形势变得明朗：MapReduce只是运行在YARN之上的...

mapreduce,spark和yarn的区别是什么?答：拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。他们三个其实也可以说Hadoop发展的几个阶段，目前Spark非常火，是用Scala语言写的。

hadoop中的mapreduce是什么?答：MapReduce是Hadoop框架的核心组件之一，它是一种分布式计算模型，特别适合处理大规模数据集。MapReduce的名称来源于它的两个主要阶段：Map阶段和Reduce阶段。在Map阶段，框架将输入数据划分为若干个独立的小块，每块数据都由一个Map任务来处理。Map任务会输出一系列中间键值对。然后，在Reduce阶段，框架将所有...

mapreduce和hadoop的关系答：MapReduce是Hadoop生态系统中的分布式计算框架，用于处理大规模数据集。MapReduce将数据分成多个小块，将计算任务分配到多个节点上并行处理，最后将结果汇总输出。MapReduce框架可以自动管理任务的调度、容错、负载均衡等问题，使得Hadoop可以高效地运行大规模数据处理任务。MapReduce分布式计算框架原型：MapReduce...

Hadoop开源实现答：hadoop.mapred包中，用户需要实现接口类并管理节点通信，即可进行MapReduce计算。Hadoop的发音为[hædu:p]。最新发布的版本是2.0.2，Hadoop为开发者提供了强大而灵活的工具，支持Fedora、Ubuntu等Linux平台，广泛应用于数据分析领域，由Hortonworks公司负责后续开发工作，确保了项目的持续发展和创新。

大家正在搜

hadoop的mapreduce hdfs和mapreduce spark mapreduce 包单和包被的区别单包口和双包口的区别 java mapreduce mapreduce的五个阶段 hive mapreduce 袋和包的区别

Hadoop中mapred包和mapreduce包的区别与联...

Hadoop中mapred包和mapreduce包的区别

Hadoop中mapred包和mapreduce包的区别

简述Hadoop的MapReduce与Googl的MapRe...

hadoop和mapreduce是一种什么关系？

Hadoop中mapred包和mapreduce包的区别与联...

Hadoop中mapred包和mapreduce包的区别

MapReduce和hadoop什么关系和区别？？