hadoop，storm和spark的区别，比较

如题所述

推荐答案 2017-09-23

一、hadoop、Storm该选哪一个？
为了区别hadoop和Storm，该部分将回答如下问题：
1.hadoop、Storm各是什么运算
2.Storm为什么被称之为流式计算系统
3.hadoop适合什么场景，什么情况下使用hadoop
4.什么是吞吐量

首先整体认识：Hadoop是级计算，进行计算时，数据在磁盘上，需要读写磁盘；Storm是内存级计算，数据直接通过网络导入内存。读写内存比读写磁盘速度快n个数量级。根据Harvard CS61课件，磁盘访问延迟约为内存访问延迟的75000倍。所以Storm更快。

注释：
1. 延时，指数据从产生到运算产生结果的时间，“快”应该主要指这个。
2. 吞吐，指系统单位时间处理的数据量。

storm的网络直传

温馨提示：答案为网友推荐，仅供参考

当前网址：http://77.wendadaohang.com/zd/Gqq8NWGIqNG3vG8YNpN.html

相似回答

Storm,Spark,Hadoop三个大数据处理工具的区别和联系答：Storm由java和clojure写成，storm的优点是全内存计算，因为内存寻址速度是硬盘的百万倍以上，所以storm的速度相比较hadoop非常快。hadoop是实现了mapreduce的思想，将数据切片计算来处理大量的离线数据数据。hadoop处理的数据必须是已经存放在hdfs上或者类似hbase的数据库中，所以hadoop实现的时候是通过移动计算到...

hadoop,storm和spark的区别,比较答：Hadoop和Spark均是大数据框架，都提供了一些执行常见大数据任务的工具，但确切地说，它们所执行的任务并不相同，彼此也并不排斥虽然在特定的情况下，Spark据称要比Hadoop快100倍，但它本身没有一个分布式存储系统而分布式存储是如今许多大数据项目的基础，它可以将 PB 级的数据集存储在几乎无限数量的普通...

Storm Spark Hadoop 这三个流行并行计算框架有什么不同答：Storm用于处理高速、大型数据流的分布式实时计算系统。为Hadoop添加了可靠的实时数据处理功能 Spark采用了内存计算。从多迭代批处理出发，允许将数据载入内存作反复查询，此外还融合数据仓库，流处理和图形计算等多种计算范式。Spark构建在HDFS上，能与Hadoop很好的结合。它的RDD是一个很大的特点。Hadoop当前大数...

大数据分析的框架有哪些,各自有什么特点答：2. Spark：Spark 在 Hadoop 的基础上进行了架构上的优化。与 Hadoop 主要使用硬盘存储数据不同，Spark 更倾向于使用内存来存储数据，这使得 Spark 在处理大数据时能够提供比 Hadoop 快100倍的速度。然而，由于内存中的数据在断电后会丢失，Spark 不适合处理需要长期存储的数据。3. Storm：Storm 是 ...

Storm与Spark,Hadoop相比是否有优势答：Storm优势就在于Storm是实时的连续性的分布式的计算框架,一旦运行起来,除非你将它杀掉,否则它一直处理计算或等待计算的状态.Spark和hadoop都做不到.当然它们各自都有其应用场景,各有各的优势.可以配合使用.下面我转一份别人的资料,讲的很清楚.Storm与Spark、Hadoop这三种框架，各有各的优点，每个框架都有...

大数据处理框架有哪些答：Spark是一个快速的大数据处理框架，它提供了内存计算的能力，可以处理大规模数据的实时计算和分析任务。与传统的Hadoop MapReduce相比，Spark在处理大数据时具有更高的效率和速度。Storm是一个分布式实时计算系统，适用于处理大数据流的应用场景。它可以实时地对数据进行处理和分析，并且具有良好的可扩展性和容错...

主流的数据分析平台构架有哪些?答：Storm是 Twitter 主推的分布式计算系统。它在Hadoop的基础上提供了实时运算的特性，可以实时的处理大数据流。不同于Hadoop和Spark，Storm不进行数据的收集和存储工作，它直接通过网络实时的接受数据并且实时的处理数据，然后直接通过网络实时的传回结果。4、Samza Samza 是由 Linked In 开源的一项技术，是一...

大家正在搜

spark与hadoop的优势 spark与hadoop的关系 hadoop和spark版本大数据spark和hadoop hadoop和spark应用场景 hadoop和hbase的关系 hadoop与nginx的区别 sparkhive与hadoop hadoopspark