当前位置：Web开发网 » 操作系统 » linux系统 » 正文

hadoop和spark的区别？

2021年10月14日7720Web开发网百度已收录

Hadoop和Spark的区别解决问题的出发点不一样，Hadoop用普通硬件解决存储和计算问题。 Spark用于构建大型的、低延迟的数据分析应用程序，不实现存储。Spark是在借鉴了MapReduce之上发展而来的，继承了其分布式并行计算的优点并改进了MapReduce明显的缺陷。Spark中间数据放到内存中，迭代运算效率高。

Spark引进了弹性分布式数据集的抽象，数据对象既可以放在内存，也可以放在磁盘，容错性高，可用自动重建，RDD计算时可以通过CheckPoint来实现容错。

Hadoop只提供了Map和Reduce操作。而Spark更加通用，提供的数据集操作类型有很多种，主要分为： Transformations和Actions两大类。

上一篇: spark真的要取代hadoop了么，还有阿里的flink未来会是一种趋势么？

下一篇: 大数据Spark技术是否可以替代Hadoop？

Hadoop

文章来源：Web开发网，欢迎分享，转载请保留出处
原文地址：https://www.kaifa5.com/7047.html

阅读延展

学习大数据Hadoop需要哪些基础？

Hadoop学习与面试8000字，收藏这一篇就够了

用大白话告诉你小白都能看懂的Hadoop架构原理

hadoop到底是什么？

Hadoop 2.X以上版本提供了安全认证功能，建议开启Kerberos认证

hadoop是什么意思？与大数据有什么关系？

评论列表暂无评论

发表评论取消回复: 好顶踩