在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
问题导读 一、目的 在这篇文章中,我们将讨论Hadoop 2.x与Hadoop 3.x之间的比较。 Hadoop3版本中添加了哪些新功能,Hadoop3中兼容的Hadoop 2程序,Hadoop 2和Hadoop 3有什么区别? 二、Hadoop 2.x与Hadoop 3.x比较 本节将讲述Hadoop 2.x与Hadoop 3.x之间的22个差异。 现在让我们逐一讨论 2.1License Hadoop 2.x - Apache 2.0,开源 2.2支持的最低Java版本 Hadoop 2.x - java的最低支持版本是java 7 2.3容错 Hadoop 2.x - 可以通过复制(浪费空间)来处理容错。 2.4数据平衡 Hadoop 2.x - 对于数据平衡使用HDFS平衡器。 2.5存储Scheme Hadoop 2.x - 使用3X副本Scheme 2.6存储开销 Hadoop 2.x - HDFS在存储空间中有200%的开销。 2.7存储开销示例 Hadoop 2.x - 如果有6个块,那么由于副本方案(Scheme),将有18个块占用空间。 2.8YARN时间线服务 Hadoop 2.x - 使用具有可伸缩性问题的旧时间轴服务。 2.9默认端口范围 Hadoop 2.x - 在Hadoop 2.0中,一些默认端口是Linux临时端口范围。所以在启动时,他们将无法绑定。 2.10工具 Hadoop 2.x - 使用Hive,pig,Tez,Hama,Giraph和其他Hadoop工具。 2.11兼容的文件系统 Hadoop 2.x - HDFS(默认FS),FTP文件系统:它将所有数据存储在可远程访问的FTP服务器上。 Amazon S3(简单存储服务)文件系统Windows Azure存储Blob(WASB)文件系统。 2.12Datanode资源 Hadoop 2.x - Datanode资源不专用于MapReduce,我们可以将它用于其他应用程序。 2.13MR API兼容性 Hadoop 2.x - 与Hadoop 1.x程序兼容的MR API,可在Hadoop 2.X上执行 2.14支持Microsoft Windows Hadoop 2.x - 它可以部署在Windows上。 2.15插槽/容器 Hadoop 2.x - Hadoop 1适用于插槽的概念,但Hadoop 2.X适用于容器的概念。通过容器,我们可以运行通用任务。 2.16单点故障 Hadoop 2.x - 具有SPOF的功能,因此只要Namenode失败,它就会自动恢复。 2.17HDFS联盟 Hadoop 2.x - 在Hadoop 1.0中,只有一个NameNode来管理所有Namespace,但在Hadoop 2.0中,多个NameNode用于多个Namespace。 2.18可扩展性 Hadoop 2.x - 我们可以扩展到每个群集10,000个节点。 2.19更快地访问数据 Hadoop 2.x - 由于数据节点缓存,我们可以快速访问数据。 2.20HDFS快照 Hadoop 2.x - Hadoop 2增加了对快照的支持。 它为用户错误提供灾难恢复和保护。 2.21平台 Hadoop 2.x - 可以作为各种数据分析的平台,可以运行事件处理,流媒体和实时操作。 2.22群集资源管理 Hadoop 2.x - 对于群集资源管理,它使用YARN。 它提高了可扩展性,高可用性,多租户。 hadoop3.X比hadoop2.x的改进 Common主要改进: HDFS改进: Yarn改进: MapRduece改进: 其他新特性: 三、结论 正如我们已经讨论了Hadoop 2.x与Hadoop 3.x之间的22个重要差异和3.x的改进,现在我们可以看到Hadoop 2和Hadoop 3哪个更好。 总结 以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对极客世界的支持。如果你想了解更多相关内容请查看下面相关链接 |
请发表评论