发布网友
共1个回答
热心网友
-
目前言收费Hadoop版本主要三(均外厂商)别:Apache(原始版本所发行版均基于版本进行改进)、Cloudera版本(Cloudera’s
Distribution Including Apache Hadoop简称CDH)、Hortonworks版本(Hortonworks Data
Platform简称HDP)于内言绝数选择CDH版本CDHApache版本主要区别:
(1) CDHHadoop版本划非清晰两系列版本别cdh3cdh4别应第代Hadoop(Hadoop
1.0)第二代Hadoop(Hadoop 2.0)相比言Apache版本则混乱;比Apache
hadoop兼容性安全性稳定性增强
(2)CDH3版本基于Apache hadoop 0.20.2改进并融入新patchCDH4版本基于Apache hadoop
2.X改进,CDH总并应用新Bug修复或者FeaturePatch并比Apache
hadoop同功能版本提早发布更新速度比Apache官快
(3)安全 CDH支持Kerberos安全认证apache hadoop则使用简陋用户名匹配认证
(4)CDH文档清晰采用Apache版本用户都阅读CDH提供文档包括安装文档、升级文档等
(5)CDH支持Yum/Apt包Tar包RPM包Cloudera Manager四种式安装,Apache
hadoop支持Tar包安装
注:CDH使用推荐Yum/Apt包安装几处: 1、联网安装、升级非便 2、自载依赖软件包
3、Hadoop态系统包自匹配需要寻找与前Hadoop匹配HbaseFlumeHive等软件Yum/Apt根据前安装Hadoop版本自寻找匹配版本软件包并保证兼容性
4、自创建相关目录并软链合适(conflogs等目录);自创建hdfs,
mapred用户hdfs用户HDFS高权限用户mapred用户则负责maprece执行程相关目录权限