离线安装Cloudera Manager5.3.4与CDH5.3.4（二）

转载

mob604757069565 2015-12-15 16:27:00

文章标签 cloudera h5 hadoop mapreduce hive 文章分类 Java 后端开发

Cloudera Manager Server和Agent所有后发先至。也能够进行CDH5的安装和配置。
然后，主节点可以通过浏览器访问7180port测试（因为CM Server需要花时间来启动，可能要等待一会才干訪问），默认的username和password均为admin。

制作本地源

先下载CDH到本地http://archive-primary.cloudera.com/cdh5/parcels/5.3.4/，

这里须要下载三样东西。
首先是与自己系统版本号相相应的parcel包，然后是manifest.json文件。

CDH-5.2.0-1.cdh5.2.0.p0.12-el6.parcel、
CDH-5.2.0-1.cdh5.2.0.p0.12-el6.parcel.sha1、
manifest.json

下载完毕后。将这两个文件放到master节点的/opt/cloudera/parcel-repo下（文件夹在安装Cloudera Manager 5时已经生成），注意文件夹一个字都不能错。

[root@hadoop1 parcel-repo]# pwd
/opt/cloudera/parcel-repo
[root@hadoop1 parcel-repo]# ll
总用量 1533188
-rw-r-----. 1 root root 1569930781 6月  27 11:49 CDH-5.3.4-1.cdh5.3.4.p0.4-el6.parcel
-rw-r--r--. 1 root root         41 6月  27 11:49 CDH-5.3.4-1.cdh5.3.4.p0.4-el6.parcel.sha
-rw-r--r--. 1 root root      42475 6月  27 10:18 manifest.json

接下来打开manifest.json文件。里面是json格式的配置。我们须要的就是与我们系统版本号相相应的hash码。因为我们用的是Centos6.5，所以找到例如以下位置：
离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_hive

在这个大括号的最下面找到“hash”所相应的值。
离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_hadoop_02

将“hash”的值复制下来，然后，将CDH-5.2.0-1.cdh5.2.0.p0.12-el6.parcel.sha1文件名称改为CDH-5.2.0-1.cdh5.2.0.p0.12-el6.parcel.sha。将复制下来的hash值替换掉文本中的hash值，按理说应该是一致的。保存好了，这样。我们的本地源制作完毕了。
然后的操作就是控制台依照步骤安装就可以。

安装CDH

打开http://hadoop1:7180。登陆控制台，默认账户和password都是admin，安装时选择免费版，之后因为cm5对中文的支持非常强大，依照提示安装就可以，假设系统配置有什么问题在安装过程中会有提示，依据提示给系统安装组件就能够了。

登录界面

离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_cloudera_03

选取安装版本号

离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_mapreduce_04

指定安装主机

离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_h5_05

选取本地Parcel包

接下来，出现下面包名。说明本地Parcel包配置无误，直接点继续就能够了。
离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_cloudera_06

集群安装

离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_hive_07

检查主机正确性

接下来是server检查。可能会遇到下面问题：

Cloudera 建议将 /proc/sys/vm/swappiness 设置为 0。当前设置为 60。
使用 sysctl 命令在执行时更改该设置并编辑 /etc/sysctl.conf 以在重新启动后保存该设置。
您能够继续进行安装，但可能会遇到问题。Cloudera Manager 报告您的主机因为交换执行状况不佳。

下面主机受到影响： ···

在会受到影响的主机上执行echo 0 > /proc/sys/vm/swappiness命令就可以解决。

选择安装服务

离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_mapreduce_08

集群角色分配

普通情况下保持默认就能够了（Cloudera Manager会依据机器的配置自己主动进行配置，假设须要特殊调整，自行进行设置就能够了）。

集群数据库设置

离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_mapreduce_09

集群审查更改

假设没有其它需求保持默认配置。
离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_h5_10

最终到安装各个服务的地方了。
注意，这里安装Hive的时候可能会报错，因为我们使用了MySql作为hive的元数据存储。hive默认没有带mysql的驱动。通过下面命令拷贝一个就可以了：

cp /opt/cm-5.3.4/share/cmf/lib/mysql-connector-java-5.1.25-bin.jar 
/opt/cloudera/parcels/CDH-5.3.4-1.cdh5.3.4.p0.12/lib/hive/lib/

之后再继续安装就不会遇到问题了。

经过漫长的等待后，服务的安装完毕：
离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_hadoop_11

安装完毕后，就能够进入集群界面看一下集群的当前状况了。

离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_mapreduce_12

离线安装Cloudera Manager5.3.4与CDH5.3.4（二）_hive_13

測试

[root@hadoop1 /]# su hdfs
[hdfs@hadoop1 /]$ yarn jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar  pi 100 1000
Number of Maps  = 100
Samples per Map = 1000
Wrote input for Map #0
Wrote input for Map #1
Wrote input for Map #2
Wrote input for Map #3
Wrote input for Map #4
Wrote input for Map #5
Wrote input for Map #6
Wrote input for Map #7
Wrote input for Map #8
Wrote input for Map #9
Wrote input for Map #10

····

15/06/27 22:45:55 INFO mapreduce.Job:  map 100% reduce 0%
15/06/27 22:46:00 INFO mapreduce.Job:  map 100% reduce 100%
15/06/27 22:46:01 INFO mapreduce.Job: Job job_1435378145639_0001 completed successfully
15/06/27 22:46:01 INFO mapreduce.Job: Counters: 49
        Map-Reduce Framework
                Map input records=100
                Map output records=200
                Map output bytes=1800
                Map output materialized bytes=3400
                Input split bytes=14490
                Combine input records=0
                Combine output records=0
                Reduce input groups=2
                Reduce shuffle bytes=3400
                Reduce input records=200
                Reduce output records=0
                Spilled Records=400
                Shuffled Maps =100
                Failed Shuffles=0
                Merged Map outputs=100
                GC time elapsed (ms)=3791
                CPU time spent (ms)=134370
                Physical memory (bytes) snapshot=57824903168
                Virtual memory (bytes) snapshot=160584515584
                Total committed heap usage (bytes)=80012115968
        Shuffle Errors
                BAD_ID=0
                CONNECTION=0
                IO_ERROR=0
                WRONG_LENGTH=0
                WRONG_MAP=0
                WRONG_REDUCE=0
        File Input Format Counters
                Bytes Read=11800
        File Output Format Counters
                Bytes Written=97
Job Finished in 50.543 seconds
Estimated value of Pi is 3.14120000000000000000