Hadoop学习笔记

  1. Hadoop概念

hadoop下载文件到本地并查看_HDFS

1.思想之源

hadoop下载文件到本地并查看_hadoop_02

 

 

  1. HDFS分布式存储

2.1 HDFS概念

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_03

2.2 HDFS优点

hadoop下载文件到本地并查看_xml_04

  1. HDFS缺点

hadoop下载文件到本地并查看_hadoop_05

 

 

  1. HDFS架构

hadoop下载文件到本地并查看_hadoop_06

  1. HDFS存储单元(block)

hadoop下载文件到本地并查看_hadoop_07

 

 

 

  1. HDFS设计思想

hadoop下载文件到本地并查看_hadoop_08

 

  1. HDFS核心概念

1.NameNode概念

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_09

 

 

2.SecondaryNameNode概念

hadoop下载文件到本地并查看_zookeeper_10

3.SNN合并流程

hadoop下载文件到本地并查看_HDFS_11

 

 

4.DataNode概念

hadoop下载文件到本地并查看_xml_12

5.Block副本放置策略

hadoop下载文件到本地并查看_zookeeper_13

 

 

 

 

 

 

 

 

6.HDFS写流程

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_14

7.HDFS读写权限

hadoop下载文件到本地并查看_zookeeper_15

 

 

8.安全模式

hadoop下载文件到本地并查看_zookeeper_16

 

 

2.8下载Hadoop

地址       http://hadoop.apache.org/

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_17

官方文档

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_18

 

 

2.9搭建完全分布式HDFS

前提:安装jdk,下载hodoop

1.计划服务器搭建(共四台)

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_19

 

2.计划搭建流程

hadoop下载文件到本地并查看_xml_20

 

 

3.配置yum源(可选)

hadoop下载文件到本地并查看_zookeeper_21

hadoop下载文件到本地并查看_hadoop_22

hadoop下载文件到本地并查看_hadoop_23

4.安装ntpdate时间同步

 

四台都要执行安装

hadoop下载文件到本地并查看_hadoop_24

 

 

5.设置ntpdate服务器

hadoop下载文件到本地并查看_hadoop_25

后面url可在网上搜到

(关闭防火墙)

6.设置免密登录

hadoop下载文件到本地并查看_xml_26

查看私钥文件和公钥文件

hadoop下载文件到本地并查看_zookeeper_27

hadoop下载文件到本地并查看_zookeeper_28

 

 

让node2-node4都进行免密登录

hadoop下载文件到本地并查看_HDFS_29

hadoop下载文件到本地并查看_zookeeper_30

node3,node4也是一样的操作

 

 

7.安装jdk

上传jdk和hadoop

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_31

把安装版传到node2,node3,node4

hadoop下载文件到本地并查看_HDFS_32

执行安装

hadoop下载文件到本地并查看_hadoop_33

修改etc/profile文件,配置环境变量

hadoop下载文件到本地并查看_xml_34

注意:四台都需要有该环境

 

 

8.安装Hadoop

hadoop下载文件到本地并查看_hadoop_35

-c  /home

hadoop下载文件到本地并查看_hadoop_36

修改etc/profile

hadoop下载文件到本地并查看_xml_37

刷新profile文件

hadoop下载文件到本地并查看_HDFS_38

 

 

修改hadoop里面的etc

hadoop下载文件到本地并查看_xml_39

hadoop下载文件到本地并查看_HDFS_40

hadoop下载文件到本地并查看_hadoop_41

hadoop下载文件到本地并查看_HDFS_42

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_43

hadoop下载文件到本地并查看_zookeeper_44

hadoop下载文件到本地并查看_xml_45

hadoop下载文件到本地并查看_hadoop_46

hadoop下载文件到本地并查看_xml_47

hadoop下载文件到本地并查看_xml_48

删除文档

hadoop下载文件到本地并查看_hadoop_49

同步node

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_50

scp –r hadoop-2.5.1/  node3:/home

 

 

9.格式化节点

hadoop下载文件到本地并查看_xml_51

 

10.启动HDFS

hadoop下载文件到本地并查看_zookeeper_52

访问Hadoop,node1需要在host中配置,直接加端口访问即可:50070

hadoop下载文件到本地并查看_zookeeper_53

 

 

11.查看节点

hadoop下载文件到本地并查看_xml_54

12.查看是否有DataNode

hadoop下载文件到本地并查看_HDFS_55

hadoop下载文件到本地并查看_HDFS_56

显示这个环境搭建成功!

 

3.0 HDFS的shell命令

mkdir 

创建目录

ls

查看当前路径下的hdfs文件目录

put

上传文件

get

下载文件

rm –f

删除文件

 

3.1 安装Eclipse插件

hadoop下载文件到本地并查看_xml_57

放到该目录下

hadoop下载文件到本地并查看_xml_58

重启eclipse,暂不支持版本高的eclipse

3.2 eclipse操作

hadoop下载文件到本地并查看_zookeeper_59

创建连接

hadoop下载文件到本地并查看_hadoop_60

修改hosts

hadoop下载文件到本地并查看_xml_61

hadoop下载文件到本地并查看_xml_62

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_63

改用户名

hadoop下载文件到本地并查看_xml_64

3.3 项目的创建

hadoop下载文件到本地并查看_HDFS_65

导入jar包

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_66

还有commons

3.4 eclipse代码操作

粘贴配置文件

hadoop下载文件到本地并查看_xml_67

hadoop下载文件到本地并查看_zookeeper_68

 

hadoop下载文件到本地并查看_zookeeper_69

 

 

 

  1. 创建目录

hadoop下载文件到本地并查看_zookeeper_70

  1. 上传文件

hadoop下载文件到本地并查看_zookeeper_71

  1. 查看文件

hadoop下载文件到本地并查看_zookeeper_72

  1. 上传文件(音频、文档)

hadoop下载文件到本地并查看_HDFS_73

 

 

  1. 下载文件

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_74

 

 

3.5 HDFS 2.x Federation

1.概念

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_75

Federation中文:联邦

具体图示:

hadoop下载文件到本地并查看_xml_76

 

hadoop下载文件到本地并查看_zookeeper_77

 

2.搭建环境

hadoop下载文件到本地并查看_zookeeper_78

图片上配置了两组

 

 

  1. HA

hadoop下载文件到本地并查看_zookeeper_79

 

  1. HDFS-HA
  2. 部署ha流程
  3. 安装配置zookeeper

hadoop下载文件到本地并查看_xml_80

 

  1. 配置hdfs-site.xml

hadoop下载文件到本地并查看_hadoop_81

 

 

  1. 配置http请求地址

hadoop下载文件到本地并查看_HDFS_82

 

  1. 配置journal集群

hadoop下载文件到本地并查看_HDFS_83

 

  1. 配置故障器

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_84

 

 

  1. 配置免密钥

hadoop下载文件到本地并查看_HDFS_85

 

  1. 修改core-site.xml

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_86

 

 

  1. 部署ha
  2. 具体流程图

hadoop下载文件到本地并查看_hadoop_87

hadoop下载文件到本地并查看_hadoop_88

hadoop下载文件到本地并查看_hadoop_89

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_90

  1. 做免密钥

hadoop下载文件到本地并查看_xml_91

全部执行下该命令

hadoop下载文件到本地并查看_hadoop_92

测试

hadoop下载文件到本地并查看_xml_93

 

 

 

  1. 修改配置文件
  2. 删除masters

hadoop下载文件到本地并查看_zookeeper_94

其他几台也一样

  1. 删除hadoop

hadoop下载文件到本地并查看_xml_95

 

  1. 修改hdfs-site.xml

hadoop下载文件到本地并查看_xml_96

hadoop下载文件到本地并查看_hadoop_97

  1. 修改core-site.xml

hadoop下载文件到本地并查看_xml_98

  1. 安装zookeeper
  2. 解压zookeeper

hadoop下载文件到本地并查看_hadoop_99

 

  1. 修改profile文件

hadoop下载文件到本地并查看_hadoop_100

 

  1. 修改zoo.cfg

hadoop下载文件到本地并查看_HDFS_101

 

hadoop下载文件到本地并查看_zookeeper_102

 

 

 

  1. 创建zookeeper目录

hadoop下载文件到本地并查看_hadoop_103

 

  1. 创建myid文件

(在node1)写个1

 

  1. 同步

hadoop下载文件到本地并查看_HDFS_104

 

hadoop下载文件到本地并查看_HDFS_105

Copy目录,拷贝到node2,3

 

  1. 创建myid

在node2,node3中的opt文件中创建zookeeper,里面创建myid文件,写上2和3

 

  1. 启动zookeeper

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_106

 

 

 

 

 

 

  1. 配置hdfs-site.xml

hadoop下载文件到本地并查看_hadoop_107

 

  1. 配置core-site.xml

hadoop下载文件到本地并查看_zookeeper_108

 

  1. 同步配置文件

hadoop下载文件到本地并查看_HDFS_109

 

  1. 启动journalnode

hadoop下载文件到本地并查看_xml_110

在3和4也启动下

hadoop下载文件到本地并查看_zookeeper_111

在四里面也配置下前两个

hadoop下载文件到本地并查看_HDFS_112

 

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_113

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_114

hadoop下载文件到本地并查看_xml_115

hadoop下载文件到本地并查看_HDFS_116

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_117

 

 

  1. MapReduce分布式计算
  2. 概念

hadoop下载文件到本地并查看_zookeeper_118

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_119

 

例子—统计文本文件

hadoop下载文件到本地并查看_hadoop下载文件到本地并查看_120

 

 

  1. MapReduce的Split大小

hadoop下载文件到本地并查看_hadoop_121

 

  1. Mapper

hadoop下载文件到本地并查看_HDFS_122

 

hadoop下载文件到本地并查看_xml_123

  1. Reducer

hadoop下载文件到本地并查看_HDFS_124

hadoop下载文件到本地并查看_zookeeper_125

 

  1. Shuffler

hadoop下载文件到本地并查看_zookeeper_126

hadoop下载文件到本地并查看_zookeeper_127

 

hadoop下载文件到本地并查看_hadoop_128