hadoop查看block设置 hadoop查看空间命令

转载

mob6454cc673226 2024-05-27 17:16:04

文章标签 hadoop查看block设置 hadoop hdfs hive 文章分类 Hadoop 大数据

hdfs网页查看 localhost：9870

hadoop网页查看 localhost：50070

各种hadoop下载

hadoop查看block设置 hadoop查看空间命令_hadoop查看block设置

知识点预览

hadoop查看block设置 hadoop查看空间命令_hdfs_02

1、hadoop起源

红色字是nutch

Mapreduce 并行计算框架

YARN 为分布式程序提供资源

HDFS 分布式文件系统

hadoop查看block设置 hadoop查看空间命令_hdfs_03

hadoop查看block设置 hadoop查看空间命令_hadoop_04

hadoop狭义上指的就是hadoop这一个软件

hadoop广义上指代大数据生态圈，包括很多软件

hadoop查看block设置 hadoop查看空间命令_hadoop_05

hadoop查看block设置 hadoop查看空间命令_hadoop_06

hadoop查看block设置 hadoop查看空间命令_hdfs_07

hadoop查看block设置 hadoop查看空间命令_hadoop查看block设置_08

hdfs 文件系统，yarn计算分配空间

hadoop查看block设置 hadoop查看空间命令_hdfs_09

hadoop查看block设置 hadoop查看空间命令_hive_10

0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzUzNzM5NTQ4,size_16,color_FFFFFF,t_30)

hdfs 白话文理解

hadoop查看block设置 hadoop查看空间命令_hdfs_11

hadoop查看block设置 hadoop查看空间命令_hdfs_12

如果某一个block块宕机之后，namenode会控制与宕机处含有同意block块的datanode控制宕机处block的复制，从两个block块恢复成三个

hadoop查看block设置 hadoop查看空间命令_hive_13

hadoop查看block设置 hadoop查看空间命令_hadoop查看block设置_14

hadoop查看block设置 hadoop查看空间命令_hadoop查看block设置_15

Namenode

Datenode

SecondaryNamenode

hadoop查看block设置 hadoop查看空间命令_hive_16

hadoop查看block设置 hadoop查看空间命令_hdfs_17

hadoop查看block设置 hadoop查看空间命令_hdfs_18

hadoop查看block设置 hadoop查看空间命令_hadoop查看block设置_19

hadoop查看block设置 hadoop查看空间命令_hadoop查看block设置_20

hadoop查看block设置 hadoop查看空间命令_hadoop查看block设置_21

hadoop查看block设置 hadoop查看空间命令_hdfs_22

hadoop namenode -format 尽量不要重复使用，搭建集群使用一次即可

hadoop查看block设置 hadoop查看空间命令_hadoop查看block设置_23

hadoop查看block设置 hadoop查看空间命令_hadoop查看block设置_24

需要进入路径查看，日志文件路径

日志文件在hive-site.xml文件中

hadoop查看block设置 hadoop查看空间命令_hdfs_25

hadoop查看block设置 hadoop查看空间命令_hive_26

###############################开课吧hdfs编程之前#########################
###############################开课吧hdfs编程之后#########################

读取流程

hadoop查看block设置 hadoop查看空间命令_hadoop_27

hadoop查看block设置 hadoop查看空间命令_hive_28

hadoop查看block设置 hadoop查看空间命令_hdfs_29

数据完整性

hadoop查看block设置 hadoop查看空间命令_hdfs_30

查看datenode文件路径

hadoop查看block设置 hadoop查看空间命令_hdfs_31

hadoop查看block设置 hadoop查看空间命令_hdfs_32

hadoop查看block设置 hadoop查看空间命令_hive_33

写入流程

hadoop查看block设置 hadoop查看空间命令_hdfs_34

如何容错

hadoop查看block设置 hadoop查看空间命令_hadoop_35

hadoop查看block设置 hadoop查看空间命令_hive_36

hadoop查看block设置 hadoop查看空间命令_hive_37

读取流程

hadoop查看block设置 hadoop查看空间命令_hdfs_38

hadoop查看block设置 hadoop查看空间命令_hadoop_39

hadoop查看block设置 hadoop查看空间命令_hdfs_40

源码方式讲解读取，写入，容错流程

hadoop查看block设置 hadoop查看空间命令_hive_41

笔记有误，红色线是圈3，紫色线是5，没有6

hadoop查看block设置 hadoop查看空间命令_hadoop_42

1. namenode工作机制

（1）第一次启动namenode格式化后，创建fsimage和edits文件。如果不是第一次启动，
	       直接加载编辑日志和镜像文件到内存。
	
	   （2）客户端对元数据进行增删改的请求
	
	   （3）namenode记录操作日志，更新滚动日志。
	
	   （4）namenode在内存中对数据进行增删改查

2. Secondary NameNode工作

   	   （1）Secondary NameNode询问namenode是否需要checkpoint。直接带回namenode是否检查结果。

       （2）Secondary NameNode请求执行checkpoint。

       （3）namenode滚动正在写的edits日志

       （4）将滚动前的编辑日志和镜像文件拷贝到Secondary NameNode

       （5）Secondary NameNode加载编辑日志和镜像文件到内存，并合并。

       （6）生成新的镜像文件fsimage.chkpoint

       （7） 拷贝fsimage.chkpoint到namenode

       （8）namenode将fsimage.chkpoint重新命名成fsimage