目录 1 HDFS前言2 HDFS的概念和特性3 HDFS的shell(命令行客户端)操作3.1 HDFS命令行客户端使用 3.2 命令行客户端支持的命令参数3.2 常用命令参数介绍4 HDFS的工作机制4.1 概述4.2 HDFS写数据流程4.2.1 概述4.2.2 详细步骤图4.2.3 详细步骤解析4.3 HDFS读数据流程4.3.1 概述4.3.2 详细步骤图4
目录一、节点部署角色目录二、下载软件三、基础设施1、安装必要插件2、设置IP及主机名3、时间同步4、jdk安装5、ssh免密登录四、Hadoop部署1、目录及环境变量准备2、安装3、修改配置文件4、分发文件5、启动hadoop集群6、集群部署验证 一、节点部署角色目录节点ipNNSNNDNRMNMHSnode1192.168.88.11√√node2192.168.88.12√√√√node31
系统盘里带着那个啊具体步骤。。1运行GHOST,进入GHOST主页面 2在主页面单击OK按钮后依次执行Local\Partition\To lmage,命令 3接下来选择硬盘.用户装了几个硬盘,则此处就会出现几个选项. 4接下来,选择硬盘中的分区.选择需要的分区后,单击OK进入下一个步骤 5选择存放的地址和文件名,添好后蛋击Save按钮 6接着询问用户是否压缩镜像文件有三个选项分别是NO,Fast
转载 2024-03-20 12:16:32
154阅读
Kafka一、Kafka是什么         Kafka是一种高吞吐量的分布式发布--订阅消息系统。它可以处理消费者规模的网站中的所有动作流数据。这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。对于像Hadoop的一
序言      使用HDFS的主要目的,是为了解决大批量的数据运算。因为很多计算框架都是基于HDFS的cuiyaonan2000@163.com。本次的hadoop为最新的稳定版本hadoop-3.3.0.tar.gz。简介Hadoop分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distribut
在vscode中,安装xml-tools后按Cltr-Alt-L可以格式化xmlRUN apt install openjdk-8* -y,jdk路径为export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"获取某个容器的ipimport jsonimport osfrom pathlib import Pathif __name_...
原创 2021-08-04 10:42:51
207阅读
① 安装前提安装Jupyter Notebook的前提:需要安装了Python(3.3版本及以上,或2.7版本)② 使用Anaconda安装如果你是小白, 那么建议你通过安装Anaconda 来解决Jupyter Notebook的安装问题, 因为Anaconda已经自动 为你安装了Jupter Notebook及其他工具, 还有python中超过180个科学包及其依赖项。③ 使用pip命令安装如
前言HDFS作为一套成熟的分布式文件系统,其...
转载 2020-01-12 19:09:00
148阅读
2评论
前言HDFS作为一套成熟的分布式文件系统,其...
转载 2020-01-12 19:09:00
91阅读
2评论
hdfs oiv -p XML -i /var/bigdata/hadoop/full/dfs/name/current/fsimage_0000000000000023560 -o ~/output.xml
原创 2021-07-29 15:08:26
747阅读
hdfs oiv -p XML -i /var/bigdata/hadoop/full/dfs/name/current/fsimage_0000000000000023560 -o ~/output.xml
原创 2022-01-19 10:00:18
101阅读
#!/bin/bashexport JAVA_HOME=/data/jdk1.8.0_111export HADOOP_HOME=/data/hadoop-2.6.5export PATH=${JAVA_HOME}/bin:${HADO
原创 2022-10-28 11:59:43
156阅读
1. HDFS Federation产生背景在Hadoop 1.0中,HDFS的单NameNode设计带来诸多问题,包括单点故障、内存受限制约集群扩展性和缺乏隔离机制(不同业务使用同一个NameNode导致业务相互影响)等,为了解决这些问题,Hadoop 2.0引入了基于共享存储的HA解决方案和HDFS Federation,本文重点介绍HDFS Federation。HDFS Fede
转载 2024-05-14 07:04:52
49阅读
1. df的介绍和使用df 以磁盘分区为单位查看文件系统,可以获取硬盘被占用了多少空间,目前还剩下多少空间等信息。例如,我们使用df -h命令来查看磁盘信息, -h 选项为根据大小适当显示:1.1显示内容参数说明Filesystem:文件系统Size: 分区大小Used: 已使用容量Avail: 还可以使用的容量Use%: 已用百分比Mounted on: 挂载点1.2常用的一些命令使用df -h
转载 2024-03-26 08:24:46
72阅读
ls命令 格式: hdfs dfs -ls 文件路径 作用:显示文件列表 例如:hdfs dfs -ls /lsr命令 格式:hdfs dfs -lsr URI 作用:在整个目录下递归执行ls, 与linux中ls -R类似 例如:hdfs dfs -lsr / (ps:使用此命令会提示,此有一个提示更换命令,是因为该命令已过时,可使用 -ls -R替换-lsr)mkdir命令 格式:hdfs d
转载 2024-03-15 08:44:19
153阅读
hadoop的两大核心之一         海量数据的存储(HDFS)什么是HDFS? hadoop distributed file system(hadoop分布式文件系统) 是一种允许文件通过网络在多台主机上分享的文件系统, 可让多机器上的多用户分享文件和存储空间. 特点: 1.通透性.让实际上是通过网络来访问
转载 2024-03-11 13:19:27
69阅读
1. 问题描述:2. 问题分析:云主机连接不上本地IP解析错误云主机工作处于安全模式3. 解决方式:更改云主机名更改本地 hosts 文件使用 linux 命令强制退出安全模式Step 1) 下载 HDFS Explorer 软件安装包:百度云连接:https://pan.baidu.com/s/1tlJWHusCdeGRlhQsFrmMpA(提取码:f3ql)Step 2) 下载后,双击 HDF
转载 2024-03-22 09:38:47
231阅读
目录:HDFS简介HDFS架构说明HDFS读文件流程HDFS写文件流程HDFS 可靠性HDFS shellIDEA 开发工具使用Java 操作HDFS全分布式集群搭建一.简介HDFS(Hadoop Distributed File System,分布式文件系统)基于Ggoogel发布的GFS论文设计开发,其除具备其他分布式文件系统相同特性外,还有自己的特性:高容错:认为硬件总是不可靠的,有副本的存
转载 2024-04-29 21:47:24
55阅读
一、导入新课带领学生回顾项目三Hadoop集群相关的知识,由于Hadoop的核心是HDFS和MapReduce。其中,HDFS是解决海量大数据文件存储的问题,是目前应用最广泛的分布式文件系统。因此,本次课将针对HDFS分布式文件系统进行详细讲解 二、新课讲解(一)HFDS的演变HDFS 源于 Google 在2003年10月份发表的GFS(Google File System)论文,接下
转载 2024-02-18 15:59:26
71阅读
该系列总览: Hadoop3.1.1架构体系——设计原理阐述与Client源码图文详解 : 总览在HDFS中,有三种Recovery 1.Lease Recovery 2.Block Recovery 3.PipeLine Recovery以下将 一 一 讲解。一.Lease Recovery首先很有比要介绍一下Lease(租约)租约保证HDFS的一读多写机
转载 2024-04-26 11:51:12
115阅读
  • 1
  • 2
  • 3
  • 4
  • 5