# HDFS 端口配置指南
Hadoop 分布式文件系统(HDFS)是 Hadoop 生态系统的核心组成部分之一。为了使客户端能够连接到 HDFS,并进行文件的读取和写入,我们需要确保 Hadoop 的相关端口配置正常。以下是一个具体的流程,帮助你实现 Hadoop 端口 HDFS 配置。
## 流程步骤
| 步骤编号 | 操作          | 说明            
                
         
            
            
            
            本章思维导图:     本章大纲  1.1 HDFS产出背景及定义 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。1.2 HDFS定义 HDFS(Hadoop Distributed File System),它是一个文件系统            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-09-06 13:52:31
                            
                                33阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # Hadoop 如何查看 HDFS 端口
Hadoop 是一个分布式计算框架,用于处理大规模数据集的存储和计算。其中 HDFS(Hadoop Distributed File System)是 Hadoop 的一部分,用于存储数据。在 Hadoop 集群中,HDFS 通过网络端口进行通信。本文将介绍如何查看 HDFS 的端口,并提供示例代码来解决这个具体问题。
## 问题描述
我们需要查看            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-08-15 09:17:23
                            
                                3791阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            目录一、HDFS集群一键启停脚本1. HDFS集群的一键启动脚本2. HDFS集群的一键关闭脚本二、单进程启停1. hadoop-daemon.sh脚本2. hdfs脚本三、总结1. 一键启停脚本2. 独立进程启停一、HDFS集群一键启停脚本        Hadoop HDFS组件内置了HDFS集群的一键启停脚本。1            
                
         
            
            
            
            ## 项目方案:Hadoop HDFS端口的查看
### 1. 项目简介
本项目旨在提供一种便捷的方式,通过Hadoop命令行工具查看HDFS的端口信息。通过该方案,用户可以快速了解目标HDFS集群的端口使用情况,从而更好地进行调优和故障排查。
### 2. 技术栈
- Hadoop
- Shell脚本
### 3. 方案实施步骤
#### 3.1 安装配置Hadoop集群
首先,需            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-09-03 08:42:36
                            
                                541阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            有多种接口可以访问HDFS,其中命令行接口是最简单,也是程序员最熟悉的方式。 
 
  
  在本例中,将采用pseusodistributed mode的HDFS,用一台机器来模拟分布式的文件系统。pseudodistributed mode的配置参见: 
  
 
  这里再重新说一下两处配置的含义: 
 
  core-site.xml里: 
 <property>
    &l            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-11 19:25:09
                            
                                75阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            完整搭建步骤参考大神链接:以下是我自己的总结的注意事项:1.如果集群的防火墙是开着的一定要将master节点的端口8031和9000和50070端口开放出来,前两个是集群需要的后面一个是访问Hadoop页面需要的firewall-cmd --zone=public --add-port=50070/tcp --permanent
 firewall-cmd --zone=public --add-            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-25 13:43:13
                            
                                91阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、补充(面试常问):1.常用端口号Hadoop3.x:HDFS NameNode 内部常用端口号(对内):8020/9000/9820HDFS NameNode 对用户的查询端口(对外):9870Yarn查看任务运行情况的端口:8088历史服务器端口:19888 Hadoop2.xHDFS NameNode 内部常用端口号(对内):8020/9000HDFS NameNode 对用户的查询端口(            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-11 10:35:55
                            
                                448阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            我们的高可用集群部署完成以后,不同的进程会监听不同的端口,下面我们就来详细介绍下端口            
                
         
            
            
            
            把原先搭建的集群环境给删除了,自己重新搭建了一次,将笔记整理在这里,方便自己以后查看第一步:安装主节点spark1第一个节点:centos虚拟机安装,全名spark1,用户名hadoop,密码123456 ,虚拟机名称spark1第二步:配置yum源需经常使用yum安装软件,使用国内网易源速度更快[root@localhost ~]# mv /etc/yum.repos.d/CentOS-Base            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-19 09:53:19
                            
                                127阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            hdfs常用命令:第一部分:hdfs文件系统命令第一类:文件路径增删改查系列:hdfs dfs -mkdir dir  创建文件夹hdfs dfs -rmr dir  删除文件夹dirhdfs dfs -ls  查看目录文件信息hdfs dfs -lsr  递归查看文件目录信息hdfs dfs -stat path 返回指定路径的信息 第二类:空间            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-04 11:42:42
                            
                                370阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            这篇博客是笔者在CSDN里的第一篇博客,旨在希望在这个圈子能够得到更多的交流、更快的成长。 这篇博客就讲些比较基础的内容——常用HDFS的API操作。因为所有的API比较多,所以笔者便从中摘选出11个比较常用的API,希望能给读者一些帮助。因为Hadoop中关于文件操作类基本上都在“org.apache.hadoop.fs”包中,这些API的主要作用主要体现在以下操作上:打开文件、读写文件、删除文            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-01 08:28:43
                            
                                85阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            HDFS Java API 可以用于任何Java程序与HDFS交互,该API使我们能够从其他Java程序中利用到存储在HDFS中的数据,也能够使用其他非Hadoop的计算框架处理该数据
为了以编程方式与HDFS进行交互,首先需要得到当前配置文件系统的句柄,实例化一个Configuration对象,并获得一个Hadoop环境中的FileSystem句柄,它将指向当前环境的HDFS NameNode            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-01 08:26:09
                            
                                73阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            HDFS API详解org.apache.hadoop.fs"包中,这些API能够支持的操作包含:打开文件,读写文件,删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem,该类是个抽象类,只能通过来类的get方法得到具体类。get方法存在几个重载版本,常用的是这个: static FileSystem get(Configuration conf);              
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-23 23:39:36
                            
                                112阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Hadoop的配置详解   大家经过搭建单节点、伪分布、完全分布模式的集群环境,基本上会用到以下几个配置,core-site.xm/hdfs-site.xml/mapred-site.xml.   相信大家已经使用了其中的一些参数,下面我们来详细介绍一下各个配置中的参数,介绍的参数是大家可能用到的,当然还有很多没介绍到(学习hadoop不久,如果哪里错了,请            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-13 11:25:32
                            
                                145阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Hadoop 生态是一个庞大的、功能齐全的生态,但是围绕的还是名为 Hadoop 的分布式系统基础架构,其核心组件由四个部分组成,分别是:Common、HDFS、MapReduce 以及 YARN。
Common 是 Hadoop 架构的通用组件;
HDFS 是 Hadoop 的分布式文件存储系统;
MapReduce 是Hadoop 提供的一种编程模型,可用于大规模数据集的并行运算;
YARN            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-13 11:24:12
                            
                                108阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            配置文件hadoop的配置是由两种重要类型的配置文件进行驱动的:默认是只读的配置:core-default.xml, hdfs-default.xml, yarn-default.xml and mapred-default.xml。特殊节点配置:conf/core-site.xml, conf/hdfs-site.xml, conf/yarn-site.xml and conf/mapred-s            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-16 22:49:46
                            
                                136阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1、搭建hdfs分布式集群4.1 hdfs集群组成结构:4.2 安装hdfs集群的具体步骤:一、首先需要准备N台linux服务器学习阶段,用虚拟机即可!先准备4台虚拟机:1个namenode节点  + 3 个datanode 节点 二、先修改各台机器的主机名和ip地址主机名:hdp-01  对应的ip地址:192.168.33.61主机名:hdp-02  对            
                
         
            
            
            
            最近刚好又重新了解了一下hdfs的一些内容,想通过这篇内容总结和记录一下。Hadoop分布式文件系统HDFS配置及示例运行。 作者使用的是hadoop3.2.1的版本,以下示例都是以hadoop-3.2.1为基础目录进行介绍。1、文件配置首先,进入hadoop配置目录: ./etc/hadoop$ cd etc/hadoop/(1) 配置core-site.xml文件vi 进入编辑模式$ vi c            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-23 17:16:21
                            
                                243阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文章目录Hadoop三大组件之HDFS入门HDFS概述HDFS的shell操作(开发重点)基础语法部分常用命令实操上传下载HDFS的直接操作 Hadoop三大组件之HDFS入门众所周知,Hadoop有三大组件,HDFS、MapReduce、YARN。我的专栏是说大数据,那么数据总得需要存储吧,那么我们今天一起来看看这神秘的大数据有着怎样的身体,能够吸引这广大的学子来”看她“。HDFS概述存在即合            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-14 20:17:28
                            
                                95阅读
                            
                                                                             
                 
                
                                
                    