title: Java API访问HDFS集群(HA)date: 2021-06-23 17:06:11tags:HDFShadoopV2版本及以后都是HA架构,active namenode和standby namenode, 当前active namenode 出现问题之后,zkfc会切换standby namenode 为active 状态保证hadoop集群正常运行,所以java api需要通过配置HA的方式来访问hdfs集群对于namenode是HA高可用集群时,客户端远程.            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-02 09:51:49
                            
                                1449阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            title: Java API访问HDFS集群(HA)date: 2021-06-23 17:06:11tags:HDFShadoopV2版本及以后都是HA架构,active namenode和standby namenode, 当前active namenode 出现问题之后,zkfc会切换standby namenode 为active 状态保证hadoop集群正常运行,所以java api需要通过配置HA的方式来访问hdfs集群对于namenode是HA高可用集群时,客户端远程.            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-01-19 10:41:07
                            
                                398阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            读数据使用hadoop url读取比较简单的读取hdfs数据的方法就是通过java.net.URL打开一个流,不过在这之前先要预先调用它            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2022-10-10 14:26:06
                            
                                68阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            客户端需要指定ns名称,节点配置,ConfiguredFailoverProxyProvider等信息。 代码示例:            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-22 17:01:50
                            
                                305阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、HDFS的JavaAPI操作之前我们都是用HDFS Shell来操作HDFS上的文件,现在我们通过编程的形式操作HDFS,主要就是用HDFS中提供的JavaAPI构造一个访问客户对象,然后通过客户端对象对HDFS上的文件进行相应的操作(新建、上传、下载、删除等)。1、常用的类(1)Configuration:该类的对象封装了客户端或服务器的配置(2)FileSystem:该类的对象是一个文件系            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-03 20:26:19
                            
                                176阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            HDFS API的高级编程HDFS的API就两个:FileSystem 和Configuration1、文件的上传和下载1 package com.ghgj.hdfs.api;
 2 
 3 import org.apache.hadoop.conf.Configuration;
 4 import org.apache.hadoop.fs.FileSystem;
 5 import org.ap            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-11 18:47:41
                            
                                203阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
/**
 * hdfs入门程序:
 * 面向对象:一切皆对象
 * 文件系统也可以看做是一类事物、FileSystem
 * 
 * 一定有共同的行为和属性:            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-23 10:24:32
                            
                                65阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # HDFS Java API: Exploring the Power of Distributed File System
Hadoop Distributed File System (HDFS) is a key component of the Apache Hadoop ecosystem, providing a distributed and fault-tolerant fil            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-01-08 11:52:58
                            
                                55阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            HDFS中JAVA API的使用HDFS是一个分布式文件系统,既然是文件系统,就可以对其文件进行操作,比如说新建文件、删除文件、读取文件内容等操作。下面记录一下使用JAVA API对HDFS中的文件进行操作的过程。Configuration类:该类的对象封转了客户端或者服务器的配置。FileSystem类:该类的对象是一个文件系统对象,可以用该对象的一些方法来对文件进行操作。FileSystem            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-03 20:25:55
                            
                                128阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            文章目录1. 前言2. HDFS中的主要涉及到的类2.1 Configuration类2.2 FileSystem类2.3 FSDataInputStream和FSDataOutputStream3. 可能出现的BUG提前说3.1 not supported in state standby3.2 hadoop:supergroup:drwxr-xr-x3.3 nativeComputeChun            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-03 20:26:02
                            
                                155阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            package com.jsptpd;
import java.io.IOException;
import java.io.OutputStream;
//import org.apache.commons.compress.utils.IOUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-04-25 22:34:13
                            
                                301阅读
                            
                                                                             
                 
                
                             
         
            
            
            
              Hadoop是用java语言实现的,因此HDFS有很好的java接口用以编程,重点就是Hadoop的FileSystem类,它是所有文件系统的抽象类,HDFS实例(DistributedFileSystem)也是基于它实现的。本部分主要介绍如何通过使用HDFS的java接口来编写程序。1、如何运行一个Hadoop程序  当我们要写一个Hadoop的应用程序时,因为要用到hadoop的第三方依赖            
                
         
            
            
            
            文章目录一.概述二.搭建环境1.使用Maven构建Java程序,添加maven的依赖包2.修改hdfs-site.ml文件,添加如下配置,放开权限,重启hdfs服务3.单元测试的setUp和tearDown方法4.使用Java API操作HDFS的常用操作1)创建目录2)创建文件并写入数据3)重命名操作4)上传本地文件到HDFS5)查看某目录下的所有文件6)查看文件块信息7)下载一个文件到本地            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-26 08:52:52
                            
                                96阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            第4章 HDFS的Java API4.5 Java API介绍在4.4节我们已经知道了HDFS Java API的Configuration、FileSystem、Path等类,本节将详细介绍HDFS Java API,一下节再演示更多应用。4.5.1 Java API 官网Hadoop 2.7.3 Java API官方地址 http://hadoop.apache.org/docs/r2.7.3            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-03 15:15:37
                            
                                45阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录1.读取HDFS文件(java.net.URL实现)2.读取HDFS文件(Hadoop提供的FileSystem实现)3.向HDFS写入文件4.创建HDFS目录5.删除HDFS上的文件或目录6.查看HDFS文件存在7.列出HDFS目录下的文件或文件名8.查询HDFS文件存储的位置9.写入SequenceFile10.读取SequenceFile本地访问HDFS最主要的方式是HDFS提供的Jav            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-14 08:27:09
                            
                                96阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            API使用一、准备工作1.1、解压1.2、环境变量1.3、新建工程1.4、依赖包1.5、测试1.6、注意事项二、使用方法2.1、HDFS 文件上传2.2、HDFS 文件下载2.3、HDFS 文件夹删除2.4、HDFS 文件名更改2.5、HDFS 文件详情查看2.6、HDFS 文件和文件夹判断2.7、HDFS 的 I/O 流操作2.7.1 文件上传2.7.2 文件下载2.8、定位文件读取 一、准备            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-31 10:02:52
                            
                                89阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            HDFS API详解2012-09-06 13:59:13|  分类: hadoop |  标签:hdfs  api  |举报|字号 订阅  Hadoop中关于文件操作类基本上全部是在"org.apache.hadoop.fs"包中,这些API能够支持的操作包含:打开文            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-15 15:35:13
                            
                                98阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            本文主要讲述如何使用Java代码访问Kerberos和非Kerberos环境下HDFS服务。            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-09-21 23:17:29
                            
                                401阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            HDFS的Java API Java API介绍将详细介绍HDFS Java API,一下节再演示更多应用。Java API 官网Hadoop 2.7.3 Java API官方地址 http://hadoop.apache.org/docs/r2.7.3/api/index.html如上图所示,Java API页面分为了三部分,左上角是包(Packages)窗口,左下角是所有类(All            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-11 18:47:53
                            
                                74阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文章目录1.使用url方式访问数据(了解)2.使用文件系统方式访问数据(掌握)(1)涉及的主要类(2)获取FileSystem的几种方式a. 第一种方式b. 斜体样式第二种方式c. 第三种方式d. 第四种方式3.遍历HDFS中所有文件使用API遍历4.HDFS上创建文件夹5.HDFS文件下载方式1:方式2:6.文件上传7.HDFS的权限访问控制(1)通过配置文件进行权限控制(2)通过伪装用户进行            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-18 15:08:53
                            
                                69阅读
                            
                                                                             
                 
                
                                
                    