最近好久没有更新博客了,因为最近的工作鞋的代码都是自己不怎么熟悉的领域的,所以感觉这些代码的有点困难。今天特此这个博客把自己最近研究的东西稍作总结。工作的需求是,在HDFS上有每天不断产生的的日志文件文件夹,每一个文件夹下都有两个文件,一个是.log文件,还有一个是.out文件。现在要求根据日志产生的时间,按照天计算,将同一天产生的文件夹打包压缩成一个文件归档在  HDFS某个特
转载 2023-07-12 18:08:33
49阅读
1.hdfs系统会把用到的数据存储在core-site.xml中由hadoop.tmp.dir指定,而这个值默认位于/tmp/hadoop-${user.name}下面, 由于/tmp目录在系统重启时候会被删除,所以应该修改目录位置。 修改core-site.xml(在所有站点上都修改)<property> <name>hadoop.tmp.dir</nam
转载 2023-06-19 13:24:01
126阅读
工作的需求是,在HDFS上有每天不断产生的的日志文件文件夹,每一个文件夹下都有两个文件,一个是.log文件,还有一个是.out文件。现在要求根据日志产生的时间,按照天计算,将同一天产生的文件夹打包压缩成一个文件归档在  HDFS某个特定的目录下。操作HDFS上的文件当然就不能java自带的那一套操作文件的方式去处理了。
转载 2017-08-29 18:13:00
103阅读
1.Java代码操作HDFS需要用到Jar包和Java类Jar包:hadoop-common-2.6.0.jar和hadoop-hdfs-2.6.0.jarJava类:java.net.URL org.apache.hadoop.fs.FsUrlStreamHandlerFactory java.net.URI org.apache.hadoop.conf.Configuration org.ap
转载 2024-02-28 08:43:42
86阅读
自己做的一些小训练0.0public class HDFSDemo { private Configuration conf; private FileSystem fs; @Before public void before() throws Exception { //初始化,加载hadoop默认的配置文件,如果有指定的位置,则覆盖默认的配置 conf=new Conf
HDFS写入文件的操作流程图如下:                根据上图对整个操作的逻辑进行讲解:1.调用DistributedFileSystem.create(....)方法,在此方法中初始化DFSClient.DFSOutputStrea
转载 2024-03-23 17:37:26
41阅读
1、hadoop默认临时数据文件是存储于Unix的tmp目录下(cd/tmp包含hadoop-root等文件),如果不进行修改,linux系统重启后hadoop有可能出现不正常现象;故需要修改hadoop的临时文件存放目录2、vimcore-site.xml配置如下,然后重启hadoop集群,不要对namenode重新进行格式化操作修改datanode/var/hadoop/dfs/data/cu
原创 2018-10-09 15:29:03
949阅读
在进行 Hadoop 分布式文件系统(HDFS)中的文件写入操作时,使用 Java 编程语言是常见的做法。HDFS 具备高容错性和快速数据处理能力,本篇文章将重点介绍“hdfs 文件 java”的操作过程,包括版本对比、迁移指南、兼容性处理、实战案例、排错指南和性能优化等内容,帮助你更好地理解和实现 HDFS 文件写入。 ## 版本对比 在 HDFS 的不同版本中,存在一些特性差异。以下是对
原创 6月前
23阅读
# Java HDFS 数据指南 作为一名刚入行的小白,这里有一份详细的指南,教你如何使用Java将数据写入Hadoop分布式文件系统(HDFS)。以下内容将涵盖整个流程及代码示例,并使用图表帮助你理解。 ## 流程概述 ### 步骤表格 | 步骤编号 | 步骤 | 说明 | |-------
原创 2024-08-17 07:23:35
23阅读
前面已经讲过hadoop伪分布式和分布式环境搭建,参考大数据时代之Hadoop集群搭建本来想直接搞java代码操作hdfs的,想了想还是先简单的复习下命令行操作hdfs吧。其实hdfs操作起来是操作linux系统的文件个人认为很相似,只不过命令前面要加个hdfs dfs -或者hadoop fs -,如:#新建目录 hdfs dfs -mkdir <path> 或 hadoop fs
转载 2023-06-05 15:07:20
136阅读
一.hdfs数据流程(面试重点) 1)客户端(fs)向namenode请求上传文件,namenode检查目标文件是否已存在,父目录是否存在。 2)namenode返回是否可以上传。 3)客户端请求第一个 block上传到哪几个datanode服务器上。 4)namenode返回3个datanode节点,分别为dn1、dn2、dn3。 5)客户端请求向dn1上传数据,dn1收到请求会继续调用dn2
转载 2024-02-29 13:12:51
124阅读
Java操作HDFS开发环境搭建在之前我们已经介绍了如何在Linux上进行HDFS伪分布式环境的搭建,也介绍了hdfs中一些常用的命令。但是要如何在代码层面进行操作呢?这是本节将要介绍的内容:1.首先使用IDEA创建一个maven工程:2.接着配置依赖的包:<properties> <project.build.sourceEncoding>UTF-8&l
转载 2024-03-02 09:39:25
37阅读
(一)写入文件在net.hw.hdfs包中创建writeFileOnHDFS类1、将数据直接写入HDFS文件   【在/ied01目录中创建hello.txt文件,创建write1()方法】 注:package net.hw.hdfs; import org.apache.hadoop.conf.Configuration; import org.apache.ha
转载 2023-09-15 12:14:30
211阅读
使用java.net.URL访问HDFS文件系统 HDFS的API使用说明:  1.如果要访问HDFSHDFS客户端必须有一份HDFS的配置文件  也就是hdfs-site.xml,从而读取Namenode的信息。  2.每个应用程序也必须拥有访问Hadoop程序的jar文件  3.操作HDFS,也就是HDFS的读和,最常用的类FileSystem 实例1:使用java.n
# 教你如何用JavaHDFS文件到内存 ## 1. 流程图 ```mermaid erDiagram 开始 --> 创建Configuration对象 创建Configuration对象 --> 创建FileSystem对象 创建FileSystem对象 --> 创建Path对象 创建Path对象 --> 创建FSDataOutputStream对象
原创 2024-05-12 04:42:23
31阅读
# 如何在HDFS中使用Java写入文件 Hadoop分布式文件系统(HDFS)是一个用于大数据存储的重要技术,广泛应用于各种数据密集型场景中。通过Java编程语言与HDFS进行交互,我们可以高效地写入和读取文件。本文将介绍如何使用Java代码将文件写入HDFS,并提供代码示例和可视化图示帮助理解。 ## HDFS简介 HDFS是Hadoop的核心组件之一,它能够以高效、可靠的方式存储海量数
原创 9月前
70阅读
# 如何正确地编写Java程序中的HDFS路径 HDFS(Hadoop Distributed File System)是Apache Hadoop的一个核心组件,用于存储大规模数据集,并提供高可靠性、高性能的数据访问。在Java程序中,需要正确地编写HDFS路径才能与HDFS进行交互。本文将介绍如何正确地编写Java程序中的HDFS路径,并提供一些示例来帮助读者更好地理解。 ## 为什么需要
原创 2024-07-05 06:06:24
59阅读
一、大数据介绍量特别大的数据,大数据特征:数据体量大高速:数据产生的速度快类型多样价值密度低真实二、HDFS 介绍HDFS 是 Hadoop Distribute File System 的简称,意为:Hadoop 分布式文件系统。是 Hadoop 核心组件之一,作为最底层的分布式存储服务而存在。分布式文件系统解决的问题就是大数据存储。它们是横跨在多台计算机上的存储系统。分布式文件系统在大数据时代
转载 2024-04-26 18:37:42
111阅读
# JavaHDFS追加内容 ## 引言 Hadoop分布式文件系统(HDFS)是大数据处理中最常用的文件系统之一。在HDFS中,数据被分割成块并存储在不同的节点上,以实现高容错性和高吞吐量。在某些情况下,我们可能需要向已存在的HDFS文件追加内容,而不是覆盖已有的内容。本文将介绍如何使用Java编写代码来实现向HDFS文件追加内容的功能。 ## HDFS追加内容的原理 在HDFS中,追
原创 2023-08-31 14:18:39
516阅读
准备工作:虚拟机打开,使用start-all.sh命令启动Hadoop。使用jps命令可以查看是否全部启动。 打开IDEA,创建一个maven项目。在pom.xml里导入依赖,如下:<properties> <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding> &lt
转载 2023-06-02 15:51:18
112阅读
  • 1
  • 2
  • 3
  • 4
  • 5