目录1:创建目录2、查看文件,ls 没有cd命令, 需要指定绝对路径3:上传文件 put(要先把数据上传到linux本地然后再上传)4:下载文件 get5:复制 cp6:查看文件内容 cat , 如果数据量比较大,不能使用7:移动 mv, 物理层面文件没有移动,只是改变了元数据(目录结构)8:删除文件或者目录 rmr9:查看文件末尾 tail -f ; 一直等待查看10、查看文件的大小11:查看日
转载 2023-08-18 20:45:55
140阅读
HDFS Java API 可以用于任何Java程序与HDFS交互,该API使我们能够从其他Java程序中利用到存储在HDFS中的数据,也能够使用其他非Hadoop的计算框架处理该数据 为了以编程方式与HDFS进行交互,首先需要得到当前配置文件系统的句柄,实例化一个Configuration对象,并获得一个Hadoop环境中的FileSystem句柄,它将指向当前环境的HDFS NameNode
转载 2023-09-01 08:26:09
63阅读
HDFS设计基础与目标 : 1、硬件错误是常态。因此需要冗余  2、流式数据访问。即数据批量读取而非随机读写,Hadoop擅长做的是数据分析而不是事务处理  3、大规模数据集  4、 简单一致性模型。为了降低系统复杂度,对文件采用一次性写多次读的逻辑设计,即 是文件一经写入,关闭,就再也不能修改    5、程序采用“数据就近”原则
一、hdfs基本命令:hadoop fs -cmd <args>选项:cmd: 具体的操作,基本上与UNIX的命令行相同args: 参数 二、hdfs资源uri格式:用法:scheme://authority/path选项:scheme–>协议名,file或hdfsauthority–>namenode主机名path–>路径范例:hdfs://localhost:54
转载 2013-06-21 11:01:00
281阅读
2评论
hadoop hdfs uri详解 hadoop hdfs uri详解 一、hdfs基本命令:hadoop fs -cmd 选项:cmd: 具体的操作,基本上与UNIX的命令行相同args: 参数二
原创 2022-06-14 22:07:58
347阅读
HDFS特点HDFSHadoop Distributed File System,即Hadoop分布式文件系统)是hadoop生态系统的一个重要组成部分,是hadoop中的的存储组件,在整个Hadoop中的地位非同一般,是最基础的一部分,因为它涉及到数据存储,MapReduce等计算模型都要依赖于存储在HDFS中的数据。HDFS是一个分布式文件系统,以流式数据访问模式存储超大文件,将数据分块存
原创 2021-09-29 11:45:38
640阅读
本篇主要对hadoop命令和hdfs命令进行阐述,yarn命令会在之后的文章中体现    hadoop fs命令可以用于其他文件系统,不止是hdfs文件系统内,也就是说该命令的使用范围更广可以用于HDFS、Local FS等不同的文件系统。而hdfs dfs命令只用于HDFS文件系统;一、hadoop命令使用语法:hadoop [--config confdir] COMMAND #其中confi
转载 2021-04-29 13:34:35
1442阅读
2评论
第一章 HDFS 概述1.HDFS 定义HDFSHadoop Distributed File System),它是一个文件系统,用于存储文件,通过目 录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务 器有各自的角色。 HDFS 的使用场景:适合一次写入,多次读出的场景。一个文件经过创建、写入和关闭 之后就不需要改变。2.HDFS 优缺点1.HDFS优点高容错性
原创 2022-04-30 21:27:04
208阅读
第三章 HDFS 的 API 操作1. 客户端环境准备贝 hadoop-3.1.0 到非中文路径(比如 D:\software\)[获取关注公众号回复 window依赖]置 HADOOP_HOME 环境变量 置 Path 环境变量 IDEA 中创建一个 Maven 工程 HdfsClientDemo,并导入相应的依赖坐标+日志添加<dependencies> <dep
原创 2022-05-01 17:05:00
216阅读
目录前言:1、HDFS基本概念2、HDFS基本操作总结: 目录前言:总算有空来接着写大数据的学习笔记了,今天就把之前学过的HDFS的基础知识详细的介绍一下,如有哪点写的不足希望大家多多指教。1、HDFS基本概念1.1、前言: 设计思想 分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析。 在大数据系统中作用: 为各类分布式运算框架(如:m
(1)HDFS 源自于Google的GFS论文    *发表于2003年10月    *HDFS是GFS的克隆版(2)Hadoop Distributed File System    *易于扩展的分布式文件系统    *运行在大量普通连接机器上,提供容错机制    *为大量用户提供性能不错的文件存取服务  (3) NameNode    *namenode 是一个中心服务器,节点单一(简化系统的
原创 2021-04-13 12:23:14
213阅读
(1)HDFS 源自于Google的GFS论文    *发表于2003年10月    *HDFS是GFS的克隆版(2)Hadoop Distributed File System    *易于扩展的分布式文件系统    *运行在大量普通连接机器上,提供容错机制    *为大量用户提供性能不错的文件存取服务 
原创 2022-02-11 11:53:56
67阅读
基本的文件系统命令操作, 通过hadoop fs-help可以获取所有的命令的详细帮助文件。Java抽象类org.apache.hadoop.fs.FileSystem定义了hadoop的一个文件系统接口。Hadoop中关于文件操作类基本上全部是在"org.apache.hadoop.fs"包中,这些API能够支持的操作包含:打开文件,读写文件,删除文件等。Hadoop类库中最终面向用户提供的接口
原创 2016-08-26 11:56:25
10000+阅读
目的:通过挂载的方式,可以类似访问本
原创 2022-07-21 14:40:40
385阅读
一、HDFS体系结构1.1 HDFS 简介Hadoop分布式文件系统(HDFS) 是运行在通
HDFS Java API 位于 org.apache.hadoop.fs 包中,这些API能够支持的操作包括打开文件、读写文件、删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem。该类是一个抽象类,只能通过get方法获取到具体的类。该类封装了大部分文件操作,如mkdir、delete等。 <!--指定maven项目jdk编译版本,默认是jdk1.5--&
转载 2023-08-18 19:31:40
61阅读
最近刚好又重新了解了一下hdfs的一些内容,想通过这篇内容总结和记录一下。Hadoop分布式文件系统HDFS配置及示例运行。 作者使用的是hadoop3.2.1的版本,以下示例都是以hadoop-3.2.1为基础目录进行介绍。1、文件配置首先,进入hadoop配置目录: ./etc/hadoop$ cd etc/hadoop/(1) 配置core-site.xml文件vi 进入编辑模式$ vi c
转载 2023-07-23 17:16:21
206阅读
文章目录Hadoop三大组件之HDFS入门HDFS概述HDFS的shell操作(开发重点)基础语法部分常用命令实操上传下载HDFS的直接操作 Hadoop三大组件之HDFS入门众所周知,Hadoop有三大组件,HDFS、MapReduce、YARN。我的专栏是说大数据,那么数据总得需要存储吧,那么我们今天一起来看看这神秘的大数据有着怎样的身体,能够吸引这广大的学子来”看她“。HDFS概述存在即合
转载 2023-07-14 20:17:28
71阅读
这篇博客是笔者在CSDN里的第一篇博客,旨在希望在这个圈子能够得到更多的交流、更快的成长。 这篇博客就讲些比较基础的内容——常用HDFS的API操作。因为所有的API比较多,所以笔者便从中摘选出11个比较常用的API,希望能给读者一些帮助。因为Hadoop中关于文件操作类基本上都在“org.apache.hadoop.fs”包中,这些API的主要作用主要体现在以下操作上:打开文件、读写文件、删除文
转载 2023-09-01 08:28:43
80阅读
HDFS API详解org.apache.hadoop.fs"包中,这些API能够支持的操作包含:打开文件,读写文件,删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem,该类是个抽象类,只能通过来类的get方法得到具体类。get方法存在几个重载版本,常用的是这个: static FileSystem get(Configuration conf);  
转载 2023-07-23 23:39:36
96阅读
  • 1
  • 2
  • 3
  • 4
  • 5