今天听了王家林的hadoop的集群管理工具dfsadmin介绍,也实际操作了下,不过没找到感觉,不知道是自己脑子空白还是怎么的,倒是下面这篇文章还靠谱。一、hdfs dfsadmin -safemode 安全模式 NameNode在启动的时候 首先进入安全模式,如果datanode丢失的block达到一定的比例(由hdfs-site.xml文件中dfs.safemode.thr            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                            精选
                                                        
                            2016-09-22 08:25:11
                            
                                5990阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            今天听了王家林的hadoop的集群管理工具dfsadmin介绍,也实际操作了下,不过没找到感觉,不知道是自己脑子空白还是怎么的,倒是下面这篇文章还靠谱。一、hdfs dfsadmin -safemode 安全模式 NameNode在启动的时候 首先进入安全模式,如果datanode丢失的block达到一定的比例(由hdfs-site.xml文件中dfs.safemode.thr            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2016-11-14 14:01:42
                            
                                3907阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、HDFS1.1 HDFS介绍HDFS(Hadoop Distributed File System,全称为“分布式文件系统”) 是Apache Hadoop下的一个分布式文件系统项目。Hadoop底层就是使用HDFS来存储大型的数据 。HDFS 使用多台计算机存储文件,并且提供统一的访问接口。HDFS对数据文件的访问通过流的方式进行处理,这意味着通过命令和 MapReduce 程序的方式可以直            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-01 08:29:31
                            
                                128阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            HDFS有着高容错性特点,且设计用来部署在低廉的硬件上,提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。HDFS放宽了POSIX的要求,可以实现流的形式访问文件系统中的数据。Hadoop分布式文件系统HDFS是一种被设计成适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。它能提供高吞吐量的数据访问非常适合大规模数据集上的应用。HDFS            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-18 13:53:00
                            
                                49阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            &esmp; HDFS(Hadoop Distributed File System)分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。存储模型  假如我们有一个10T的文件要存储,而我们的硬盘空间只有1个T,那么这时候我们可以将这个10T的文件切成10个1T的文件来分别存储在10个硬盘中,HDFS的...            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-07-01 10:11:35
                            
                                140阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文章目录Hadoop概述及HDFS架构什么是Hadoop?概述名词科普服务器机架Hadoop组件介绍Hadoop版本介绍分布式存储分布式存储介绍HDFS架构分析yarn架构分析MapReduce架构分析Hadoop特点 Hadoop概述及HDFS架构什么是Hadoop?概述适合海量数据进行分布式存储和分布式计算的平台
它有三大组件
Hdfs:分布式存储
主节点NameNode:接受客户端读写数据            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-13 16:45:56
                            
                                62阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1. HDFS Architecture 一种Master-Slave结构。包括Name Node, Secondary Name Node,Data Node Job Tracker, Task Tracker。JobTrackers: 控制全部的Task Trackers 。这两个Tracker            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2017-07-18 20:07:00
                            
                                162阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            说明:由于近期正好在研究hadoop的快照机制。看官网上的文档讲的非常仔细。就顺手翻译了。也没有去深究一些名词的标准译法,所以可能有些翻译和使用方法不是非常正确,莫要介意~~
 
 
1. 概述
快照snapshots是HDFS文件系统的仅仅读的基于某时间点的拷贝,能够针对某个文件夹,或者整个文件系统做快照。
快照比較常见的应用场景是数据备份,以防一些用户错误或灾难恢复。
快照的高效性实现:(1            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2017-06-15 11:27:00
                            
                                247阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Hadoop系统运行于一个由普通商用服务器组成的计算集群上,该服务器集群在提供大规模分布式数据存储资源的同时,也提供大规模的并行化计算资源。在大数据处理软件系统上,随着Apache Hadoop系统开源化的发展,在最初包含HDFS、MapReduce、HBase等基本子系统的基础上,至今Hadoop平台已经演进为一个包含很多相关子系统的完整的大数据处理生态系统。(下图展示了Hadoop平台的基本组            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-31 17:39:20
                            
                                63阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            HDFS API详解org.apache.hadoop.fs"包中,这些API能够支持的操作包含:打开文件,读写文件,删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem,该类是个抽象类,只能通过来类的get方法得到具体类。get方法存在几个重载版本,常用的是这个: static FileSystem get(Configuration conf);              
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-23 23:39:36
                            
                                112阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Hadoop 生态是一个庞大的、功能齐全的生态,但是围绕的还是名为 Hadoop 的分布式系统基础架构,其核心组件由四个部分组成,分别是:Common、HDFS、MapReduce 以及 YARN。
Common 是 Hadoop 架构的通用组件;
HDFS 是 Hadoop 的分布式文件存储系统;
MapReduce 是Hadoop 提供的一种编程模型,可用于大规模数据集的并行运算;
YARN            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-13 11:24:12
                            
                                108阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Hadoop的配置详解   大家经过搭建单节点、伪分布、完全分布模式的集群环境,基本上会用到以下几个配置,core-site.xm/hdfs-site.xml/mapred-site.xml.   相信大家已经使用了其中的一些参数,下面我们来详细介绍一下各个配置中的参数,介绍的参数是大家可能用到的,当然还有很多没介绍到(学习hadoop不久,如果哪里错了,请            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-13 11:25:32
                            
                                145阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            HDFS Java API 可以用于任何Java程序与HDFS交互,该API使我们能够从其他Java程序中利用到存储在HDFS中的数据,也能够使用其他非Hadoop的计算框架处理该数据
为了以编程方式与HDFS进行交互,首先需要得到当前配置文件系统的句柄,实例化一个Configuration对象,并获得一个Hadoop环境中的FileSystem句柄,它将指向当前环境的HDFS NameNode            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-01 08:26:09
                            
                                73阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            这篇博客是笔者在CSDN里的第一篇博客,旨在希望在这个圈子能够得到更多的交流、更快的成长。 这篇博客就讲些比较基础的内容——常用HDFS的API操作。因为所有的API比较多,所以笔者便从中摘选出11个比较常用的API,希望能给读者一些帮助。因为Hadoop中关于文件操作类基本上都在“org.apache.hadoop.fs”包中,这些API的主要作用主要体现在以下操作上:打开文件、读写文件、删除文            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-01 08:28:43
                            
                                85阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            最近刚好又重新了解了一下hdfs的一些内容,想通过这篇内容总结和记录一下。Hadoop分布式文件系统HDFS配置及示例运行。 作者使用的是hadoop3.2.1的版本,以下示例都是以hadoop-3.2.1为基础目录进行介绍。1、文件配置首先,进入hadoop配置目录: ./etc/hadoop$ cd etc/hadoop/(1) 配置core-site.xml文件vi 进入编辑模式$ vi c            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-23 17:16:21
                            
                                241阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录1:创建目录2、查看文件,ls 没有cd命令, 需要指定绝对路径3:上传文件 put(要先把数据上传到linux本地然后再上传)4:下载文件 get5:复制 cp6:查看文件内容 cat , 如果数据量比较大,不能使用7:移动 mv, 物理层面文件没有移动,只是改变了元数据(目录结构)8:删除文件或者目录 rmr9:查看文件末尾 tail -f ; 一直等待查看10、查看文件的大小11:查看日            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-18 20:45:55
                            
                                176阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            HDFS Java API 位于 org.apache.hadoop.fs 包中,这些API能够支持的操作包括打开文件、读写文件、删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem。该类是一个抽象类,只能通过get方法获取到具体的类。该类封装了大部分文件操作,如mkdir、delete等。 <!--指定maven项目jdk编译版本,默认是jdk1.5--&            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-18 19:31:40
                            
                                78阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            文章目录Hadoop三大组件之HDFS入门HDFS概述HDFS的shell操作(开发重点)基础语法部分常用命令实操上传下载HDFS的直接操作 Hadoop三大组件之HDFS入门众所周知,Hadoop有三大组件,HDFS、MapReduce、YARN。我的专栏是说大数据,那么数据总得需要存储吧,那么我们今天一起来看看这神秘的大数据有着怎样的身体,能够吸引这广大的学子来”看她“。HDFS概述存在即合            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-14 20:17:28
                            
                                95阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、新课讲解由于Hadoop是使用Java语言编写的,因此可以使用Java API操作Hadoop文件系统。HDFS Shell本质上就是对Java API的应用,通过编程的形式操作HDFS,其核心是使用HDFS提供的Java API构造一个访问客户端对象,然后通过客户端对象对HDFS上的文件进行操作(增、删、改、查)。  (一)了解 HDFS API1.HDFS常见类与接口Hadoop            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-06 10:34:18
                            
                                91阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            第三部分:Hadoop使用和Hbase使用一、实验目的和要求理解Hadoop和Hbase的工作原理,安装部署HBase,掌握HDFS文件系统和Hbase的操作命令。二、实验内容和原理Hadoop文件系统: HDFS,是Hadoop Distributed File System的简称,是Hadoop抽象文件系统的一种实现。Hadoop抽象文件系统可以与本地系统、Amazon S3等集成,甚至可以通            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-13 12:38:56
                            
                                124阅读
                            
                                                                             
                 
                
                                
                    