HDFS(Hadoop Distributed File System)和Ceph都是用于存储大数据的分布式存储系统。它们在不同的场景下有着各自的优势和适用性,可以根据具体需求来选择合适的存储方案。
首先来看HDFS,HDFS是由Apache Hadoop项目开发的一种分布式文件系统,广泛应用于大数据存储与处理领域。HDFS采用了主从架构,其中包括一个NameNode和多个DataNode。Na            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-03-07 12:05:55
                            
                                120阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            数据特征:巨大、非结构化、并行处理分布式文件系统 NoSQL数据库 分布式数据库 云数据3.2 分布式文件系统3.2.1分布式文件系统概念:文件系统管理的无物理存储资源不仅在本地节点上,还可以通过网络连接存储在非本地节点上,可解决备份、安全、可拓展等难题评价一个分布式文件系统因素: (1)数据的存储方式,即文件数据在各节点之间的分布策略 (2)数据的读取速率 (3)安全机制3.2.1.1 常见的分            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-17 14:31:19
                            
                                110阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            .每台服务器需要关闭防火墙 
 systemctl daemon-reload(masterJ节点) 
 systemctl stop firewalld 
 .删除文件夹 
 mkdir /opt/tmp 
 rm -fr /usr/hadoop/name 
 rm -fr /usr/hadoop/data 
 mkdir /usr/hadoop/name 
 mkdir            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-17 05:12:24
                            
                                66阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            笔者也是接触大数据不久,大数据很多理论,也分为很多模块,在学习途中遇到了许多问题,在这过程中希望自己能将学到的东西整理下来,分享出来,知识不仅是自己的,也可以给大家进行借鉴。 目录一、HDFS概述二、HDFS的优势三、HDFS的局限性四、HDFS核心设计 一、HDFS概述HDFS其实在我看来应该是整个Hadoop生态系统中比较简单的知识部分了,HDFS全称Hadoop Distribute Fil            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-17 10:46:43
                            
                                71阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、HDFS基础架构 1、HDFS特点:水平扩展、高容错性、廉价硬件、开源生态系统 2、Hadoop生态圈 1)、分布式存储系统(HDFS),2)、资源管理框架(YARN),3)、批处理框架(MapReduce、Pig),4)、数据仓库(Hive),5)、NoSQL系统(HBase、Drill),6            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-01-18 14:34:00
                            
                                139阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            一、什么是安全模式 安全模式时HDFS所处的一种特殊状态,在这种状态下,文件系统只接受读数据请求,而不接受删除、修改等变更请求。在NameNode主节点启动时,HDFS首先进入安全模式,DataNode在启动的时候会向namenode汇报可用的block等状态,当整个系统达到安全标准时,HDFS自动            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-29 16:17:06
                            
                                483阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1. 异构存储概述    异构存储可以根据各个存储介质读写特性的不同发挥各自的优势。针对冷数据,采用容量大的、读写性能不高的介质存储,比如最普通的磁盘;对于热数据,可以采用SSD(固态硬盘,读写速度快,容量小)的方式进行存储。2. 异构存储的原理   ·DataNode通过心跳汇报自身数据存储目录的StorageType给NameNode             
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-28 10:31:37
                            
                                152阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # 学习大数据存储技术HDFS和HBASE
作为一名经验丰富的开发者,我将会教你如何实现“大数据存储技术HDFS和HBASE”。首先,让我们来看一下整个学习流程:
| 步骤 | 操作 |
| ---- | ---- |
| 1. | 安装并配置Hadoop集群 |
| 2. | 部署HDFS |
| 3. | 部署HBase |
| 4. | 创建表格并插入数据 |
| 5. | 查询数据 |            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-06-16 04:35:55
                            
                                29阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一.大数据的存储方式  在单机不可能存储的情况下只能使用分布式集群进行存储。由此涉及到两个最基本的概念:  1.写入数据的时候,需要为数据分配到集群中的某一台机器中,这个过程叫数据分片(shard/partition)。  2.读取数据的时候,需要找到集群中存放这条数据的机器,这个过程叫做数据路由(routing)。  一般的数据分片/路由模型会可以使用两层以上的映射关系,即一个数据分片中可以有多            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-26 13:10:37
                            
                                142阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            ## 大数据 HDFS 数据如何存储在 Hive 中
随着大数据技术的发展,Apache Hive 已成为一个广泛使用的数据仓库解决方案,它能够在 Hadoop 上进行数据分析。Hive 提供了一个 SQL 接口,用户可以用类 SQL 语言(HiveQL)来查询存储在 Hadoop 分布式文件系统(HDFS)中的数据。本文将探讨如何将 HDFS 数据存储在 Hive 中,并通过代码示例进行说明。            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-09-16 04:15:18
                            
                                51阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            下面哪个程序负责 HDFS 数据存储。secondaryNameNodeNameNodeJobtrackerDatanode (答案)HDFS是基于流数据模式访问和处理的超大文件的需求而开发的,适合读写的任务是?多次写入,少次读一次写入,少次读一次写入,多次读 (答案)多次写入,多次读以下哪一项属于非结构化数据。财务系统数据日志数据视频监控数据 (答案)企业ERP数据            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-07 12:27:15
                            
                                35阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。大数据平台处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据仓库工具无法处理完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等。一、大数据相关基本内容及基本框架介绍:所有的大数据相关所用到的技术都是基于Hadoop生态圈的1、HadoopHadoop是一个开            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-28 11:39:05
                            
                                59阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1、HDFS 是做什么的  HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。它所具有的高容错、高可靠性、高可扩展性、高获得性、高吞吐率等特征为海量数据提供了不怕故障的存储,为超大数据集(Large Data Set)的应用处理带来            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-23 11:04:57
                            
                                0阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            大数据技术之 Hadoop-HDFS概述1. HDFS 产出背景及定义2. HDFS 优缺点3. HDFS 组成架构4. HDFS 文件块大小 1. HDFS 产出背景及定义1)HDFS 产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS 只是分布式文            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-22 20:58:58
                            
                                26阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录1、概述1.1 文件系统协议1.2 区别2、HDFS常用命令2.1 hdfs文件系统命令2.1.1 文件夹路径增删改查2.1.2 空间大小查看2.1.3权限管理类2.1.4文件操作(上传下载复制)2.1.5 判断2.1.6 系统功能管理3、运维命令4、 mapreduce命令5、 hdfs系统检查工具fsck6、运行pipies作业1、概述1.1 文件系统协议HDFS Sh            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-13 16:55:54
                            
                                64阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            大数据学习02_Hadoop: HDFSHDFS概述HDFS定义HDFS优缺点HDFS组成架构HDFS文件块大小 HDFS概述HDFS定义HDFS(Hadoop Distributed File System),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色HDFS优缺点优点:高容错性: 数据自动保存多个副本,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-02 13:11:03
                            
                                40阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            大数据的存储1.存储方式1.1 块存储        块存储就好比硬盘一样,直接挂载到主机,一般用于主机的直接存储空间和数据库应用的存储。它分两种形式:        DAS:一台服务器一个存储,多机无法直接共享,需要借助操作系统的功能,如            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-29 08:44:41
                            
                                82阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Hadoop之HDFS1.Hdfs1.1 Hdfs的数据上传和读取过程1.1.1 hdfs写文件的步骤1.1.2 hdfs读文件的步骤1.2 JAVA如何读取HDFS1.3 HDFS上NameNode的fsimage和edits文件  说明,感谢亮哥长期对我的帮助,此处多篇文章均为亮哥带我整理。以及参考诸多博主的文章。如果侵权,请及时指出,我会立马停止该行为;如有不足之处,还请大佬不吝指教,以期            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-02 10:20:40
                            
                                22阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1.4. HDFS 文件副本和 Block 块存储所有的文件都是以 block 块的方式存放在 HDFS 文件系统当中, 在 Hadoop1当中, 文件的 block 块默认大小是 64M, hadoop2 当中, 文件的 block块大小默认是 128M, block 块的大小可以通过 hdfs-site.xml当中的配置文件进行指定<property>        <...            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-08-18 10:41:06
                            
                                575阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            角色出演   如上图所示,HDFS存储相关角色与功能如下:   Client:客户端,系统使用者,调用HDFS API操作文件;与NN交互获取文件元数据;与DN交互进行数据读写。   Namenode:元数据节点,是系统唯一的管理者。负责元数据的管理;与client交互进行提供元数据查询;分配数据存储节点等。   Datanode:数据存储节点,负责数据块的存储与冗余备份;执行数据块的读写操作等。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-09 22:18:50
                            
                                66阅读