学习大数据技术,就不可能避开hadoop,因为hadoop框架是分布式系统的基础。Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问
前言:上一篇文章 我学习使用pandas进行简单的数据分析,但是各位...... Pandas处理、分析不了TB级别数据的大数据,于是再看看Hadoop。 另附上人心不足蛇吞象 对故事一的感悟:  人的欲望是无止境的,我们每次欲求一点,欲望便增长一点。但身体是有极限的,总有一天,我们因为渴求太多,最终所有都化为飞灰。   Hado
转载 2023-07-09 22:30:48
0阅读
HDFS写数据的过程中,NameNode会选择距离待上传数据最近距离的DataNode接收数据,基于机架感知,NameNode就可以画出上图所示的datanode网络拓扑图。D1,R1都是交换机,最底层是datanode。
原创 精选 2020-09-30 10:34:43
1498阅读
Hadoop配置本文章在其他文章基础上参考编辑Hadoop配置APIhadoop中的组件都是通过Hadoop自己的配置API配置的,一个Configuration类的实例代表了Hadoop集群的配置。配置类似于Map,由属性及值组成。属性为String类型,值则可以为java基本类型、其他有用类型(例如String、Class、java.io.File)及String集合。API重要属性quite
一 、配置Windows下的Hadoop环境 导入依赖与插件<dependencies> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactI
转载 2023-07-13 17:53:55
42阅读
目录引言API实操1、连接hdfs(一)2、连接hdfs(二)3、创建文件夹4、上传文件5、遍历文件夹6、下载文件7、重命名文件或者文件夹8、删除文件或者文件夹9、小文件合并 引言HDFS在生产应用中主要是客户端的开发,其核心步骤是从HDFS提供的API中构造一个HDFS的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS上的文件。API介绍:   1. API(Application
转载 2023-09-19 21:41:21
83阅读
一、概述1.1、Hadoop是什么?Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop由HDFS、MapReduce、HBase、Hive和ZooKeeper等成员组成,其中最基础最重要的两种组成元素为底层用于存储集群中所有存储节点文件的文件系统HDFS(Hadoop Dist
转载 2023-07-31 17:20:34
46阅读
地址:介绍http://hadoop.apache.org/docs/r1.0.4/cn/index.html集群搭建http://hadoop.apache.org/docs/r1.0.4/cn/cluster_setup.htmlmap Reducehttp://hadoop.apache.org/docs/r1.0.4/cn/mapred_tutorial.html...
原创 2022-08-02 15:23:37
66阅读
Hadoop框架的认识以及基础命令的认识Hadoop的学习笔记大数据的特点:大量、高速、多样化概述:Hadoop是一个适合海量数据的分布式存储和分布式计算的平台。Hadoop框架三大组件支持:Hadoop是一个统称,目前hadoop主要包含三大组件:(1)HDFS:是一个分布式存储框架,适合海量数据的存储(2)mapreduce:是一个分布式计算框架,适合海量数据的计算(3)yarn:是一个资源调
转载 2023-07-04 09:54:43
93阅读
HDFS是Hadoop的分布式文件系统,负责海量数据的存取 文章目录零、使用API的套路一、获取FileSystem对象二、释放FileSystem资源三、使用FileSystem对象1、创建文件夹 mkdirs()2、上传文件 copyFromLocalFile()3、下载文件 copyToLocalFile()4、文件的更名和移动 rename()5、删除文件或目录 delete()6、查看文
转载 2023-07-05 13:03:14
94阅读
HDFS JAVA APIversion 273HBASE JAVA APIversion 124MAPREDUCE JAVA APIversion 273 HDFS JAVA API(version 2.7.3)HDFS 分布式文件系统JAVA API。与local的java 文件系统的API类似。NameDescriptionorg.apache.hadoop.conf.configurat
转载 2023-08-18 10:43:51
41阅读
Hadoop基础介绍一、总体介绍二、HDFS架构三、MapReduce结构四、YARN架构 一、总体介绍1、定义: 是一个开源的、可靠的、可扩展的分布式计算框架。2、用途: (1)数据仓库 (2)PB级别数据的存储与处理。3、核心组件 (1)HDFS:解决分布式存储,包括数据切分和多副本两部分。 (2)Map Reduce:解决分布式计算,Map:分,Reduce:合。既是分布式框架,又是编程模
转载 2023-07-12 15:15:29
43阅读
Hadoop Java API1、常用对象org.apache.hadoop.fs.FileSystemHDFS的主要操作对象,必须获取到这个实例对象,才可以操作HDFS.这是一个比较通用的文件系统的抽象基类,可以实现分布式系统或者本地连接磁盘,本地版本可以做hadoop的小测试。要想使用HDFS,那么就得使用这个FileSystem的对象或者子类对象。本地实现是LocalFileSystem,分
转载 2023-07-03 20:29:44
102阅读
1. 在Hadoop1.0版本中,Hadoop是有许多缺点的。比如,迭代计算效率低下,因为每一次map和reduce前,会读取hdfs中的数据,然后本次执行完毕后,会把数据存储到hdfs中,反复读取hdfs中的数据,降低了迭代计算的效率。所以在Hadoop2.0后,就有了spark,它是基于内存的分 ...
转载 2021-08-11 17:55:00
179阅读
2评论
Hadoop框架详解Hadoop项目主要包括以下四个模块◆ Hadoop Common:  为其他Hadoop模块提供基础设施  ◆ Hadoop HDFS:  一个高可靠、高吞吐量的分布式文件系统  ◆ Hadoop MapReduce:  一个分布式的离线并行计算框架  ◆ Hadoop YARN:  一个新的MapRedu
转载 2023-09-14 13:04:31
10阅读
第三章 大数据处理框架Hadoop3.1 概述3.1.1 Hadoop简介Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。Hadoop 是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中。Hadoop 的核心是分布式文件系统HDFS(Hadoop Distributed File System)和MapR
一、大数据框架二、hadoop核心组件Hadoop集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起。(1)HDFS集群:负责海量数据的存储。(2)YARN集群:负责海量数据运算时的资源调度。(3)MapReduce:在分布式计算框架上的可自定义设计框架,使用只需要定义其功能,而不用取考虑分布式并行计算的细节。(1)HDFS集群HDFS简化了文件的一致性模型,通
       OK~从今天开始,我们就开始我们的破茧成蝶——大数据篇系列的博客编写,今天是第一篇,开篇为《Hadoop框架介绍》,Hadoop系列将会收录在《破茧成蝶——大数据篇》专栏中。下面,大家就跟我一起踏上破茧成蝶的旅途吧!目录一、 Hadoop是什么二、Hadoop的三大发行版本2.1 Apache Hadoop2.2 Cloudera Hadoop
转载 2023-08-25 10:51:53
30阅读
对于一些应用,需要特殊的数据结构来存储数据。比如运行基于MapReduce的进程,当存储数据时,将每个二进制数据块放入它自己的文件,这样做使得后期不容易扩展。为此,hadoop开发了一系列高级容器。一、SequenceFile类 包为:org.apache.hadoop.io.SequenceFile Hadoop的SequenceFile类为二进制键值对提供了一个持续化的数据结构。它提供了Wri
一、从Hadoop URL 中读取数据使用java.net.URL对象打开一个数据流InputStream in = new URL("hdfs://host/path").openStream();二、FileSystem 对象取得FileSystem实例有两种静态方法:(1)public static FileSystem get(Configuration conf) //Configura
转载 2023-09-14 13:06:25
48阅读
  • 1
  • 2
  • 3
  • 4
  • 5