通过URL访问hadoop是可行的,如:package cn.weida.hadoop.read; import java.io.IOException; import java.io.InputStream; import java.net.URL; import java.net.URLStreamHandlerFactory;import org.apache.hadoop.fs.Fs
转载 2023-09-01 08:33:25
37阅读
这个地址收录了最全的java视频(java基础hadoop视频):http://pan.baidu.com/s/1j9W1J 感谢博主分享!!,nd84
转载 精选 2013-11-25 14:03:56
433阅读
hadoop入门分析(一)- 基本架构 这里呢我们将简单的对大数据进行一个初步的认识,毕竟大家都知道,无论是学习一项新技术还是一项新的什么其他的技能,光靠死记硬背是很难背下来的。重要的是对于你要掌握的东西的一个理解,有了理解,那就容易多了不是。所以人狠话不多,废话不多说,接下来就和大家一起探讨下大数据的基本架构。背景 背景就不多赘述了,相信很多朋友也不愿意过多了解这个历史,这里还是主要感谢膜拜那些
转载 2024-01-15 15:46:39
70阅读
Hadoop基础
推荐 原创 2022-11-06 15:26:12
1206阅读
2点赞
Hadoop总结——Hadoop基础
原创 2022-11-26 07:39:58
266阅读
1点赞
1 什么是hadoop? hadoop是一个开源框架,用于存储大量数据,并发处理/查询在具有多个商用硬件(即低成本硬件)节点的集群上的那些数据 主要包含以下几块? HDFS 允许你一种分布式和冗余的方式存储大量数据 MapReduce 一个计算框架,它以分布式和并行的方式处理大量数据 Yarn 用于 ...
转载 2021-10-17 12:21:00
97阅读
2评论
# Hadoop基础 ## 什么是HadoopHadoop是一个开源的分布式计算框架,用于存储和处理大规模数据集。它的设计目标是可以在廉价的硬件上进行可靠、高效的分布式计算。 Hadoop具有以下几个核心组件: - Hadoop分布式文件系统(HDFS):用于存储大规模数据集的分布式文件系统。 - Hadoop YARN:用于管理和调度集群中的资源。 - Hadoop MapReduce
原创 2023-07-14 16:17:11
41阅读
基础概念 大数据的本质 一、数据的存储:分布式文件系统(分布式存储)二、数据的计算:分部署计算 基础知识 学习大数据需要具备Java知识基础及Linux知识基础 学习路线 (1)Java基础和Linux基础(2)Hadoop的学习:体系结构、原理、编程第一阶段:HDFS、MapReduce、HBas
转载 2018-07-05 11:49:00
181阅读
2评论
# Hadoop 基础 Hadoop 是一个开源的分布式计算框架,用于处理大规模数据集。它能够通过分布式计算和存储的方式,让我们在数百或数千台机器上并行处理数据。Hadoop 由多个模块构成,以便应对不同的数据处理需求。本文将为您介绍 Hadoop 的基本概念、架构组件、使用方法以及代码示例。 ## 一、Hadoop 的架构 Hadoop 的核心组成部分包括以下模块: 1. **Hadoo
原创 9月前
6阅读
一、Hadoop的组成1. HDFSHadoop分布式文件系统 海量数据的存储NameNode 集群中的主节点,用来管理元数据(文件属性信息)DataNode 集群中的从节点,用来管理文件块SecondaryNameNode 集群中的辅助节点,用于NameNode的存储优化和数据恢复2. YARN分布式资源(cpu、内存等计算资源)调度服务ResourceManager 集群中的主节点,用于接收客
转载 2023-07-12 14:38:11
22阅读
hadoop是什么? (1)Hadoop就是一个分布式计算的解决方案,也就是帮助我们把 一个任务分到很多台计算机来运算。 (2)Hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。Hadoop=HDFS(文件系统,数据存储技术相关)+ Mapreduce(数据处理)Hadoop的数据来源可以是任何
转载 2021-05-24 10:22:13
4447阅读
hadoop是什么?(1)Hadoop就是一个分布式计算的解决方案,也就是帮助我们把 一个任务分到很多台计算机来运算。(2)Hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的
原创 2022-03-11 10:52:21
1789阅读
Hadoop常用操作1、Hadoop安装略2、Hadoop配置略3、Hadoop多目录配置namenode和datanode节点下都可以进行多个目录的配置,但是意义不同。namenode的多目录配置是副本策略,保证数据可靠性,datanode多目录配置是对容量进行扩容,由于datanode已经有副本机制了。[hdfs-site.xml]<!-- namenode多目录配置 --> &l
转载 2023-05-23 17:26:28
116阅读
Hadoop环境配置与测试Hadoop的安装方式有三种,分别是单机模式,伪分布式模式,分布式模式。 • 单机模式:Hadoop 默认模式为非分布式模式(本地模式),无需进行其他配置即可运行。非分布式即单 Java 进程,方便进行调试。 • 伪分布式模式:Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既作为 NameNode 也作为 Data
转载 2023-10-14 22:43:35
48阅读
1、基本概念 2、Mapper 3、Reducer 4、JobRunner 5、JAR 提交作业 到YARN
原创 2021-07-22 13:50:40
790阅读
目录介绍Hadoop的先决条件安装VMWare Player和Ubuntu操作系统安装Java 8 JDK设置JAVA_HOME变量安装SSH下载Hadoop安装Hadoop配置Hadoop结论介绍在我之前的文章中,我试图对大数据和Hadoop进行概述。在本文中,我将向您展示如何在Ubuntu操作系统上安装Hadoop(单节点集群)。Windows用户也可以按照本文在虚拟机中安装Ubuntu 获得
hadoop基础原理
原创 2018-03-19 18:12:14
4110阅读
Hadoop基础学习 1. Hadoop简介 Hadoop是一个开源分布式计算平台,为用户提供系统底层细节透明的分布式基础架构。Hadoop是基于Java语言开发的,具有很好的跨平台性,平且可以部署到廉价的计算机集群当中去。Hadoop的核心是Hadoop分布式文件系统(HDFS)和MapReduc ...
转载 2021-08-02 21:19:00
195阅读
2评论
文章目录一、理论知识1.Hadoop的整体印象2.Hadoop的优势3.Hadoop可以做什么4.Hadoop结构Hadoop存储--HDFSHadoop计算
原创 2022-12-05 01:15:43
141阅读
一、优缺点 A、优点 1、高容错性 默认开启三个副本 2、适合处理大数据 3、廉价 B、缺点 1、速度慢,不适合低延迟的数据访问 2、无法高效的对大量小文件进行存储,小文件占用 NameNode 3、不支持并发写入,只支持append(追加) HDFS块的大小设置主要取决于磁盘传输速率(机器性能)
原创 2021-07-14 11:36:08
312阅读
  • 1
  • 2
  • 3
  • 4
  • 5