HDFS HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。采用Java语言开发,可以部署在多种普通的廉价机器上,以集群处理数量积达到大型主机处理性能。HDFS 架构原理 HDFS采用master/slave架构。一个HDFS集群包含一个单独的NameNode和多个DataNode。NameNode作为mas
原创 2023-12-20 15:39:16
64阅读
Hive:是一个构建在Hadoop 上的数据仓库框架,MapReduce (输入hive启动shell)metastore:是Hive元数据的集中存放地HBase:是一个在HDFS上开发的面向列的分布式nosql数据库(输入hbase shell启动shell)HBase 提供Avro,REST,T
转载 2016-04-12 20:13:00
93阅读
2评论
hadoop学习–(从hadoop框架讨论大数据生态)一、hadoop介绍hadoop是Apache基金会开发的分布式系统基础架构。主要解决海量数据的存储和海量数据分析计算。(传统工具存储不了海量数据,传统数据计算速度慢)。广义上来说。hadoop是指hadoop生态圈。二、hadoop的优势高可靠性 :hadoop底层维护多个数据副本,一般备份3分数据。所以即使hadoop某个计算元素或者存储出
原创 1月前
76阅读
Hadoop基础学习
原创 2021-07-30 16:28:51
217阅读
大数据学习---Hadoop的深入学习
原创 2022-02-21 17:11:35
119阅读
大数据学习---Hadoop的HBase的学习
原创 2022-02-21 17:07:03
237阅读
 一、HDFS 使用基础 格式化配置HDFS文件系统,打开NameNode(HDFS服务器),然后执行  hadoop namenode -format 格式化HDFS后,启动分布式文件系统,  $ start-dfs.sh 找出文件列表中的目录,文件状态,可以传递一个目录或文件名作为参数:  hadoop
转载 2023-11-15 14:47:02
50阅读
hadoop简要教程概述hadoop是apache软件基金会旗下的一个开源分布式计算平台。大数据的特点4v,volume(量大)、variety(种类多)、value(价值密度低)、velocity(处理速度快)云计算因大数据而存在,hadoop连接了大数据和云计算。国内外hadoop的应用现状 yahoo 总节点超过42000,单master节点有4500个节点。总集群量350pbfaceboo
转载 2024-02-22 23:04:09
63阅读
来自:http://www.cnblogs.com/wayne1017/archive/2007/03/18/668768.html 这里先大致介绍一下Hadoop.     本文大部分内容都是从官网Hadoop上来的。其中有一篇介绍HDFS的pdf文档,里面对Hadoop介绍的比较全面了。我的这一个系列的Hadoop学习笔记也是从这里一步一步进行下来的,同时又参
转载 2011-09-08 14:46:47
467阅读
今天从一朋友那里看到一本书,就是hadoop,感觉还不错,准备着手去做,贵在尝试。哈哈。有愿意一道和我做这块的朋友可以留言。
原创 2015-05-18 12:53:06
505阅读
开始学习Hadoop
转载 精选 2016-05-16 12:50:19
369阅读
大数据实时计算工程师/Hadoop工程师/数据分析师职业路线图 描述本路线图是一个专门针对大数据实时处理、Hadoop工程师和数据分析师所设计的课程体系介绍,在实时计算方向主要包括了从数据收集框架、集群协调框架、数据缓存框架到实时计算框架都全面进行深度解析,让一个普通的开发人员迅速成为实时计算领域的
转载 2019-01-25 09:32:00
149阅读
2评论
随着计算机网络基础设施的完善,社交网络和电商的发展以及物连网的推进,产生了越来越多的大数据,使得人工智能最近几年也有了长足的发展,大数据的存储和处理也越来越重要,国家对此也比较重视,学习大数据和人工智能的人也越来越多,Hadoop是目前世界上最流行的分布式数据处理框架,是大数据学习必学的框架知识。初学Hadoop,最基础的也就是HDFS和Mapreduce了,HDFS是一个分布式存储文件系统,Ma
原创 2018-11-15 14:22:38
226阅读
第一章:初识Hadoop 第二章:更高效的WordCount 第三章:把别处的数据搞到Hadoop上 第四章:把Hadoop上的数据搞到别处去 第五章:快一点吧,我的SQL 第六章:一夫多妻制 第七章:越来越多的分析任务 第八章:我的数据要实时 第九章:我的数据要对外 第十章:牛逼高大上的机器学习经常有初学者在博客和QQ问我,自己想往大数据方向发展,该学哪些技术,学习路线是什么样的,觉得大数据很火
========================Apr.13th, 2012======================== 1. Why do we use Hadoop? 1)Stripped to its core, the tools of that Hadoop provides for building distributed systems - for data stora
原创 2012-04-14 00:01:24
784阅读
概述:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throu
转载 精选 2015-12-19 14:09:27
588阅读
Hadoop hadoop-1.2.1.tar.gz jdk-6u32-linux-x64.binUseradd  -u 900 hadoopMv jdk1.6.0_32  /home/hadoopMv hadoop-1.2.1.tar.gz/home/hadoopChown hadoop.hadoop /home/hadoop -RSu -hadoopLn -s j
原创 2016-09-18 19:12:33
569阅读
# 学习Hadoop框架 Hadoop是一个由Apache基金会开发的开源框架,用于分布式存储和处理大规模数据集。它提供了一个可靠的、高性能的分布式计算环境,可以处理数千台服务器上的PB级数据。 ## 为什么学习Hadoop框架 随着大数据时代的到来,越来越多的企业和组织需要处理海量的数据。Hadoop框架可以帮助我们有效地管理和分析这些数据,提取有价值的信息。学习Hadoop框架可以让我们
原创 2024-06-16 04:13:53
42阅读
# Docker 学习Hadoop Docker 是一种轻量级容器技术,可以帮助开发者更快速地构建、打包和部署应用程序。而Hadoop则是一个开源的分布式计算平台,用于存储和处理大规模数据。 在本文中,我们将介绍如何使用Docker学习Hadoop,并提供代码示例来帮助读者更好地理解。 ## Docker安装与配置 首先需要安装Docker,我们可以在官方网站上找到适合自己操作系统的安装方
原创 2024-07-02 05:57:38
25阅读
# Hadoop学习路线 ## 整体流程 | 步骤 | 描述 | | -------- | -------- | | 1 | 安装Hadoop | | 2 | 学习Hadoop基础知识 | | 3 | 开发Hadoop应用程序 | | 4 | 调试和优化Hadoop应用程序 | | 5 | 部署和运行Hadoop应用程序 | ## 步骤详解 ### 步骤1:安装Hadoop 首先,你需要
原创 2023-12-20 06:36:01
68阅读
  • 1
  • 2
  • 3
  • 4
  • 5