什么是hadooop,什么是hadoop-ha(高可用)hadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。具有可靠、高效、可伸缩的特点。Hadoop的核心是YARN,HDFS和Mapreduce下图是hadoop生态系统,集成spark生态圈。在未来一段时间内,hadoop将于            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-12 12:32:10
                            
                                58阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            认知和学习Hadoop,我们必须得了解Hadoop的构成,下面通过Hadoop构件、大数据处理流程,Hadoop核心三个方面进行一下介绍:hadoop中有3个核心组件:分布式文件系统:HDFS —— 实现将文件分布式存储在很多的服务器上分布式运算编程框架:MAPREDUCE —— 实现在很多机器上分布式并行运算分布式资源调度平台:YARN —— 帮用户调度大量的map            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-05-22 17:45:04
                            
                                74阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            上传centOS6.7-hadoop-2.6.4.tar.gz
解压 tar -zxvf centOS6.7-hadoop-2.6.4.tar.gz
hadoop相关修改配置
1 修改 /root/apps/hadoop/etc/hadoop  目录下的hadoop-env.sh
vi hadoop-env.sh 中 export JAVA_HOME=${JAVA_HOME}修改为 export            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2018-12-23 19:10:00
                            
                                120阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            hadoop集群安装部署文档一、 系统环境配置1、修改主机名2、添加主机名映射3、创建集群管理用户,设置密码4、分配用户sudo权限5、创建用户文件存放及安装目录6、关闭防火墙7、安装jdk,配置jdk环境变量二、 Hadoop集群搭建1、安装hadoop,配置hadoop环境变量2、修改 hadoop-env.sh 文件3、执行本地模式wordcount案例4、克隆虚拟机5、修改网络配置及主机            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-15 06:23:34
                            
                                63阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            linux 安装 hadoop 单机  大数据            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-11-25 10:54:08
                            
                                158阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            学习目的· 了解大数据的概念及其特征· 了解Hadoop的优势· 掌握Hadoop的生态体系Hadoop作为一个能够对大量数据进行分布式处理的软件框架,用户可以利用Hadoop生态体系开发和处理海量数据。由于Hadoop可靠及高效的处理性能,逐渐成为分析大数据的领先平台。1.1 什么是大数据从字面意思上看,大数据指的是巨量数据。但是,每个人对大数据的理解是不同的,难以有一个准确的定义。最早提出“大            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-27 23:03:36
                            
                                107阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Hadoop的安装、配置、初步使用准备阶段解压本机配置配置第一步第二步第三步第四步第五步第六步环境变量配置格式化启动访问Hadoop简单测试hadoop集群修改配置文件总结  这几天在学习给虚拟机装上hadoop,因为这个过程今后可能将会反复使用,所以开一篇博客专门记录一下整个流程,并汇总其中各种可能会发生的小问题,以及我们应该如何规避。 准备阶段一台虚拟机,装有配置好的 jdk 和 mysql            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-12 19:21:36
                            
                                40阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            第0章大数据概论一、大数据概念大数据:Big Data,指的是无法在一定时间范围内使用常规软进行捕捉,管理和处理的数据的集合。需要新的处理模式来进行决策力。洞察收取海量、高增长和多样化的信息进行管理。二、大数据的特点大量高速多样性低密度值三、大数据的应用场景物流仓储零售旅游商品广告推荐保险金融人工智能…四、大数据的部门组织结构平台组:数据仓储组:数据挖掘:报表工程:第一章Hadoop简介一、什么是            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-25 20:09:02
                            
                                189阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            【简介】(1):HBase是一个分布式的、面向列的开源数据库,一个结构化数据的[分布式存储系统]”。(2):HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。(3):HBase利用Hadoop HDFS作为其文件存储系统;HBase同样利用Hadoop MapReduce            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-24 10:31:37
                            
                                41阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            本文完成了大数据的hadoop的配置及安装            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                            精选
                                                        
                            2019-08-31 16:15:36
                            
                                2919阅读
                            
                                                        
                                点赞
                            
                                                                             
                 
                
                             
         
            
            
            
               接着上一篇,趁着这个势头继续整理!  经常听说大数据,所以hadoop已经可谓如雷贯耳了。 早前曾经对于hadoop进行过一些安装。但是当时基            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-07-06 10:19:34
                            
                                998阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.安装Hadoop(1)准备Linux环境(2)安装JDK(3)配置Hadoop2.准备Linux环境(1)我们用户可能都是使用Windows环境,一般用户都是先安装虚拟机,然后在虚拟机上安装Linux系统,这个这里不推荐。(2)这里我们使用租用云主机方法,比如阿里云、UnitedStack等等。...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2015-09-16 16:47:00
                            
                                114阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            1. 大数据的概念大数据(Big Data):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程  优化能力的海量、高增长率和多样化的信息资产。主要解决,海量数据的存储和海量数据的分析计算问题。1.2 大数据的包含以下4个特点:1.Volume(大量)2.Velocity(高速)3.Variety(多样)4            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-15 14:23:55
                            
                                62阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            MapReduce简介MapReduce是hadoop四大组件之一(HDFS,MapReduce,YARN和Comment),是一种分布式计算编程模型,用于解决海量数据的计算问题。MapReduce思想原理MapReduce采用分而治之的思想,将大文件切割成片,然后由多个map task并行处理,处理完成后交由reduce再做合并,最后输出结果MapReduce执行过程这里我们以经典例子WordC            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-11 09:10:09
                            
                                95阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            大数据在近些年来越来越火热,人们在提到大数据遇到了很多相关概念上的问题,比如云计算、 hadoop等等。那么,大数据是什么、Hadoop是什么,大数据和Hadoop有什么关系呢?  大数据概念早在1980年,著名未来学家阿尔文·托夫勒提出的概念。2009年美国互联网数据中心证实大数据时代的来临。随着谷歌 MapReduce和 GoogleFile System (GFS)的发布,大数据不            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-14 13:16:55
                            
                                60阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            hadoop是什么?Hadoop就是为大数据应运而生、Hadoop 框架是用 Java 编写的、Hadoop是Apache下的子项目、Hadoop是分布式系统基础架构,它主要是用于大数据的处理、Hadoop可以看成是一个平台或者生态系统。Hadoop生态系统包含哪些组件?有分布式存储HDFS,有并行计算 MapReduce,有NoSQL数裾库的HBase,有数据仓库工具 Hive, 有 Pig 工            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-06 20:43:14
                            
                                63阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、什么是大数据,什么是Hadoop        大数据:指无法再一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多元化的信息资产。        数据存储单位:bit<Byte&            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-22 15:39:19
                            
                                64阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.准备Linux环境	1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:192.168.8.0 子网掩码:255.255.255.0 -> apply -> ok 回到windo...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2015-09-22 09:40:00
                            
                                163阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            大数据Hadoop的安装与使用 链接:https://pan.baidu.com/s/12vFNRLPJ9zGA2LTJuIpxJQ 提取码:83fb Vmware的安装:https://..com/cainiao-chuanqi/p/13130663.html 虚拟机的导入:h            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2020-12-03 18:15:00
                            
                                52阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            Hadoop学习笔记01一、大数据概念大数据 大数据(Big Data):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。主要解决问题海量数据的采集存储和分析计算问题特点大量(Volume)高速(Velocity):处理效率多样(Variety):结构化(数据库、文本)/非结构化(音频、视频)低价值密度(Value):数据总量越大,价值密度越低。有用数据提纯二、Hadoop入门            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-24 11:03:43
                            
                                138阅读
                            
                                                                             
                 
                
                                
                    