1、 前面在伪分布模式下已经创建了一台机器,为了统一命名,hostname更名为hadoop01、然后再克隆2台机器:hadoop02、 hadoop03;将第一台机器hadoop01上的伪分布停止,创建一个新目录,重新安装hadoop,解压后,再分发到其他两台机器,具体按下面的步骤操作。2、 服务器功能规划hadoop01hadoop02hadoop03192.168.100.129192.16
转载 2023-07-20 23:24:36
196阅读
文章目录一、学前必备知识二、Hadoop HDFS 命令1、HDFS 常用命令总览2、创建与查看 HDFS 目录3、本地计算机和 HDFS 间的文件复制4、复制与删除 HDFS 文件5、查看 HDFS 文件内容6、对比 hdfs dfs三、Java 操作 HDFS1、前置工作2、示例代码  一、学前必备知识2021年 全网最细大数据学习笔记(一):初识 Hadoop2021年 全网最细大
转载 2023-08-15 19:37:12
66阅读
文章目录​​1.准备工作​​​​2.开始安装​​​​获取hadoop安装包​​​​官方文档​​​​修改环境变量​​​​修改配置文件​​​​3.格式化HDFS​​​​4.开启HDFS​​​​关闭防火墙 并永久关闭(关闭开机自启)​​ 1.准备工作创建一个LInux虚拟机并安装CentOS6.9的镜像配置网卡信息安装JDK1.8在/root目录下创建两个文件夹software --> hado
原创 2021-12-23 15:33:30
2353阅读
文章目录1.准备工作2.开始安装获取hadoop安装包官方文档修改环境变量修改配置文件3.格式化HDFS4.开启HDFS关闭防火墙 并永久关闭(关闭开机自启)1.准备工作创建一个LInux虚拟机并安装CentOS6.9的镜像配置网卡信息安装JDK1.8在/root目录下创建两个文件夹software --> hadoop安装包上传位置app --> ha...
原创 2022-02-16 16:03:03
784阅读
教程 | Hadoop集群搭建和简单应用
原创 2021-07-07 13:03:18
297阅读
任务一:虚拟机安装任务二:Linux系统安装Hadoop是一个开源的、可运行与Linux集群上的分布式计算平台,用户可借助Hadoop存储和分析大数据。本项目包含的任务有基础环境的配置(虚拟机安装、Linux安装等),Hadoop集群搭建、验证。任务一:虚拟机安装(1)VMware Workstation(本课程使用该软件):https://pan.baidu.com/s/1izck7kVLcPS
转载 2023-07-19 13:23:13
119阅读
本讲通过实验的方式讲解Hadoop文件系统的操作。“云计算分布式大数据Hadoop实战高手之路”之完整发布目录首先我们看一些比较常用的Hadoop文件系统的操作命令:第一个常用命令:hadoop fs –ls例如使用以下命令是列出文件系统根目录下的文件和文件夹,具体效果如下图所示:  第二个常用命令:hadoop fs –mkidr例如使用以下命令是在HDFS中的根目录下创建一
转载 2023-05-22 09:12:06
186阅读
大数据从入门到实战 - 第2章 分布式文件系统HDFS第1关:HDFS的基本操作任务描述本关任务:使用Hadoop命令来操作分布式文件系统。编程要求在右侧命令行中启动Hadoop,进行如下操作。在HDFS中创建/usr/output/文件夹;在本地创建hello.txt文件并添加内容:“HDFS的块比磁盘的块大,其目的是为了最小化寻址开销。”;将hello.txt上传至HDFS的/usr/outp
转载 2023-08-09 20:52:42
349阅读
    上一篇文章,博主为大家分享了hadoop的安装以及集群的启动,本篇博客将带领小伙伴们一起来感受下hadoop命令和Linux命令的使用有什么不同。    一、首先,启动hadoop集群,执行脚本sh start-dfs.sh;sh start-yarn.sh    二、浏览器中查看dfs中的文件目录(此时文件为空),对应的到h
转载 2023-09-26 15:52:04
70阅读
第三章、Hadoop基础操作目录结构:1.查看Hadoop集群的基本信息    1.1 查询集群的存储系统信息    1.2 查询系统的计算资源信息2.上传文件到HDFS目录    2.1 了解HDFS文件系统    2.2 掌握HDFS的基本操作  &nbs
转载 2023-07-28 18:39:31
393阅读
安装centos,配置stable ip address,文件系统,根目录用户密码,hostname,安装相关工具打开centos,创建hadoop用户,密码。配置eth0,onboot=YES, 重启网卡。关闭iptables,selinux,安装vsftpd安装辅助工具:flashfxp,secureCRT。vsftp上传 JDK 和 Hadoop。安装JDK,检测。配置SSH,实现maste
转载 2023-05-23 17:30:59
123阅读
Hadoop简介Hadoop是Apache旗下的一套开源分布式计算平台。 应用范围:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理。 核心组件:HDFS(分布式文件系统)高容错性、高伸缩性等允许用户将Hadoop部署在低廉的硬件上YARN(运算资源调度系统)MAPREDUCE(分布式运算编程框架)允许用户在不了解分布式系统细节情况下开发并行应用程序。准备Linux环境虚拟机克隆
转载 2023-09-01 10:09:50
132阅读
MapReduce处理大数据集的过程是把大数据集分解成为成百上千个小数据集,每个数据集分别由整个HDFS集群中一个节点进行处理并生成中间结果,然后将这些中间结果又由大量的节点合并,形成最终结果。其原理是1、数据的分布式存储HDFS和普通的文件系统一据,每一份Block还会复制成数份数据存储到不同的DataNode上,而NameNode成为整个HDFS的核心,它通过维护一些数据结构来记录每一个文件被
# Hadoop 简单认证概述 Hadoop 是一个开源的分布式计算框架,广泛应用于处理大规模数据。在大数据环境中,数据安全性尤为重要,尤其是在集群环境中。因此,Hadoop 提供了多种认证方式,其中简单认证是最基础的一种。 ## 什么是简单认证? 简单认证是指一种基于用户名和密码的身份验证方式。它适用于小型集群或开发环境。虽然简单认证并不提供强认证机制,但对于初学者和小型项目,它能够提供基
原创 9月前
148阅读
实验目的要求 目的:(1)掌握数据仓库工具Hive的使用;要求:掌握数据仓库Hive的使用;能够正常操作数据库、表、数据;          实验环境         五台独立PC式虚拟机;主机之间有
从数据爆炸開始。。。 1.1 第三次工业革命 第一次:18世纪60年代。手工工厂向机器大生产过渡,以蒸汽机的发明和使用为标志。 第二次:19世纪70年代。各种新技术新发明不断被应用于工业生产,以电力的发明使用为标志。 第三次:20世界四五十年代末。以高新技术为代表的新科学技术革命,以原子能、航天技术
转载 2017-06-20 20:44:00
126阅读
2评论
毕业前就听说了Hadoop,今天突然想了解一下。在网上搜集一些关于Hadoop的介绍,顺便把它整理一下,发在博客上和网友分享,高手勿喷。 一个分布式系统基础架构。由Apache基金会开发。用户能够在不了解分布式底层细节的情况下。开发分布式程序。充分利用集群的威力快速运算和存储。Hadoop实现了一个
转载 2017-07-31 14:12:00
228阅读
2评论
1. 获取微信小程序的 AppID登录 https://mp.weixin.qq.com ,就可以在网我们还需要操作“绑定开发者”。即在“用户身份”-“开发者”模块,绑定上需要体验该小程序的微信号。本教程默认注册帐号...
原创 2022-10-31 17:17:23
85阅读
菜鸟教程Shell script学习笔记(下)以下内容是学习菜鸟教程之shell教程,所整理的笔记Shell流程控制和Java、PHP等语言不一样,sh的流程控制不可为空,如(以下为PHP流程控制写法):<?php if (isset($_GET["q"])){ search(q); } else { //不做任何事情 } #在sh/bash里不可以这么写,如果else分支没
转载 2024-07-16 14:11:46
45阅读
MapReduce的补充:完整的Map/Reduce的作业过程会把输入的数据分成很多独立的块,Map任务以完全独立的方式来处理他们,Map处理后的中间结果会被排序,然后分组进入到Reduce任务中,作业的输入输出都会放在文件系统中,Map/Reduce框架和HDFS运行在相同的节点,那么计算和存储操作都会在同一个节点上面进行。Master负责把任务指派给Slave,Slave只负责执行Maste
  • 1
  • 2
  • 3
  • 4
  • 5