最近公司让我搭建64位的集群,我重新编译了一下hadoop的源码,并部署环境。在这个过程中遇到了一些问题:问题1:hdfs-site.xml文件的配置问题,在配置 <property>
<name>dfs.namenode.name.dir</name>
<value>file:///home/grid/
转载
2023-07-12 11:34:04
75阅读
第一次写Blog。数据库(NoSql),现在想使用Hadoop对数据库的数据进行处理,涉及到数据库的连接,及相关的CRUD操作。所以,要实现一个Hadoop的连接器。类似于Mongodb,连接到数据库,需要先得到数据库对象db,然后得到数据库的collectionSpace,再得到collection,然后,就可以进行数据的读取与写入操作。元数据都是用BSON/JSON结构。下面进入Hadoop连
转载
2024-07-30 15:43:21
54阅读
用eclipse连接集群查看文件信息提示9000port拒绝连接的错误
Cannot connect to the Map/Reduce location: hadoop1.0.3
Call to ubuntu/192.168.1.111:9000 failed on connection exception: java.net.ConnectException: 拒绝连接1.
转载
2023-09-14 08:20:04
216阅读
大数据Hadoop 二一、Xshell安装(以Xshell5)为例1、安装前准备(前一篇文章有下载连接)2、打开xshell5_5.0332.exe安装Xshell二、FileZilla安装1.打开FileZilla_3.47.2.1_win64-setup.exe安装FileZilla三、通过Xshell连接虚拟机master(开启状态下)1、查看master的IP地址a) 使用root用户登
转载
2023-10-24 11:20:15
119阅读
在服务器上搭建了hadoop的伪分布式环境。大神的博客上是使用eclipse来调试,但是我入门以来一直用的是idea,eclipse已经不习惯,于是便摸索着配置了idea远程调试hadoop的环境。步骤一:下载与服务器上的hadoop同版本的hadoop安装包,我下载的是hadoop-2.7.7.tar.gz,下载后解压到某个目录,比如D:\Software\hadoop-2.7.7,
转载
2023-07-12 11:34:19
93阅读
第1章 R和Hadoop入门第1章讲述了几个与R和Hadoop基本知识相关的主题,包括:R的安装、功能和数据建模Hadoop的安装、特征和组成部分前言已介绍了R和Hadoop。本章将重点关注了解并使用这两种技术。到目前为止,R主要用于统计分析,但由于功能和程序包越来越多,在其他一些领域内,它也很受欢迎,例如机器学习、可视化和数据操作。R不能加载所有数据(大数据)到机器内存。所以,可以选
转载
2023-12-06 19:11:28
58阅读
到官网下载eclipse,这里我下载2021-6版本的eclipse,网站https://www.eclipse.org/downloads/packages/(2)解压刚刚下载好的eclipse压缩包,可以到文件夹中双击带有一个大齿轮图片文件名为eclipse的文件来启动安装程序也可以通过shell命令执行eclipse-init文件来安装,如下图:(3)安装选择java Developers选
转载
2023-11-11 23:57:39
68阅读
目录一.前言二.hive的启动与连接2.1 启动hadoop2.2 启动hive2.3 一些注意事项一.前言 太久没用hive了,今天想重新熟悉一下,结果发现自己甚至忘记了怎么启动。。于是特此记录篇笔记,便于以后忘记时查阅,不会写的太细。 &nbs
转载
2023-09-01 08:40:37
183阅读
首先打开虚拟机centos以及他的三个克隆机,并打开xshell连接到这四台虚拟机。 到此就已成功打开和连接。然后在xshell中连接的主机centos7上输入如下命令打开集群:(一条一条的输入)cd /opt/hadoop-3.1.4/sbin
./start-dfs.sh
./start-yarn.sh
./mr-jobhistory-daemon.sh start historys
转载
2023-09-17 13:23:01
215阅读
目录一、概述二、EFAK kafka鉴权配置(zookeeper无鉴权)1)kafka Kerberos 鉴权 配置1、启动zookeeper服务2、启动kafka服务3、配置EFAK4、把配置copy到几个节点5、启动EFAK服务6、测试验证2)kafka 账号密码鉴权 配置1、启动zookeeper服务2、启动kafka服务3、配置EFAK4、把配置copy到几个节点5、启动EFAK服务6、测
转载
2023-12-13 21:49:37
147阅读
目录一、概述(1)大数据的发展历程(2)大数据的特征及核心工作内容(3)常见的大数据技术框架及其负责的场景二、Apache Hadoop三、Hadoop HDFS部署(1)分布式的基础架构(2)HDFS的基础架构(3)Vmware Workstation部署HDFS集群(4)云服务器上部署HDFS集群四、Hadoop HDFS的Shell操作(常见命令)(1)进程的启停管理(2)文件系统操作命令五
转载
2024-08-02 13:53:26
42阅读
当前已经进入大数据时代,大数据技术和产品百花齐放,在各自的应用场景发挥重要作用,Redis做为高性能的键值数据库与这些技术有着千丝万缕的联系,本文将介绍如何将Redis与Hadoop、ELK等技术进行结合。一、Redis与HadoopHadoop作为大数据时代的分布式计算平台,由于其高可用性、可扩展性、高容错、低成本等特性,已经是大数据系统的标配,但是Hadoop中HDFS的存储机制使得它无法面向
转载
2023-07-13 15:00:19
93阅读
前言再看本文章之前,请先确保已经看过CentOS下hadoop的分布式搭建和分布式协作服务框架Zookeeper安装部署两篇文章,因为本文章是建立在它们基础之上的。一、HA相关介绍1、为什么出现HA架构Hadoop2.0之前,在HDFS集群中NameNode存在单点故障(SPOF)(也就是namenode单点宕机导致集群不可用的问题)。NameNode主要在以下两个方面影响HDFS集群:
Name
转载
2023-07-12 13:49:44
57阅读
hadoop的RPC基本概念:1,RPC(Remote Procedure Call Protocol)--远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据。在OSI网络通信模型中,RPC跨越了传输层和应用层。RPC使得开发包括网络分布式程序在内的应用程序更加容易。2,had
转载
2023-07-29 18:20:03
68阅读
Hadoop作为分布式存储系统,各个节点之间的通信和交互必不可少,所以需要实现一套节点间的通信交互机制。RPC(Remote Procedure CallProtocol,远程过程调用协议)允许本地程序像调用本地方法一样调用远程机器上应用程序提供的服务,所以Hadoop实现了一套自己的RPC框架。Hadoop RPC框架没有使用JDK自带的RMI,而是基于IPC(Inter Process Com
转载
2023-07-04 15:13:20
119阅读
转载
2023-07-07 14:55:33
60阅读
RPC(Remote Procedure Call Protocol)远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。Hadoop底层的交互都是通过 rpc进行的。例如:datanode和namenode 、tasktracker和jobtracker、secondary namenode和namenode之间的通信都是通过rpc实现的。下面是rpc交
转载
2023-07-20 17:36:44
75阅读
环境:Centos 6.9,Hadoop 2.7.1,JDK 1.8.0_161,Maven 3.3.9前言: 1、配置一台master服务器,两台或多台slave服务器。 2、master可以无密码ssh登陆slave 3、解压安装Hadoop,配置hadoop的core-site.xml、hdfs-site.xml、mapre
转载
2023-07-24 14:24:18
78阅读
这两天折腾在eclipse中写hadoop map-reduce jobs,遇到了以下问题:1、无法配置ssh无密码登录2、无法启动hadoop守护进程3、hadoop-0.20.203.0的eclipse插件有问题4、通过eclipse插件连接非本地hadoop伪分布式集群,出现“拒绝连接”5、通过eclipse插件连接非本地hadoop成功后,权限不够、无法提交任务解决如下:环境:ubuntu
转载
2023-10-10 20:31:32
831阅读
1.jdk环境配置1.1 下载一个1.8版本的jdk(如果系统自带1.8版本的话 可以忽略这一条)我提供一个官网的版本 也是我确定可以用的版本:https://www.oracle.com/cn/java/technologies/javase-jdk8-downloads.html 因为我所学的Hadoop只能在jdk 1.8环境下跑,进行远程连接如果jdk版本过高的话是无法成功的,
转载
2024-02-23 11:08:19
72阅读