由于最近需要使用Spring boot整合Hadoop的HDFS,但是在整合的过程遇到了很多问题,网上也没有现成教程,都是自己摸索出来的,配置了很久都没能把项目搭建出来,希望对大家有帮助。使用Spring boot整合HDFS主要是为了从数据库获取List,将List数据生产CSV文件,导入到HDFS进行机器学习。本文主要讲解如何整合成功和如果将List数据变成CSV文件存进HDFS当中。简单整理
转载
2023-10-09 08:13:44
247阅读
第一步:编码过程项目结构:pom.xml 依赖jar文件:<!-- mapreduce 核心jar包 -->
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-core</artifactId&
转载
2024-06-03 10:30:11
1294阅读
代码:package com.hadoop.reduce.model;
import org.apache.hadoop.io.Writable;
import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;
/**
* 订单商品对象
* @author linhaiy
* @date
转载
2024-03-05 04:32:00
59阅读
本文讲的是利用 Spring Boot 在 Docker 中运行 Hadoop,
【编者的话】Spring Boot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spring应用的初始搭建以及开发过程。本文介绍了如何利用Spring Boot在Docker中运行Hadoop任务。 简介 越来越多的应用都开始使用Hadoop框架。而开发者在使用过程中也遇到一些挑战,比如使用
转载
2023-08-18 13:46:27
221阅读
(1)在Spring Boot/Spring Cloud项目中添加以下依赖: <!-- Apache Hadoop -->
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactI
转载
2024-04-19 18:17:25
49阅读
前提:1.连接hadoop需要本地安装 winutils.exe 并在程序指定,不然程序会报错 IOException: HADOOP_HOME or hadoop.home.dir are not set. 但不指定程序可能启动。 2.要在springboot容器启动后再初始化页面,否
转载
2023-07-09 01:41:38
267阅读
用eclipse连接集群查看文件信息提示9000port拒绝连接的错误
Cannot connect to the Map/Reduce location: hadoop1.0.3
Call to ubuntu/192.168.1.111:9000 failed on connection exception: java.net.ConnectException: 拒绝连接1.
转载
2023-09-14 08:20:04
216阅读
第一次写Blog。数据库(NoSql),现在想使用Hadoop对数据库的数据进行处理,涉及到数据库的连接,及相关的CRUD操作。所以,要实现一个Hadoop的连接器。类似于Mongodb,连接到数据库,需要先得到数据库对象db,然后得到数据库的collectionSpace,再得到collection,然后,就可以进行数据的读取与写入操作。元数据都是用BSON/JSON结构。下面进入Hadoop连
转载
2024-07-30 15:43:21
54阅读
最近公司让我搭建64位的集群,我重新编译了一下hadoop的源码,并部署环境。在这个过程中遇到了一些问题:问题1:hdfs-site.xml文件的配置问题,在配置 <property>
<name>dfs.namenode.name.dir</name>
<value>file:///home/grid/
转载
2023-07-12 11:34:04
75阅读
这里写自定义目录标题 一、背景 以前用spring单独整合过Dubbo+zookeeper,因为用springboot已经好长时间,而且配置也方便,想着重新用springboot整合下Dubbo+zookeeper;各种心酸,因为一个注解的问题导致消费者无法注册到Dubbo中,心累!后面会提到的。 二、前期准备 1.zookeeper安装下载地址:链接:https://pan.baid
转载
2024-01-04 09:03:29
37阅读
在服务器上搭建了hadoop的伪分布式环境。大神的博客上是使用eclipse来调试,但是我入门以来一直用的是idea,eclipse已经不习惯,于是便摸索着配置了idea远程调试hadoop的环境。步骤一:下载与服务器上的hadoop同版本的hadoop安装包,我下载的是hadoop-2.7.7.tar.gz,下载后解压到某个目录,比如D:\Software\hadoop-2.7.7,
转载
2023-07-12 11:34:19
93阅读
大数据Hadoop 二一、Xshell安装(以Xshell5)为例1、安装前准备(前一篇文章有下载连接)2、打开xshell5_5.0332.exe安装Xshell二、FileZilla安装1.打开FileZilla_3.47.2.1_win64-setup.exe安装FileZilla三、通过Xshell连接虚拟机master(开启状态下)1、查看master的IP地址a) 使用root用户登
转载
2023-10-24 11:20:15
119阅读
# 如何实现“hadoop springboot”
## 一、整体流程
```mermaid
flowchart TD
A(了解需求) --> B(安装Hadoop)
B --> C(编写SpringBoot应用)
C --> D(连接Hadoop)
D --> E(实现功能)
```
## 二、详细步骤
### 1. 了解需求
在开始之前,首先要明确具体
原创
2024-04-29 05:27:08
30阅读
Hadoop是一个分布式的文件系统(HDFS),由很多服务器联合起来实现其功能,集群中的服务器有各自的角色,用于存储文件通过目录树来定位文件。 HDFS集群包括,NameNode、DataNode、Secondary Namenode: (1)NameNode:负责管理整个文件系统的元数据,以及每一个路径(文件)所对应的数据块信息。 (2)DataNode:负责管理用户的文件数据块,每一个数据块都
转载
2023-09-24 19:25:33
1644阅读
到官网下载eclipse,这里我下载2021-6版本的eclipse,网站https://www.eclipse.org/downloads/packages/(2)解压刚刚下载好的eclipse压缩包,可以到文件夹中双击带有一个大齿轮图片文件名为eclipse的文件来启动安装程序也可以通过shell命令执行eclipse-init文件来安装,如下图:(3)安装选择java Developers选
转载
2023-11-11 23:57:39
68阅读
首先打开虚拟机centos以及他的三个克隆机,并打开xshell连接到这四台虚拟机。 到此就已成功打开和连接。然后在xshell中连接的主机centos7上输入如下命令打开集群:(一条一条的输入)cd /opt/hadoop-3.1.4/sbin
./start-dfs.sh
./start-yarn.sh
./mr-jobhistory-daemon.sh start historys
转载
2023-09-17 13:23:01
215阅读
目录一.前言二.hive的启动与连接2.1 启动hadoop2.2 启动hive2.3 一些注意事项一.前言 太久没用hive了,今天想重新熟悉一下,结果发现自己甚至忘记了怎么启动。。于是特此记录篇笔记,便于以后忘记时查阅,不会写的太细。 &nbs
转载
2023-09-01 08:40:37
183阅读
目录一、概述二、EFAK kafka鉴权配置(zookeeper无鉴权)1)kafka Kerberos 鉴权 配置1、启动zookeeper服务2、启动kafka服务3、配置EFAK4、把配置copy到几个节点5、启动EFAK服务6、测试验证2)kafka 账号密码鉴权 配置1、启动zookeeper服务2、启动kafka服务3、配置EFAK4、把配置copy到几个节点5、启动EFAK服务6、测
转载
2023-12-13 21:49:37
147阅读
目录一、概述(1)大数据的发展历程(2)大数据的特征及核心工作内容(3)常见的大数据技术框架及其负责的场景二、Apache Hadoop三、Hadoop HDFS部署(1)分布式的基础架构(2)HDFS的基础架构(3)Vmware Workstation部署HDFS集群(4)云服务器上部署HDFS集群四、Hadoop HDFS的Shell操作(常见命令)(1)进程的启停管理(2)文件系统操作命令五
转载
2024-08-02 13:53:26
42阅读
服务器环境:hadoop2.7.3集群、zookeper3.4.10集群、hbase1.2.5集群 测试环境:windows10、spring tool suite(STS)一、测试前准备1、由于是在windows连接Hbase,而hbase是依赖于hadoop的,所以我们需要下载hadoop的二进制包,这里我仅提供2.7.3版本的。下载地址:百度网盘-链接不存在 提取码:v
转载
2023-10-10 14:13:27
57阅读