当前已经进入大数据时代,大数据技术产品百花齐放,在各自的应用场景发挥重要作用,Redis做为高性能的键值数据库与这些技术有着千丝万缕的联系,本文将介绍如何将Redis与Hadoop、ELK等技术进行结合。一、Redis与HadoopHadoop作为大数据时代的分布式计算平台,由于其高可用性、可扩展性、高容错、低成本等特性,已经是大数据系统的标配,但是Hadoop中HDFS的存储机制使得它无法面向
转载 2023-07-13 15:00:19
93阅读
转载 2023-07-07 14:55:33
60阅读
RPC(Remote Procedure Call Protocol)远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。Hadoop底层的交互都是通过 rpc进行的。例如:datanodenamenode 、tasktrackerjobtracker、secondary namenodenamenode之间的通信都是通过rpc实现的。下面是rpc交
转载 2023-07-20 17:36:44
75阅读
 第1章 RHadoop入门第1章讲述了几个与RHadoop基本知识相关的主题,包括:R的安装、功能和数据建模Hadoop的安装、特征组成部分前言已介绍了RHadoop。本章将重点关注了解并使用这两种技术。到目前为止,R主要用于统计分析,但由于功能程序包越来越多,在其他一些领域内,它也很受欢迎,例如机器学习、可视化和数据操作。R不能加载所有数据(大数据)到机器内存。所以,可以选
转载 2023-12-06 19:11:28
58阅读
hadoop的RPC基本概念:1,RPC(Remote Procedure Call Protocol)--远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据。在OSI网络通信模型中,RPC跨越了传输层应用层。RPC使得开发包括网络分布式程序在内的应用程序更加容易。2,had
转载 2023-07-29 18:20:03
68阅读
前言再看本文章之前,请先确保已经看过CentOS下hadoop的分布式搭建和分布式协作服务框架Zookeeper安装部署两篇文章,因为本文章是建立在它们基础之上的。一、HA相关介绍1、为什么出现HA架构Hadoop2.0之前,在HDFS集群中NameNode存在单点故障(SPOF)(也就是namenode单点宕机导致集群不可用的问题)。NameNode主要在以下两个方面影响HDFS集群: Name
转载 2023-07-12 13:49:44
57阅读
Hadoop作为分布式存储系统,各个节点之间的通信交互必不可少,所以需要实现一套节点间的通信交互机制。RPC(Remote Procedure CallProtocol,远程过程调用协议)允许本地程序像调用本地方法一样调用远程机器上应用程序提供的服务,所以Hadoop实现了一套自己的RPC框架。Hadoop RPC框架没有使用JDK自带的RMI,而是基于IPC(Inter Process Com
转载 2023-07-04 15:13:20
119阅读
六、Hadoop1.x与Hadoop2的区别1、变更介绍Hadoop2相比较于Hadoop1.x来说,HDFS的架构与MapReduce的都有较大的变化,且速度上可用性上都有了很大的提高,Hadoop2中有两个重要的变更:l HDFS的NameNodes可以以集群的方式布署,增强了NameNodes的水平扩展能力可用性;l MapReduce将JobTracker中的资源管
转载 2023-07-24 10:50:30
32阅读
HBaserhbase的安装与使用,分为3个章节。环境准备及HBase安装rhbase安装rhbase程序用例每一章节,都会分为”文字说明部分””代码部分”,保持文字说明与代码的连贯性。注:Hadoop环境及RHadoop的环境,请查看同系列前二篇文章,此文将不再介绍。环境准备及HBase安装文字说明部分:首先环境准备,这里我选择了Linux Ubuntu操作系统12.0...
转载 2021-06-09 17:32:54
343阅读
Hadoop RPC分为四部分序列化层:将结构化对象在转为字节流以便通过网络传输或写入持久存储。在RPC框架中,主要用于将用户请求中的参数或者应答转化为字节流以便跨机器传输。函数调用层:定位要调用的函数并执行该函数,Hadoop RPC采用Java反射机制与动态代理实现函数调用。网络传输层:描述Client与Server之间消息传输的方式,Hadoop RPC采用了基于TCP/IP的Socket机
转载 2023-07-12 13:54:26
92阅读
1.hdfs常用基本命令参数支持文件上传,删除,追加,查看,查找。注意不支持文件修改(在集群中数据存储量很大,如果修改成本很大,所以一般不支持修改)命令:   hdfs dfs 查看参数列表(hadoop fs在HDFS中写路径全是绝对路径 常用命令实操1)基本语法[root@bigdata111 ~]# hdfs dfs 具体命令(2)  -ls
转载 2023-07-11 21:57:11
417阅读
文章目录Hadoop1.:elephant:Hadoop集群配置2.集群崩溃处理方案3.配置历史服务器4.配置日志聚集功能2.HDFS的Shell相关操作(开发)1.基础命令2.HDFS的API参数优先级3.JavaAPI操作HDFS编程 Hadoop#基本命令 scp基本语法: 发送:scp -r 要拷贝的文件 用户@主机:路径/ 拖过来:scp -r 用户@主机名:路径(文件名) 拖哪里
转载 2023-07-24 09:09:54
98阅读
R Hadoop 大数据471e0b28932 译者:飞龙 协议:CC BY-NC-SA 4.0 前言 企业每天获取的数据量呈指数增长。现在可以将这些海量信息存储在像 Hadoop 这样的低成 ...
转载 3天前
0阅读
HDFS —集群迁移 Apache Apache 集群间数据拷贝 1 ) scp 实现两个远程主机之间的文件复制 scp -r hello.txt root@hadoop103:/user/atguigu/hello.txt // 推 push scp -r root
# Hadoop 联邦 NameNode DataNode 的配置指南 在大数据处理领域,Hadoop 被广泛使用,它允许用户存储处理大量数据。而其中的 Hadoop 文件系统(HDFS)则是 Hadoop 的一个重要组成部分。要实现 Hadoop 联邦(Federated)架构,涉及多个 NameNode DataNode 的配置。本文将详细介绍如何建立一个具有联邦架构的 Hadoo
原创 10月前
22阅读
在完成一台虚拟机的javahadoop安装后,我们开始要同时部署好其他几台虚拟机。但是一个一个装的话,就非常低效了。所以我们要通过脚本来完成。目前,Hadoop100已经装完了jdkhadoop。其他3台虚拟机完成了网络配置,我们可以通过分发脚本,来为它们安装jdkhadoop。 两种拷贝方式SCP 安全拷贝scp可以实现服务器与服务器之间的数据拷贝。基本语法scp
转载 2023-09-14 13:15:25
68阅读
本文实例讲解的是一般的hadoop入门程序“WordCount”,就是首先写一个map程序用来将输入的字符串分割成单个的单词,然后reduce这些单个的单词,相同的单词就对其进行计数,不同的单词分别输出,结果输出每一个单词出现的频数。注意:关于数据的输入输出是通过sys.stdin(系统标准输入)sys.stdout(系统标准输出)来控制数据的读入与输出。所有的脚本执行之前都需要修改权限,否则没
以此记录自己的笔记,并跟大家分享,还有很多优秀文章,喜欢的话点个关注哦~HadoopHadoopspark参考文献: https://www.zhihu.com/question/32326748/answer/57393279Hadoop是由Apache基金会所开发的分布式系统基础架构Hadoop主要包括:Hadoop分布式文件系统:一个分布式的、面向块的、不可更新的、高度伸缩性的、可运行在集
转载 2023-11-13 19:44:29
52阅读
一、 rsync 远程同步工具rsync主要用于备份镜像。具有速度快、避免复制相同内容支持符号链接的优点。 rsyncscp区别:用rsync做文件的复制要比scp的速度快,rsync只对差异文件做更新。scp是把所有文件都复制过去。 (1)基本语法 rsync -rvl $pdir/$fname $user@hadoop$host:$pdir/$
HDFS 常用shell命令操作-help:帮助-ls: 显示目录信息-mkdir:在hdfs上创建目录-moveFromLocal :从本地剪切粘贴到hdfs-moveToLocal:从hdfs剪切粘贴到本地(尚未实现)–appendToFile :追加一个文件到已经存在的文件末尾-cat :显示文件内容-tail:显示一个文件的末尾-chgrp 、-chmod、-chown:修改文件所属权限
转载 2023-09-24 21:01:57
96阅读
  • 1
  • 2
  • 3
  • 4
  • 5