一:系统版本二:部署环境节点名称IP部署组件及版本配置文件路径机器CPU机器内存机器存储 Ldap10.10.10.111self-service-password:latestphpldapadmin:latestopenldap:latestopenldap:/data/openldap/configphpldapadmin(只是web管理界面,数据依托openldap)self-servic
开启集群start-dfs.sh关闭集群stop-dfs.shstop-all.sh 全部关闭三种Shell命令方式:hadoop fs适用于任何不同的文件系统,比如本地文件系统和HDFS文件系统。hadoop dfs 和 hdfs dfs用法相同,只能适用于HDFS文件系统。hadoop常用命令创建创建目录# –mkdir # 创建目录 hdfs dfs –mkdir /文件递归创建# -mkd
HDCP是High-bandwidth Digital Content Protection的缩写,中文可称作“高带宽数码内容保护”。HDCP技术是由好莱坞与半导体界巨人Intel合作开发,它可以实际运用在显卡、DVD播放机等传输端,以及显示器、电视机、投影机的接收端之间。是高清电影、电视节目的重要反盗版技术,不支持HDCP协议的显示器无法正常播放有版权的高清节目。 HDTV(高清电视)时代即将来
从零搭建生产Hadoop集群(三)——CDH集群搭建一、概述二、硬件检查与系统配置1.硬件检查1)检查内存2)检查所有磁盘挂载。将noatime参数写入/etc/fstab,并remount所有数据盘。3)检查磁盘读写4)检测网卡设置5)检测路由6)检查系统版本2.系统配置1)配置hostname与/etc/hosts(所有节点)设置hostname设置/etc/hosts2)所有节点安装SSH
转载 2023-07-04 14:54:50
40阅读
 闲在家中实在无聊,决定开始做毕业设计 hadoop:关于hadoop的资料网上有不少,但是书不多,只有本《hadoop权威指南》,我看过一点书评,据说翻译的很差,后来还是选择阅读原版书籍。(慢慢看还是看到懂的哈) 介绍:Hadoop got its start in Nutch. A few of us were attempting to build an ope
转载 2023-07-24 14:25:17
34阅读
第1章 Hadoop概述第1章 Hadoop概述1.1 Hadoop是什么1.2 Hadoop优势(4高)1.3 Hadoop 组成(面试重点)1.3.1 HDFS架构概述1.3.2 YARN 架构概述1.3.3 MapReduce架构概述1.3.4 HDFS、YARN、MapReduce 三者关系1.4 大数据生态体系1.5 推荐系统框架图 第1章 Hadoop概述1.1 Hadoop是什么H
转载 2023-08-18 19:24:49
87阅读
spark默认会使用基于derby数据库存储元数据的hive,数据文件存储位置由spark.sql.warehouse.dir参数指定(默认为当前目录)。 比如当我们在/spark/目录下调用spark-shell,并且用Dataset的saveAsTable方法持久化一个表后。会发现在/spark目录下多出了:一个文件:derby.log,记录了derby数据库相关日志信息;一个目录:metas
转载 2023-08-24 19:25:45
184阅读
基于虚拟机搭建hdp集群,以下是我搭建集群的虚拟机环境说明一.环境预配置参照官网配置步骤:1. 配置hosts与主机名vim /etc/hosts # 添加以下内容(三台) 192.168.127.121 hadoop121 192.168.127.122 hadoop122 192.168.127.123 hadoop123 设置主机名 hostnamectl set-hostname had
转载 2023-07-12 10:11:33
159阅读
java安装 1.java解压安装 cd /opt tar -zxvf jdk1.8.0_181.tar.gz 2.编辑环境变量配置 vim /etc
原创 2023-06-01 13:05:48
323阅读
https://pan.baidu.com/s/128oj8lq6WSu8Uu8PTu3evg2y94
原创 2023-01-16 08:05:02
56阅读
# Docker和HDP科普指南 ## 介绍 在大数据处理领域中,Apache Hadoop是一个非常流行的开源框架。它提供了一种可靠的、可扩展的分布式计算和存储解决方案。然而,搭建和管理Hadoop集群可能会变得非常复杂,特别是对于那些刚开始接触Hadoop的人来说。这就是为什么Docker与Hadoop分布式处理(HDP)结合的原因。 Docker是一个容器化平台,它可以将应用程序及其所
原创 2023-09-29 13:00:05
31阅读
常见版本不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)、Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)、Hortonworks版本(Hortonworks Data Platform,简称“HDP”),对于国内而言,绝大多数选择CDH版本,
转载 2023-09-23 13:16:14
127阅读
HDP安装教程,ambari安装教程,大数据平台安装教程1.环境准备1.安装centos7系统1.使用vmware安装centos系统,略 HDP 环境安装配置HDP : Hortonworks Data PlatformCDH : Cloudera Distribution Hadoop部署安装主要分为3大部分准备环境、配置机器、准备离线包、本地仓库、数据库等安装Ambari Server 阶段
转载 2024-05-05 14:04:18
98阅读
Spark是一个通用的大规模数据快速处理引擎,一个大数据分布式处理框架。Spark之所以能被迅速的应用到各种大数据处理场景下,与其为Batching processing,Streaming Processing,Ad-hoc Query等三大大数据处理问题提供了近乎完美的解决方案息息相关。在Spark中,使用Spark SQL,Spark Streaming,MLlib,Graphx很好的解决了
转载 6月前
9阅读
## HDP 架构 HDP(Hortonworks Data Platform)是一种基于Apache Hadoop的数据处理和分析平台。它提供了一套完整的工具和组件来处理、存储和分析大数据。本文将介绍HDP的架构和一些常用的组件。 HDP架构的核心是Apache Hadoop,它是一个开源的分布式数据处理框架。Hadoop主要由两个部分组成:Hadoop分布式文件系统(HDFS)和MapRe
原创 2023-08-29 07:38:39
114阅读
(官方文档整理)系统级调优1.保证充足的RAM 2.64位的操作系统 3.Linux的swappiness设置为0 : sysctl vm.swappiness=10 vim /etc/sysctl.conf 加上 vm.swappiness=0网络级调优当集群的扩容的时候,应该同时注意交换机的硬件资源也能够跟上。Java GC 调优Long GC pauses 由GC导致的长时间的进程停滞,
一、服务器集群规划与安装建议Ambari-Server单独安装在一台配置较低服务器,方便用于管理,且他不作为hadoop集群中的一台,这样有利用管理,是否配置FQDN等信息。如果FQDN域名信息为bigdata.local则各个机器名为hadoop79.bigdata.local,可以不配置,如果配置在/etc/hosts中配置。服务器IP功能规划()描述说明10.99.67.79(hadoop7
原创 2022-10-18 14:22:20
2255阅读
1)安装HDP时,如果打印如下错误信息:[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:579)是由于系统的python版本过高,导致验证ssl失败,将python降级为2.7.5以下或修改每个安装节点的python证书验证配置文件,执行以下命令修改:$ sed -i 's/verify=platform_def
转载 2023-08-29 17:52:23
297阅读
常见问题解惑,不看后悔
原创 2021-07-05 14:13:01
592阅读
引入        在刚开始接触着色器语言时,我就考虑过这样的问题:        (1) 场景中如果有多个光源,它们对物体颜色的贡献应该以怎样的方式叠加在一起?        (2) 如果所有光源贡献的总和超过了1,颜色强弱细节将会丢失,呈现单一的白色。应用程序有没有办法避免这
转载 2024-07-18 08:26:10
54阅读
  • 1
  • 2
  • 3
  • 4
  • 5