1.基本环境:操作系统: Centos 7.2.1511jdk环境版本:jdk-8u45-linux-x64.rpmmysql环境:rpm包:http://ftp.ntu.edu.tw/MySQL/Downloads/MySQL-5.6/MySQL-5.6.33-1.linux_glibc2.5.x86_64.rpm-bundle.tarjdbc链接包:http://10
原创
2016-12-09 15:47:52
7423阅读
点赞
问题:在部署到如下测试hue数据连接状态时,报Error loading MySQLdb module: libmysqlclient_r.so.16: cannot open shared object file: No such file or directory查看scm-server的日志中有错误tail -f /opt/cm-5.8.3/log/cloudera-scm-server/c
原创
2016-12-29 17:37:18
8612阅读
点赞
1评论
CDH-cdh5.8.3离线安装--Mysql5.7二进制部署1.检查系统是否有安装过的mysql,需要卸载干净#rpm -qa|grep -i mysqlmysql-server-5.1.71-1.el6.x86_64mysql-5.1.71-1.el6.x86_64mysql-devel-5.1.71-1.el6.x86_64qt-mysql-4.6.2-26.el6_4.x86_64mysq
原创
2016-12-29 20:39:21
2946阅读
flinkcdc抽取oracle数据直接上代码package flinkcdc;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.TableResult;
import org.apache.flink.table.api
转载
2024-06-19 07:32:55
134阅读
建立和分析java程序和oracle数据库交互的两种方法。 第一种应该是比较古老的方法了。 Windows下采用JDBC-ODBC Bridge连接oracle数据库 1、 安装oracle客户端程序,在tnsnames.ora中配置好相应的数据库连接串文件,此处设连接串名为“dbora”。 2、 在windows的控制面板->“数据库源ODBC”中,建立相应的用户或者系统D
转载
2023-05-18 12:29:18
113阅读
【一】Cloudera Manager 安装 一\\系统环境准备(三台机器server1,
原创
2022-11-07 08:36:45
724阅读
点赞
1、Apache Hadoop 不足之处 • 版本管理混乱 • 部署过程繁琐、升级过程复杂 • 兼容性差 • 安全性低 2、Hadoop 发行版 • Apache Hadoop • Cloudera’s Distribution Including Apache Hadoop(CDH) • Hort
转载
2019-06-04 16:23:00
204阅读
1、Apache Hadoop 不足之处 • 版本管理混乱 • 部署过程繁琐、升级过程复杂 • 兼容性差 • 安全性低 2、Hadoop 发行版 • Apache Hadoop • Cloudera’s Distribution Including Apache Hadoop(CDH) • Hort
转载
2021-01-13 15:08:00
238阅读
2评论
/usr/share/cmf/uninstall-cloudera-manager.sh
原创
2022-09-05 15:06:34
202阅读
MapReduce跑得慢的原因MapReduce程序的效率瓶颈在于两个方面:一、 计算机性能CPU、内存、磁盘健康、网络二、 I/O操作数据倾斜map和reduce数量设置不合理reduce等待时间过久小文件过多大量不可拆分的超大文件spill次数过多merge次数过多我们优化的重点是I/O操作MapReduce优化方法一、数据输入合并小文件:在执行mr任务前将小文件进行合并,因为大量的小文件会产
转载
2024-03-05 14:54:08
44阅读
转自:http://blog.51cto.com/teacheryan/1912116 本文介绍如何搭建cloudera manager去接入已有hadoop组件(cdh)。一、下载必备文件:1.cloudera manager:http://archive-primary.cloudera.com/cm5/cm/5/大部分公司内大数据集群环境都无公网访问权限,针对当前集群系统环境和想要
CDH6.2离线安装(整理版)1.概述 CDH,全称Cloudera's Distribution, including Apache Hadoop。是Hadoop众多分支中对应中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,提供了Hadoop的核心(可扩展存储、分布式计算),最为重要的是提供基于web的用户界面。CDH的优点:
转载
2023-12-12 09:05:30
116阅读
一 docker部署cdh-5.x cloudera/quickstart cloudera/clusterdock 二 docker部署cdh-6.x cdh安装包下载docker拉取centos7镜像 docker pull centos:7.7.1908启动docker container 2.1 设置网桥 docker network create --subnet=172.18.0.0/
转载
2023-10-13 15:36:59
185阅读
目录一、CDH介绍二、为什么选择CDH?三、CDH的版本选择 四、安装准备1.节点准备2.节点规划3.下载parcels文件4.tarball下载5.准备以下内容:五、系统初始化1.关闭防火墙(3个节点)2.配置主机名(3个节点)3.修改hosts文件(3个节点)4.配置免密登录(3个节点)5.安装JDK(3个节点)6.检查Python版本(3个节点)7.检查服务器之间的时间是否同步(3个节点)
转载
2023-10-18 16:33:08
146阅读
点赞
第一步:下载对应的HBase的安装包 所有关于CDH版本的软件包下载地址如下 http://archive.cloudera.com/cdh5/cdh/5/ HBase对应的版本下载地址如下 http://archive.cloudera.com/cdh5/cdh/5/hbase-1.2.0-cdh5.14.0.tar.gz第二步:压缩包上传并解压 cd /export/softwares rz+
转载
2023-11-27 16:59:04
99阅读
安装环境如下:操作系统:CentOs 6.5Hadoop 版本:cdh-5.3.0
Spark 版本:cdh5-1.2.0_5.3.0
1. 安装首先查看 Spark 相关的包有哪些: $ yum list |grep spark
spark-core.noarch 1.2.0+cdh5.3.0+364-1.cdh5.3.0.p0.36.el6 @cdh
spar
转载
2023-08-08 12:27:57
177阅读
一、Hadoop大数据平台1、Hadoop 发行版(1) 完全开源的原生的Apache Hadoop(2) Cloudera与Hortonworks公司的CDH和HDP:在Cloudera和Hortonworks合并后,Cloudera公司推出了新一代的数据平台产品CDP Data Center(以下简称为CDP),从2021年1月31日开始,所有Cloudera软件都需要有效的订阅,并且只能通过
转载
2023-07-21 14:52:25
273阅读
1.硬盘挂载(每台服务器上都操作)1.1 检查阿里云服务器数据盘情况fdisk -l1.2 挂载阿里云数据硬盘fdisk /dev/vdb输入"fdisk /dev/vdb",然后根据下图的提示,输入n,p,1,回车,回车,wq,保存退出。 完毕之后输入fdisk -l1.3 格式化分区及挂载目录1.3.1 格式化挂载数据硬盘分区mkfs.ext3 /dev/vdb11.3.2 创建目录挂载如果我
转载
2023-11-02 14:55:59
116阅读
云技术新兴的概念太多,让我们无法使用,这里说一下什么是CDHCDH版本衍化hadoop是一个开源项目,所以很多公司在这个基础进行商业化,Cloudera对hadoop做了相应的改变。Cloudera公司的发行版,我们将该版本成为CDH(Cloudera Distribution Hadoop)。截止目前为止,CDH共有5个版本,其中,前两个已经不再更新,最近的两个,分别是CDH4和Apache
转载
2023-07-19 15:16:54
102阅读
windows配置单机spark环境背景介绍:把python代码修改为pyspark,并在CDH集群上运行。 整个工作的流程大致如下:windows单机python代码,包括探索性数据分析、特征提取以及模型训练。在windows上配置PySpark环境,并将python代码改为pyspark配置CDH集群的python环境,提交测试在Spark集群上训练模型,以及模型工程化做预测本文主要介绍第二部
转载
2023-06-30 21:50:13
179阅读