提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


文章目录

  • 前言
  • 一、GreenPlum是什么?
  • 二、使用步骤
  • 1.环境说明
  • 2.集群介绍
  • 3.修改主机名(root)
  • 4.网络映射(root)
  • 5.创建安装目录
  • 6.安装部署
  • 7.SSH (免密登录)
  • 8.环境配置
  • 9.安装成功
  • 10.使用DBeaver访问
  • 总结



前言

提示:这里可以添加本文要记录的大概内容:

之前学习hadoop为核心的平台,因为和传统数据库差异比较大,所以前段时间学习hadoop,也就是有所理解入门,虽然它扩展性强,成本低,开源生态优势,但是也出现兼容性差,查询性能不足,架构复杂等问题。最近发现了以GreenPlum为代表的MPP架构分布式关系型数据库出现,开源架构也没hadoop那么复杂,也能满足企业的分布式数据库和数据分析,GreenPlum和hadoop有些地方挺相似的


提示:以下是本篇文章正文内容,下面案例可供参考

一、GreenPlum是什么?

Greenplum主要由Master节点、Segment节点、interconnect三大部分组成。Greenplum master是Greenplum数据库系统的入口,接受客户端连接及提交的SQL语句,将工作负载分发给其它数据库实例(segment实例),由它们存储和处理数据。Greenplum interconnect负责不同PostgreSQL实例之间的通信。Greenplum segment是独立的PostgreSQL数据库,每个segment存储一部分数据。大部分查询处理都由segment完成。

二、使用步骤

1.环境说明

软件

版本

虚拟机

VMware 16

操作系统

CentOS-7-x86_64

数据库

Greenplum 6.18.1

2.集群介绍

搭建的 Greenplum 集群,我这里是使用5台虚拟机做的测试,配置在4c + 4G + 40G就够了。
使用1个 Master ,1个standby,3个 Segment 的集群,如下:

IP

主机名

节点

192.168.1.201

mdw1

master

192.168.1.202

smdw1

standby

192.168.1.203

sdw1

segment

192.168.1.204

sdw2

segment

192.168.1.205

sdw3

segment

3.修改主机名(root)

代码如下(示例):

hostnamectl set-hostname mdw1
hostnamectl set-hostname smdw1
hostnamectl set-hostname sdw1
hostnamectl set-hostname sdw2
hostnamectl set-hostname sdw3

4.网络映射(root)

代码如下(所有节点):

vim /etc/hostname
192.168.1.201   mdw1
192.168.1.202   smdw1
192.168.1.203   sdw1
192.168.1.204   sdw2
192.168.1.205   sdw3

5.创建安装目录

代码如下(所有节点):

mkdir -p /gpdata/gpadmin/greenplum
chown -R gpadmin:gpadmin /gpdata/gpadmin/greenplum

6.安装部署

代码如下(主节点):

yum install apr apr-util krb5-devel libyaml rsync zip libevent
cd /mnt/hgfs/Share
cp greenplum-db-6.18.1-rhel7-x86_64.rpm  /gpdata/gpadmin/greenplum

cd /gpdata/gpadmin/greenplum
rpm -ivh --prefix=/gpdata/gpadmin/greenplum/ greenplum-db-6.18.1-rhel7-x86_64.rpm

--赋权限
chown -R gpadmin:gpadmin /gpdata/gpadmin/greenplum

--应用环境变量
su gpadmin
source /gpdata/gpadmin/greenplum/greenplum-db-6.18.1/greenplum_path.sh

7.SSH (免密登录)

代码如下(所有节点):

su gpadmin
ssh-keygen -t rsa

--添加信任其他机器的Host key (所有节点)
ssh-copy-id mdw1
ssh-copy-id smdw1
ssh-copy-id sdw1
ssh-copy-id sdw2
ssh-copy-id sdw3

--创建节点配置文件(mdw1@hadoop) all_hosts:全部节点  seg_hosts:数据节点
vim /gpdata/gpadmin/greenplum/all_hosts
cat /gpdata/gpadmin/greenplum/all_hosts
mdw1
smdw1
sdw1
sdw2
sdw3

vim /gpdata/gpadmin/greenplum/seg_hosts
cat /gpdata/gpadmin/greenplum/seg_hosts
sdw1
sdw2
sdw3

--验证节点之间的SSH是否全部打通
source gpdata/gpadmin/greenplum/greenplum-db-6.18.1/greenplum_path.sh
cd /gpdata/gpadmin/greenplum

gpssh-exkeys -f /gpdata/gpadmin/greenplum/all_hosts
# 分发节点2
scp -r /gpdata/gpadmin/greenplum gpadmin@smdw1:/gpdata/gpadmin
scp -r /gpdata/gpadmin/greenplum gpadmin@sdw1:/gpdata/gpadmin
scp -r /gpdata/gpadmin/greenplum gpadmin@sdw2:/gpdata/gpadmin
scp -r /gpdata/gpadmin/greenplum gpadmin@sdw3:/gpdata/gpadmin

cd /gpdata/gpadmin/greenplum
ln -s greenplum-db-6.18.1 greenplum-db
ln -s greenplum-db-6.18.1 greenplum-db

8.环境配置

代码如下(示例):

mkdir -p /home/gpadmin/data/master


--gp的安装目录,和环境信息到用户的环境变量中(所有节点)。
vim /gpdata/gpadmin/greenplum/greenplum-db/greenplum_path.sh

GPHOME=/gpdata/gpadmin/greenplum/greenplum-db

vim ~/.bashrc
source /gpdata/gpadmin/greenplum/greenplum-db/greenplum_path.sh
export MASTER_DATA_DIRECTORY=/home/gpadmin/data/master/gpseg-1
export PGPORT=5432
export PGUSER=gpadmin
export PGDATABASE=gpdb

--Segment节点
source /gpdata/gpadmin/greenplum/greenplum-db/greenplum_path.sh
gpssh -f /gpdata/gpadmin/greenplum/seg_hosts -e 'mkdir -p /home/gpadmin/data/primary'
gpssh -f /gpdata/gpadmin/greenplum/seg_hosts -e 'mkdir -p /home/gpadmin/data/mirror'

#初始化配置文件编辑修改(master节点上操作)
mkdir /home/gpadmin/gpconfigs

cp /gpdata/gpadmin/greenplum/greenplum-db/docs/cli_help/gpconfigs/gpinitsystem_config /home/gpadmin/gpconfigs/gpinitsystem_config

vim /home/gpadmin/gpconfigs/gpinitsystem_config

#初始化数据库
gpinitsystem -c /home/gpadmin/gpconfigs/gpinitsystem_config -h /data/greenplum/seg_hosts

#standby 初始化
gpinitstandby -s smdw1

9.安装成功

代码如下(主节点):

psql 登录数据库
psql -d gpdb
\l  查看
\q  退出

greenplum与mysql的对比 greenplum与hadoop区别_hadoop


代码如下(主节点):

greenplum命令
• 关闭
gpstop
• 启动
gpstart
• 状态查看
gpstate

greenplum与mysql的对比 greenplum与hadoop区别_hadoop_02

10.使用DBeaver访问

greenplum与mysql的对比 greenplum与hadoop区别_数据库_03


总结

提示:记录点点