环境准备:
(1)共需3台服务器,一台主库,一台备库,一台监视器。
(2)3台机器都安装DM数据库,主备库的安装路径要一致,安装好后可以不着急配置实例。
(3)本文说所的“bin目录”,均为DM8的安装目录下的bin目录,例安装目录是/dm8,那么bin目录就是/dm8/bin,本文中数据目录默认是/dm/data/实例名/,主备可相同可不同,根据情况来。建议不同。
(4)多个备库时,配置手法均相同,不同之处会有说明。本文主要以一主一备为案例讲解。
注:若是自己搭建学习使用,且资源不充足时,可以把监视器搭建在主机或备机中,缓解资源。生产严禁这么做。
DM8试用版下载地址:https://eco.dameng.com/download/?_blank
1、确定并记录实例信息
1.1【主库】,确定好主库的信息
GRP1_RT_01(实例名)
5237(PORT_NUM,数据库实例的监听端口)
5337(MAL_INST_DW_PORT,实例监听守护进程tcp连接的端口)
ip(MAL_HOST,机器的ip,一般有2个,一个对外,一个对内)
61141(MAL_PORT,MAL系统监听tcp连接的端口)
52141(MAL_DW_PORT,实例本地的守护进程监听tcp连接的端口)
453331(OGUID,与备库相同)
1.2【备库】确定好备库的信息
GRP1_RT_02(实例名)
5238(PORT_NUM,数据库实例的监听端口)
5338(MAL_INST_DW_PORT,实例监听守护进程tcp连接的端口)
ip(MAL_HOST,机器的ip,一般有2个,一个对外,一个对内)
61142(MAL_PORT,MAL系统监听tcp连接的端口)
521412(MAL_DW_PORT,实例本地的守护进程监听tcp连接的端口)
453331(OGUID,与主库相同)
多个备库就写多个。按照以上信息,配置好实例。
各主备库的实例名建议采用“组名_守护环境_序号”的方式命名,方便按组区分不同实例,注意总长度不能超过16。
此时,就能配置实例了。根据情况配置好实例即可。
若主库为老库,已有数据,需先备份,建好备库后在备库还原,再继续搭建。
1.3脱机备份/还原(主库实例没数据可跳过此步骤)
1.3.1备份(主库操作):
先检查dmap是否启动。dmap是辅助插件服务,一般启动数据库时会自动启动
手动启动(dm8的bin目录下):./DmAPService start
关闭数据库后,去bin目录执行:./dmrman
执行bakup全库备份:backup database '<数据库目录>/dm.ini' backupset '<备份存放目录>/<备份目录名>';
例:backup database '/dm/data/DMDB3/dm.ini' backupset '/home/dmdba/bakfull';
完成后exit退出即可。
1.3.2还原(备库操作):
拷贝主库的备份,到备库。
关闭数据库后,去bin目录执行:./dmrman
执行restore恢复:restore database '<数据库目录>/dm.ini' from backupset '<备份存放目录>/<备份目录名>';
例:restore database '/dm/data/DMDB3/dm.ini' from backupset '/home/dmdba/bakfull';
执行recover:recover database '<数据库目录>/dm.ini' from backupset '<备份存放目录>/<备份目录名>';
执行recover update db_magic:recover database '<数据库目录>/dm.ini' update db_magic;
完成后exit退出即可。
2、修改/创建配置文件
【主库】
编辑数据目录的dm.ini,修改下列配置:
INSTANCE_NAME = GRP1_RT_01 #实例名
PORT_NUM = 5237 #数据库实例监听端口
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
【备库】
编辑数据目录的dm.ini,修改下列配置:
INSTANCE_NAME = GRP1_RT_02 #实例名
PORT_NUM = 5238 #数据库实例监听端口
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
【主、备库】在数据目录新建dmmal.ini,主备必须一致
vim dmmal.ini
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
MAL_INST_NAME = GRP1_RT_01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 主库ip #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 61141 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 主库对外ip #实例的对外服务 IP 地址
MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 52141 #实例本地的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 5337 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = GRP1_RT_02
MAL_HOST = 备库ip
MAL_PORT = 61142
MAL_INST_HOST = 备库对外ip
MAL_INST_PORT = 5238
MAL_DW_PORT = 52142
MAL_INST_DW_PORT = 5338
多备库时写多个MAL_INST组,例如3个备库时多写一个[MAL_INST3]并复制其他组的内容并修改信息。
【主、备库】在数据目录新建dmarch.ini
vim dmarch.ini
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_RT_02 #实时归档目标实例名,主库就写备库的。同样,备库就写主库的
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /dmarch/ GRP1_RT_01或02/arch #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0 #单位 Mb,0 表示无限制,范围 1024~2147483647M
注意ARCH_DEST配置根据主备情况写。
【主、备库】在数据目录新建dmwatcher.ini
vim dmwatcher.ini
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 453331 #守护系统唯一 OGUID 值
INST_INI = /dm/data/ GRP1_RT_01或02/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/bin/dmserver #命令行方式启动
此处[GRP1]是一个组,多个备库时也是这么写。
注意INST_INI配置根据主备情况写。
3、启动实例并修改启动模式
【主库】以mount方式启动,bin目录下
./dmserver /dm8/data/ GRP1_RT_01/dm.ini mount
因为是前台启动,所以启动后,另外新开一个shell窗口,bin目录下启动disql登录,执行以下:
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(453331);
SQL>alter database primary; --修改主库模式为primary
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
【备库】以mount方式启动,bin目录下
./dmserver /dm8/data/ GRP1_RT_02/dm.ini mount
同样启动后另外新开一个shell窗口,bin目录下启动disql登录,执行以下下:
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(453331);
SQL>alter database standby; --修改备库模式为standby
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
primary为主库,standby为备库,若有其他备库,也是如此。
4、配置监视器
因为守护进程配置了自动切换,因此这里必须配置“确认监视器”,与普通监视器相比,有自动主备切换等功能。
【监视器服务器】找个目录存放配置文件,这里使用/dm8/data存放。新建dmmonitor.ini,MON_LOG_PATH监视器日志存放路径记得根据情况修改。
vim dmmonitor.ini
MON_DW_CONFIRM = 1 #确认监视器模式
MON_LOG_PATH = /dm/data/log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 32 #每个日志文件最大 32M
MON_LOG_SPACE_LIMIT = 0 #不限定日志文件总占用空间
[GRP1]
MON_INST_OGUID = 453331 #组 GRP1 的唯一 OGUID 值
#以下配置为监视器到组 GRP1 的守护进程的连接信息,以―IP:PORT‖的形式配置
#IP 对应 dmmal.ini 中的 MAL_HOST,PORT 对应 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 主库ip:52141
MON_DW_IP = 备库ip:52142
末尾MON_DW_IP,多个备库时,按顺序往下写即可。
【主、备库】启动守护进程,在bin目录下
./dmwatcher /dm8/data/ GRP1_RT_01或02/dmwatcher.ini
【监视器服务器】启动,在bin目录下
./dmmonitor /dm8/data/dmmonitor.ini
5、配置后台启动、启停顺序
都ok后,按此顺序关闭,然后处理为后台启动
1.关闭监视器
2.关闭主库守护进程
3.关闭备库守护进程
4.关闭主库实例
5.关闭备库实例
【主库、备库、监视器】都去bin目录的service_template目录下,将DmService、DmWatcherService、DmMonitorService这3个文件都复制到bin目录,并注意改名,建议命名规则为“末尾+实例名”,例如:DmService_GRP1_RT_01。然后编辑,修改里面的INI_PATH=“配置文件目录”,即可使用后台启动。例如:INI_PATH=“/dm8/data/dmmonitor.ini”
启动顺序:
6.启动主库实例 ./ DmService_ GRP1_RT_01 start
7.启动备库实例 ./ DmService_ GRP1_RT_02 start
8.启动主库守护进程 ./ DmWatcherService_ GRP1_RT_01 start
9.启动备库守护进程 ./ DmWatcherService_ GRP1_RT_02 start
10.启动监视器 ./ DmMonitorService_GRP1 start
6、检查与使用
【检查主备情况】
去监视器机器,实时查看/dm/data/log目录下的日志
WSTATUS、ISTATUS都是OPEN状态(守护进程状态、实例状态)
RTYPE是REALTIME,RSTAT是VALID
都是的话,集群就是正常运行状态。
【修复】
看情况,同步数据
报错DmService GRP1_RT_01 dead but pid file exists,监视器可能会关闭主、备库的进程,但pid会残留,先关闭守护进程。
此时需要手杀实例进程(因为脚本不会强杀,只会循环去停),ps -ef | grep dm.ini,把dmserver的pid,kill -9
启动主、备库,再启动守护进程,观察确认监视器日志即可。