环境准备:

(1)共需3台服务器,一台主库,一台备库,一台监视器。

(2)3台机器都安装DM数据库,主备库的安装路径要一致,安装好后可以不着急配置实例。

(3)本文说所的“bin目录”,均为DM8的安装目录下的bin目录,例安装目录是/dm8,那么bin目录就是/dm8/bin,本文中数据目录默认是/dm/data/实例名/,主备可相同可不同,根据情况来。建议不同。

(4)多个备库时,配置手法均相同,不同之处会有说明。本文主要以一主一备为案例讲解。

注:若是自己搭建学习使用,且资源不充足时,可以把监视器搭建在主机或备机中,缓解资源。生产严禁这么做。

DM8试用版下载地址:https://eco.dameng.com/download/?_blank


1、确定并记录实例信息

1.1【主库】,确定好主库的信息

GRP1_RT_01(实例名)

5237(PORT_NUM,数据库实例的监听端口)

5337(MAL_INST_DW_PORT,实例监听守护进程tcp连接的端口)

ip(MAL_HOST,机器的ip,一般有2个,一个对外,一个对内)

61141(MAL_PORT,MAL系统监听tcp连接的端口)

52141(MAL_DW_PORT,实例本地的守护进程监听tcp连接的端口)

453331(OGUID,与备库相同)

1.2【备库】确定好备库的信息

GRP1_RT_02(实例名)

5238(PORT_NUM,数据库实例的监听端口)

5338(MAL_INST_DW_PORT,实例监听守护进程tcp连接的端口)

ip(MAL_HOST,机器的ip,一般有2个,一个对外,一个对内)

61142(MAL_PORT,MAL系统监听tcp连接的端口)

521412(MAL_DW_PORT,实例本地的守护进程监听tcp连接的端口)

453331(OGUID,与主库相同)

多个备库就写多个。按照以上信息,配置好实例。

各主备库的实例名建议采用“组名_守护环境_序号”的方式命名,方便按组区分不同实例,注意总长度不能超过16。

此时,就能配置实例了。根据情况配置好实例即可。

若主库为老库,已有数据,需先备份,建好备库后在备库还原,再继续搭建。

1.3脱机备份/还原(主库实例没数据可跳过此步骤)

1.3.1备份(主库操作):

先检查dmap是否启动。dmap是辅助插件服务,一般启动数据库时会自动启动

手动启动(dm8的bin目录下):./DmAPService start

关闭数据库后,去bin目录执行:./dmrman

执行bakup全库备份:backup database '<数据库目录>/dm.ini' backupset '<备份存放目录>/<备份目录名>';

例:backup database '/dm/data/DMDB3/dm.ini' backupset '/home/dmdba/bakfull';

完成后exit退出即可。

1.3.2还原(备库操作):

拷贝主库的备份,到备库。

关闭数据库后,去bin目录执行:./dmrman

执行restore恢复:restore database '<数据库目录>/dm.ini' from backupset '<备份存放目录>/<备份目录名>';

例:restore database '/dm/data/DMDB3/dm.ini' from backupset '/home/dmdba/bakfull';

执行recover:recover database '<数据库目录>/dm.ini' from backupset '<备份存放目录>/<备份目录名>';

执行recover update db_magic:recover database '<数据库目录>/dm.ini' update db_magic;

完成后exit退出即可。 

2、修改/创建配置文件

【主库】

编辑数据目录的dm.ini,修改下列配置:

INSTANCE_NAME = GRP1_RT_01 #实例名
PORT_NUM = 5237 #数据库实例监听端口
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置

 

【备库】

编辑数据目录的dm.ini,修改下列配置:

INSTANCE_NAME = GRP1_RT_02 #实例名
PORT_NUM = 5238 #数据库实例监听端口
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置

 

【主、备库】在数据目录新建dmmal.ini,主备必须一致

vim dmmal.ini

MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
 MAL_INST_NAME = GRP1_RT_01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致
 MAL_HOST = 主库ip #MAL 系统监听 TCP 连接的 IP 地址
 MAL_PORT = 61141 #MAL 系统监听 TCP 连接的端口
 MAL_INST_HOST = 主库对外ip #实例的对外服务 IP 地址
 MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
 MAL_DW_PORT = 52141 #实例本地的守护进程监听 TCP 连接的端口
 MAL_INST_DW_PORT = 5337 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
 MAL_INST_NAME = GRP1_RT_02
 MAL_HOST = 备库ip
 MAL_PORT = 61142
 MAL_INST_HOST = 备库对外ip
 MAL_INST_PORT = 5238
 MAL_DW_PORT = 52142
 MAL_INST_DW_PORT = 5338

多备库时写多个MAL_INST组,例如3个备库时多写一个[MAL_INST3]并复制其他组的内容并修改信息。

【主、备库】在数据目录新建dmarch.ini

vim dmarch.ini

[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_RT_02 #实时归档目标实例名,主库就写备库的。同样,备库就写主库的
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /dmarch/ GRP1_RT_01或02/arch #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0 #单位 Mb,0 表示无限制,范围 1024~2147483647M

 注意ARCH_DEST配置根据主备情况写。

【主、备库】在数据目录新建dmwatcher.ini

vim dmwatcher.ini

[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 453331 #守护系统唯一 OGUID 值
INST_INI = /dm/data/ GRP1_RT_01或02/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/bin/dmserver #命令行方式启动

此处[GRP1]是一个组,多个备库时也是这么写。

注意INST_INI配置根据主备情况写。

3、启动实例并修改启动模式

【主库】以mount方式启动,bin目录下

./dmserver /dm8/data/ GRP1_RT_01/dm.ini mount

因为是前台启动,所以启动后,另外新开一个shell窗口,bin目录下启动disql登录,执行以下:

SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(453331);
SQL>alter database primary;    --修改主库模式为primary
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

 

【备库】以mount方式启动,bin目录下

./dmserver /dm8/data/ GRP1_RT_02/dm.ini mount

同样启动后另外新开一个shell窗口,bin目录下启动disql登录,执行以下下:

SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(453331);
SQL>alter database standby;    --修改备库模式为standby
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

primary为主库,standby为备库,若有其他备库,也是如此。

4、配置监视器

因为守护进程配置了自动切换,因此这里必须配置“确认监视器”,与普通监视器相比,有自动主备切换等功能。

 【监视器服务器】找个目录存放配置文件,这里使用/dm8/data存放。新建dmmonitor.ini,MON_LOG_PATH监视器日志存放路径记得根据情况修改。

vim dmmonitor.ini

MON_DW_CONFIRM = 1 #确认监视器模式
MON_LOG_PATH = /dm/data/log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 32 #每个日志文件最大 32M
MON_LOG_SPACE_LIMIT = 0 #不限定日志文件总占用空间
[GRP1]
MON_INST_OGUID = 453331 #组 GRP1 的唯一 OGUID 值
#以下配置为监视器到组 GRP1 的守护进程的连接信息,以―IP:PORT‖的形式配置
#IP 对应 dmmal.ini 中的 MAL_HOST,PORT 对应 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 主库ip:52141
MON_DW_IP = 备库ip:52142

 末尾MON_DW_IP,多个备库时,按顺序往下写即可。

【主、备库】启动守护进程,在bin目录下

./dmwatcher /dm8/data/ GRP1_RT_01或02/dmwatcher.ini

【监视器服务器】启动,在bin目录下

./dmmonitor /dm8/data/dmmonitor.ini 

5、配置后台启动、启停顺序

都ok后,按此顺序关闭,然后处理为后台启动

1.关闭监视器

2.关闭主库守护进程

3.关闭备库守护进程

4.关闭主库实例

5.关闭备库实例

【主库、备库、监视器】都去bin目录的service_template目录下,将DmService、DmWatcherService、DmMonitorService这3个文件都复制到bin目录,并注意改名,建议命名规则为“末尾+实例名”,例如:DmService_GRP1_RT_01。然后编辑,修改里面的INI_PATH=“配置文件目录”,即可使用后台启动。例如:INI_PATH=“/dm8/data/dmmonitor.ini”

启动顺序:

6.启动主库实例  ./ DmService_ GRP1_RT_01 start

7.启动备库实例  ./ DmService_ GRP1_RT_02 start

8.启动主库守护进程  ./ DmWatcherService_ GRP1_RT_01 start

9.启动备库守护进程  ./ DmWatcherService_ GRP1_RT_02 start

10.启动监视器  ./ DmMonitorService_GRP1 start 

6、检查与使用

【检查主备情况】

去监视器机器,实时查看/dm/data/log目录下的日志

WSTATUS、ISTATUS都是OPEN状态(守护进程状态、实例状态)

RTYPE是REALTIME,RSTAT是VALID

都是的话,集群就是正常运行状态。

【修复】

看情况,同步数据

报错DmService GRP1_RT_01 dead but pid file exists,监视器可能会关闭主、备库的进程,但pid会残留,先关闭守护进程。

此时需要手杀实例进程(因为脚本不会强杀,只会循环去停),ps -ef | grep dm.ini,把dmserver的pid,kill -9

启动主、备库,再启动守护进程,观察确认监视器日志即可。

社区地址:https://eco.dameng.com