Orabbix介绍

监控Oracle数据库我们需要安装第三方提供的Zabbix插件,我们先测试比较有名的Orabbix,http://www.smartmarmot.com/product/orabbix/

[图片上传中...(image-fbffb1-1545190409993-6)]

从部署架构图上可以看出,orabbix是通过JDBC去连接被监控数据库的,其实不是必须在数据库主机上安装Agent,而运行orabbix的主机,可以是Zabbix Server,也可以是数据库主机和zabbix server之外的任意一台主机,为了测试方便,我们将orabbix安装在Zabbix Server上。

下载软件及安装服务

Ø 下载 Orabbix ,上传到你的 Zabbix Server

Ø unzip 软件到这个目录: /opt/orabbix

Ø 安装服务:

Ø 复制启动脚本

cp /opt/orabbix/init.d/orabbix /etc/init.d/orabbix

Ø 运行权限:

chmod +x /etc/init.d/orabbix

chmod +x /opt/orabbix/run.sh

Ø #chkconfig --add orabbix

建立监控用户及授权

CREATE USER ZABBIX

IDENTIFIED BY welcome1

DEFAULT TABLESPACE SYSTEM

TEMPORARY TABLESPACE TEMP

PROFILE DEFAULT

ACCOUNT UNLOCK;

REM 2 Roles for ZABBIX

GRANT CONNECT TO ZABBIX;

GRANT RESOURCE TO ZABBIX;

ALTER USER ZABBIX DEFAULT ROLE ALL;

REM 5 System Privileges for ZABBIX

GRANT SELECT ANY TABLE TO ZABBIX;

GRANT CREATE SESSION TO ZABBIX;

GRANT SELECT ANY DICTIONARY TO ZABBIX;

GRANT UNLIMITED TABLESPACE TO ZABBIX;

GRANT SELECT ANY DICTIONARY TO ZABBIX;

如果是11g数据库,执行下列语句:

exec dbms_network_acl_admin.create_acl(acl => 'resolve.xml',description => 'resolve acl', principal =>'ZABBIX', is_grant => true, privilege => 'resolve');

exec dbms_network_acl_admin.assign_acl(acl => 'resolve.xml', host =>'*');

commit;

修改orabbix配置文件

cd /opt/orabbix/conf

cp config.props.sample config.props

根据实际的部署情况修改文件,比如:

comma separed list of Zabbix servers

ZabbixServerList=ZabbixServer1

ZabbixServer1.Address=192.168.0.41 ##Zabbix服务器地址

ZabbixServer1.Port=10051 ##Zabbix服务器端口

pidFile

OrabbixDaemon.PidFile=./logs/orabbix.pid

frequency of item's refresh

OrabbixDaemon.Sleep=300

MaxThreadNumber should be >= than the number of your databases

OrabbixDaemon.MaxThreadNumber=100

put here your databases in a comma separated list

DatabaseList=DB1,DB2,DB3 ##数据库列表,名称随便起

Configuration of Connection pool

if not specified Orabbis is going to use default values (hardcoded)

Maximum number of active connection inside pool

DatabaseList.MaxActive=10

The maximum number of milliseconds that the pool will wait

(when there are no available connections) for a connection to be returned

before throwing an exception, or <= 0 to wait indefinitely.

DatabaseList.MaxWait=100

DatabaseList.MaxIdle=1

define here your connection string for each database

DB1.Url=jdbc:oracle:thin:@192.168.0.31:1521:test1 ##数据库连接串

DB1.User=zabbix ##监控数据库用户名

DB1.Password=welcome1 ##监控数据库口令

保存配置文件,然后重启orabbix。

导入模板

在orabbix的软件包里面有4各模板文件,导入下面途中这个模板文件就可以了,包含了其他所有模板文件的内容。

[图片上传中...(image-44c3c2-1545190409993-5)]

适用Orabbix

在zabbix界面上配置数据库监控时,要注意,orabbix是把每个数据库都配置成一个“主机”的,这块看着有点别扭,而且,注意在配置主机时,名称一定要和config.props文件中配置的数据库名称一样,比如我这里就是DB1:






zabbix模板里的键值在哪看 zabbix 模板_开发工具


clip_image003


前面说了,这个“主机”的地址可以随便写,因为被监控的主机端不需要一定有agent,但是为了方便管理,我觉得还是写上Oracle主机的地址比较好。

定义了主机后,就可以适用模板中预定义的监控项、触发器和图表了。

比如图表:

[图片上传中...(image-1b104b-1545190409993-3)]



zabbix模板里的键值在哪看 zabbix 模板_数据库_02


比如最简单的检查数据库适用可用的触发器:



zabbix模板里的键值在哪看 zabbix 模板_数据库_03


clip_image006    
          
当然,对应触发器的动作还是需要自己配置。
自定义SQL检查
Orabbix提供了表空间的监控,监控项对应的SQL:
tbl_space.Query=SELECT * FROM ( \
select '- Tablespace ->',t.tablespace_name ktablespace, \
'- Type->',substr(t.contents, 1, 1) tipo, \
'- Used(MB)->',trunc((d.tbs_size-nvl(s.free_space, 0))/1024/1024) ktbs_em_uso, \
'- ActualSize(MB)->',trunc(d.tbs_size/1024/1024) ktbs_size, \
'- MaxSize(MB)->',trunc(d.tbs_maxsize/1024/1024) ktbs_maxsize, \
'- FreeSpace(MB)->',trunc(nvl(s.free_space, 0)/1024/1024) kfree_space, \
'- Space->',trunc((d.tbs_maxsize - d.tbs_size + nvl(s.free_space, 0))/1024/1024) kspace, \
'- Perc->',decode(d.tbs_maxsize, 0, 0, trunc((d.tbs_size-nvl(s.free_space, 0))*100/d.tbs_maxsize)) kperc \
from \
( select SUM(bytes) tbs_size, \
SUM(decode(sign(maxbytes - bytes), -1, bytes, maxbytes)) tbs_maxsize, tablespace_name tablespace \
from ( select nvl(bytes, 0) bytes, nvl(maxbytes, 0) maxbytes, tablespace_name \
from dba_data_files \
union all \
select nvl(bytes, 0) bytes, nvl(maxbytes, 0) maxbytes, tablespace_name \
from dba_temp_files \
) \
group by tablespace_name \
) d, \
( select SUM(bytes) free_space, \
tablespace_name tablespace \
from dba_free_space \
group by tablespace_name \
) s, \
dba_tablespaces t \
where t.tablespace_name = d.tablespace(+) and \
t.tablespace_name = s.tablespace(+) \
order by 8) \
where kperc > 93 \
and tipo <>'T' \
and tipo <>'U'
tbl_space.NoDataFound=none

这个SQL会返回93%满的表空间信息,而对应这个监控项,orabbix也定义了触发器,因为监控项的返回值是文本,而没有满足条件的记录时返回字符串“none“,所以监控项对应的触发器会检查返回值开头是不是none,如果不是,就报警,这样,用户除了收到预警信息,还能从返回值的具体值中看到具体时哪个表空间快满了。

当然,大部分时间监控项会返回none,所以我们无法画出正常未满的表空间的空间占用时间曲线。只有超过93%慢时,我们才知道具体的占用情况。

如果想收集并保留更多信息,就需要使用自定义查询,方法就是在query.props文件中加入你想检查的SQL,比如我们想了解表空间信息,就加以下SQL:

customtbl.Query=select 'TBL:'||a.tablespace_name||',' TBL, \
'Total Size:'||trunc(sum(a.tots) / 1024 / 1024, 2)||',' Tot_Size_mb, \
'Free MB:'||round(sum(a.sumb) / 1024 / 1024, 2)||',' Tot_Free_mb, \
'PCT Free:'||round(sum(a.sumb) * 100 / sum(a.tots), 2)||',' Pct_Free, \
'Max Free MB:'||round(sum(a.largest) / 1024 / 1024, 2)||',' Max_Free_mb, \
'Chunks Free:'||sum(a.chunks)||',' Chunks_Free \
from (select tablespace_name, \
0 tots, \
sum(bytes) sumb, \
max(bytes) largest, \
count(*) chunks \
from dba_free_space a \
group by tablespace_name \
union \
select tablespace_name, sum(bytes) tots, 0, 0, 0 \
from dba_data_files \
group by tablespace_name) a \
group by a.tablespace_name
customtbl.NoDataFound=none

然后在orabbix对应的模板中添加这个监控项customtbl就可以了,下面时从最新数据菜单查看的SQL的返回结果:


当然,我们要做进一步的分析和展示,就需要使用别的工具或者开发工具来做了,这个就不是这篇文章讨论的范围了。

Orabbix不足

初步测试,感觉orabbix有2点明显缺陷:

1. 被监控数据库信息要逐个写进配置文件,如果数据库个数比较多,管理会比较麻烦

2. 被监控数据库的账号信息是写在配置文件中,而且口令是明文存储,有很大的安全隐患

3. 对RAC的支持还是很初级
zabbix