一种动态监控服务器集群性能并实时报警的方法,包括服务器集群,服务器均使用linux操作系统,其特征在于体系结构包括数据收集层、数据分析层和数据展示层;数据收集层包括服务器集群,数据分析层包括监控服务器,数据展示层包括电子邮件或者手机短信或者报表或者图件;数据分析层的监控服务器通过网络对数据收集层的服务器进行监控,数据分析层通过网络将监控数据传输到数据展示层;首先在数据收集层,通过linux操作系统或者其他的性能抓取软件订制用户最关心的性能数据转换成文本格式,然后利用网络传输到单独的数据分析层的监控服务器上,监控服务器通过对数据的分析整理、规范化,生成便于用户易读的数据,再将数据传输到数据展示层展出,在整个测试期间,如果超出了用户自定义的阈值,系统立即报警,通知客户。

2. 根据权利要求1所述的一种动态监控服务器集群性能并实时报警的方法,其特征在 于具体流程为:(1) 、在数据收集层,被监控的服务器可以有一个或者多个,他们采用定时机制,把本服 务器的状态、日志等衡量服务器运行性能的数据,通过网络实时采集发送到数据分析层的 监控服务器上;其中这些监控信息包括本服务器的磁盘状态、内存的使用情况,cpu的利用 率,操作系统日志,以及相关的报警日志等采集到临时文件夹,然后定时提交给数据分析层 的监控服务器;(2) 、数据分析层负责把数据收集层中服务器的数据做数据分析,如果有异常,则联合 其他相应的设备,调用相关的接口发送信息;(3) 、数据展示层,通过公共的接口发送消息,通知最终用户,按照信息的重要程度,分 为多级报警方法,对于高重要程度的信息采用手机短信方式,对于测试过程中的一些响应 异常,通过电子邮件进行发送,另外的一些值的走势信息,通过报表或者图形进行展示。

3. 根据权利要求1所述的一种动态监控服务器集群性能并实时报警的方法,其特征在 于数据收集层采用主机HA策略,即服务器集群采用双机集群系统。

4. 根据权利要求1所述的一种动态监控服务器集群性能并实时报警的方法,其特征在 于数据分析层的接口均为标准接口定义体系。