作者:任成钢
那如何才能确保企 业应用集成平台正常运行,保证业务运营的正常运作呢?针对这样的问题,实施顾问们都会建议客户进行集群部署,实现Fault Tolerance或者Load Balance等等,来确保平台的可靠运行。除此之外,我还建议客户建立一套集成平台管理监控系统,对企业应用集成平台以及平台上部署的应用进行管理与监 控,随时掌握平台和应用的运行情况,及时发现问题,保证企业业务的正常运营。
其实,很多ESB、SOA产品都提供管理和监控的功能,比如TIBCO Administrator和Service Performance Management等等,这些产品能除了能够进行集成应用的部署、启动等操作之外,也可以进行应用状态的监控,但是这些功能对于企业应用集成平台来说还 远远不够,尤其是对那些采用分布式应用集成平台的大型企业,比如我们的客户。
我建议企业应用集成平台管理监控系统需要包括如下基本功能:
服务信息维护与管理
提到基于SOA的应用集成平台就不能没有服务,而且在实际的实施中,服务的形式也多种多样,除了常用的Web Service,还有其他各种技术(比如JMS)接口和各类适配器接口。为了能够充分发挥这些服务的作用,提高服务的重用性,就需要对这些服务进行维护和 管理,功能包括:
- 服务基本信息维护:包括服务功能、位置、类型、输入/输出参数、调用方法说明等等,使用户在需要调用某种功能的服务时,能够快速的查找服务资源,便于应用系统的开发。
- 服务访问管理:管理和维护服务的访问者信息,以便管理人员能够了解服务的应用范围和使用情况,并对新增加的访未者(应用系统)设置审批流程,防止服务访问的随意性和不可控性。
- 服务变更管理:记录因为应用系统需求变更产生的服务版本的变更,并对订阅该服务用户及应用系统发布变更通知,便于服务调用方及时进行更新。
平台监控:
应用集成平台通常都会基于一种或者多种产品平台进行搭建,这些平台运行是否正常,决定了整个应用集成平台运行的稳定。虽然很多产品本身自带了监控工具, 但是这些监控工具提供的功能往往还不能满足用户的一些个性化得需求,尤其是针对一些大型的客户采用多种平台产品,进行分布式部署的时候。如果能对这些平台 产品进行统一的监控和管理,将会大大提高应用集成平台的可靠性。用户可以使用产品提供的API,比如TIBCO Hawk API来定制化开发自己的监控平台产品。平台监控的功能包括:
- 平台资源监控:比如服务器的CPU占用率、内存占用率、磁盘空间等等的监控。
- 平台进程的监控:监控平台是否运行正常,有没有意外停机之类。
- 报警:在平台出现异常时进行报警,比如向管理员发送短信提醒等。
集成应用管理与监控:
集成应用是企业应用集成平台的核心,是真正帮助企业实现集成业务的地方。集成应用的管理与监控既能够帮助平台的运维人员掌握平台的运行情况,也能够为业务用户对业务的运作情况提供参考依据。功能包括:
- 应用运行统计:记录集成应用的运行情况,比如某一服务接口每天进行的交易数量,成功记录数、失败记录数等等。
- 应用异常报警:针对失败记录过多的应用进行报警处理,通知管理员及时查看失败原因。
- 应用日志管理:管理集成应用中的接口日志,运行日志,异常日志等等。
- 业务冲正处理:针对失败的业务,管理和设置他们的冲正处理流程,保证业务运行的正确性。