2011年广州地铁将实施多个信息化项目,预计2011至2012年将会陆续建成,为保证系统如期上线运行,需要我司基础架构提供充足的硬件资源支撑,基于我司现有的信息化机房、基础架构软硬件设备以及运维管理系统的现状,容量、性能以及可用性也已经达到瓶颈,需要尽快配套采购相关的基础架构软硬件以支撑我司信息化的建设和发展。
2011年信息化基础架构项目需对现有地铁的公园前OCC机房、大石机房、赤沙机房、鱼珠机房进行机房改造,使电力、制冷、防漏、消防等方面完善并满足地铁未来3-5年的信息化基础架构平台的正常运行;对现有业务系统的基础架构软硬件设备进行扩容保证现有业务系统正常运行,完成对2011年新上线业务系统地基础架构软硬件的采购和安装部署工作。
对地铁未来的主数据中心、容灾数据中心、现有基础架构管理体系需求进行规划和设计,满足未来广州地铁信息化系统的增长需求。同时对IT运维服务标准化管理进行咨询和软件的实施工作。
本项目为2011年广州地铁信息化基础架构平台建设项目,项目范围包括:项目启动、系统调研与需求分析、详细解决方案设计、软硬件设备到货、系统安装与配置、系统测试、初步验收、验收后支持服务等,并在项目实施中结合培训实现有效的知识转移。
本项目涉及整个信息化业务系统的基础架构扩容和建设、数据中心的咨询和设计以及IT运维服务标准化管理,涉及主要使用部门为信息管理部战略与发展职能、信息管理部数据与技术职能、信息管理部建设管理职能、运营总部企业管理部、运营总部通号中心IT运维服务部。其他使用部门包括总公司各职能部门及所属投资企业。
2011年信息管理部负责牵头实施广州地铁多个信息化项目,2010年还有多个信息化系统在建,需要尽快配套采购相关的基础架构设备以支撑此部分的信息化应用。
原有的10台服务器为HP3000,6000系列超出使用年限已经申报停用和报废,而部分系统由于用户增加较多例如邮件系统、门户系统、OA、ERP等,迫切需要扩容,否则将影响正常使用,因此亦需要尽快增购服务器和存储设备进行扩容。
目前机房空间不足,资源不足已无法新增部署更多的设备,而且部分设施老化,存在安全隐患,迫切需要进行改造。
基于以上考虑迫切需要进行相关的基础架构设备的增购和对目前机房和设备进行升级改造,
同时随着信息系统及相关的信息化硬件设备越来越多,如何管理好这些系统和设备也成为一个重要的课题。目前管理的信息化应用将超过50个,服务器近百台,终端超过5000个。为更好地管理和考核运营总部为总公司及投资企业提供的IT运维服务,信息管理部建议引入业界的最佳实践——服务水平协议(SLA)管理的方式进行管理。通过分析业务对IT运维服务的需求,评估IT运维服务的能力,提出IT运维服务的目标,并通过信息化的手段,实现对该服务目标的执行情况进行监督和考核。
另由于我司提供的IT运维服务是多样的,为了全面地考核和评价IT运维服务,所要制定的IT服务目标也将分为多种类型。一部分类型的服务目标可以通过对信息系统的运行情况进行监督来进行考评,一部分类型的服务目标需要对IT运维服务的基础流程进行重新梳理,在流程中设立相应的统计节点,通过对统计节点数据的收集和分析,方能实现服务目标执行的考评。
在本项目实施内容包括软硬件设备采购、PC服务器虚拟化方案的实施(其中包括PC服务器调整部署、存储部署、虚拟化软件部署、现有系统的虚拟化迁移、服务器搬迁等)、备份系统的调整、网络设备的部署和安全设置、SSL ×××方案的实施;以及对IT运维服务业务的梳理和优化,并通过信息化的手段,实现对该IT运维服务目标的执行情况进行监督和考核。
地铁信息系统部分使用物理PC服务器,其中一部分HP3000、6000系列已经停用一部分为2005年前购置。
随着公司信息系统的不断应用与发展,部分系统硬件性能已经不能满足业务的发展需要,出现性能瓶颈。主要体现以下几个方面。
1. 邮件系统--防垃圾邮件服务器,本服务器上运行的防垃圾邮件系统于2005年9月部署,服务器和应用系统距离现在已经5年。期间防垃圾邮件系统只做了维保服务,并没有针对该应用做软件升级工作。该服务器作为我司与外网所有邮件往来的关卡。根据统计,每天我司收到外网垃圾邮件有十几万封之多,全部都由该服务器进行拦截。当今邮件系统技术日益更新,且公司邮箱用户的不断增加,防垃圾邮件服务器已经处于性能饱和满负荷状态。
2. 我司Vmware虚拟化正式环境-现处于满负荷运行状态,不可以再承担任何应用系统和虚拟机。每天系统都有不同程度的性能报警和日志。
3. 我司网站系统web应用服务器处于单点故障中,出现硬件或信息安全风险将不能及时修复。
4. 统一通讯系统-数据库服务器。统一通讯系统今后将作为作为我司推广应用系统,未来在全公司范围内推广,现有的数据库服务器需要扩容提高性能。
5. 我司AD域服务器-承担我司所有员工的域安全登录和我司各个应用系统身份验证服务。该服务器已有6年历史。性能上不足以满足未来我司信息化发展需要。
超过2/3的小型机位05年前购置,公司现有SUPERDOME、RP4440、RP3440、L3000、IBM P630等设备;目前小型机在方面明显有性能瓶颈,特别ERP平台随着用户数增加及数据量的增加,现有系统已不能满足现有业务需求CPU和内存的利用已经满负荷,当ERP平台上新增应用和用户将无法满足使用要求。同时多个在小型机上运行的系统例如GIS、MAXIMO数据库互为备,不能形成双机冗余的目的,并且均存在无容灾、测试环境或容灾环境明显性能不足的情况。
大部分的存储都是05年前的设备
公司信息系统所使用存储设备主要为XP128存储,EMC存储,IBMFASTt500,NSA网络存储,HP MSA1000,IBM磁盘阵列柜,DELL磁盘阵列柜。
1. 邮件系统--我司现邮件系统服务器(数据库部分)本年度由于6条新线开通新入司员工较多,使用邮件系统人数预计在未来3年增加至15000至20000人。按照我司信息化管理需要,每一位员工可使用81MB的邮箱。我司现邮件系统存储空间处于接近饱和状态。
2. 我司外部网站系统(www.gzmtr.com)web应用服务器中,本地硬盘存放网站所有信息和目录资料,现在硬盘容量不足80GB。
3. 目前GIS系统数字化图纸、档案CAD竣工电子图纸、工程视频信息、各类视频图片数据、票务数据等数据增长非常快,目前的存储容量将不能满足未来海量数据和各种大容量文件格式数据的存储。
IBM3584磁带库一台;HP 2-20磁带库一台。
1. 3584磁带库的槽位license目前的槽位License为129槽;
2. IBM SanSwitch的端口不足。
容灾环境主要用于核心应用出现灾难性事故后能迅速恢复的备份系统,主要设备为HP的SUPERDOME小型机 ;HP的XP128 存储;HP的L3000 小型机(OA、MAXIMO应用)。现有容灾环境中的MAXIMO容灾环境应用服务器配置太低相对较低。
集团公司网络设备主要是总公司本部中旅大厦16楼汇聚层网络交换机、各子公司、合作公司路由和安全网络设备:总公司本部汇聚层交换机为Cisco2948系列交换机、广百路由器和防火墙设备、环境公司路由器和防火墙设备、从化公司路由器和防火墙设备、广佛公司路由器和防火墙设备
1. 运行时间久和设备停产
目前Cisco2948G-L3中旅交换机投入运行已达10年左右(2000年投入使用),且存在设备主板老化隐患。该网络设备为旧款型号,这款Cisco2948G-L3交换机,厂家已停止生产并无法提供该系列的产品维护支持。
2. 性能不足
Cisco2948G-L3交换机也是属于早期的三层网络交换机,目前该设备总体性能已超过70%,随着将来总公司员工的人数增多,该系列交换机无法满足未来性能的需求。
3. 无备件设备更换
目前总公司中旅16楼汇聚层交换机和各子公司(广佛、环境、从化、广百)网络设备全为单机运行,一旦发生网络故障,存在无备件更换问题。
随着广州地铁建设进程的加快,新的线路不断投入使用。伴随着计算机用户的增加,其用户数现在已经接近6000用户,未来的发展可能达到一万用户。由于网络终端用户扩展数据较大,原网络系统中部署的设备已不能满足现在及将来发展的需要,因此有必要对现有的网络进行改造和优化,以满足广州地铁的发展需要。
大部分的内网用户在浏览网页和使用互联网应用时,先通过代理服务器(ISA)的防火墙代理实现NAT地址转换及网页缓存,再到Cisco PIX515防火墙实现二次安全防护,最后通过40M的专线对外进行访问。
而发送和接收邮件则使用网关通过默认路由,使用20M的专线对外进行访问。
广州地铁信息系统使用的是EMC公司的VMware 4.0企业版本,虚拟化正式环境的版本号是VMware ESX 4.0.0,208167,虚拟化测试环境的版本号是VMware ESX 4.0.0,164009。
1. Vmware4.0企业版本(正式环境)共四台高性能服务器作资源池。此环境承载我司办公应用系统和运营生产系统(若干)。
2. Vmware4.0(测试环境)共3台服务器做资源池。
3. 虚拟环境承载我司部分办公应用系统和运营生产系统(若干)的测试服务器。在性能上,正式环境的虚拟化系统一直处于性能报警,满负荷运行状态。测试环境运行正常。
广州地铁信息系统使用的是EMC公司的Legato备份软件,版本为LEGATO NETWORK 7.4.3。有大量的备份许可未购买,导致需采取其他备份方式执行,影响备份效率和安全性。
我司的安全及监控软件存在如下问题:
1. 版本较旧或技术支持不足
CA公司的NSM,CA,AUDIT,UDPM,,SCC,等软件已经是04-06年的产品,版本较低,配置复杂,也没有采购安装许可,不少出现问题,CA公司已退出中国,没有技术支持,目前的监控效果不佳。landesk期间做了软件升级,由8.7升级到8.8,约有一半客户端升级失败,但不影响分发补丁、软件及远程维护工作,需要技术支持。
2. 监控范围有空白
Cisco works 2000只能监控cisco设备,不能监控其他设备,目前公司部分接入层网络设备没有性能和健康状况的监控,日常检查为日常维护工作,没有大力关注到性能及预维护工作。部分物理机房没有监控系统。系统硬件PC服务器等硬件层面监控欠缺。系统软件例如操作系统、数据库没有纳入监控范围。
3. 集成程度不高
目前各个监控系统分离,按照《广州地铁2012年信息化发展战略规划调整报告》中的设计要点:可扩展性监控、贴合实际应用的监控、智能联动的监控系统、统一的显示平台、统一记录流向运维系统等没有实现,目前公司大大小小的监控软件不少,但是较为零散,集成度不高,效果不显著。
4. 监控的层级体系不完整
监控工作不单是对基础设施、设备状态等进行监控,而且应该包括如下三个层次:
Ø 物理及逻辑层:对物理机房、硬件、网络、软件的性能、容量、工作状态进行监控,主要目的是采取措施处理有关问题,提高可用性。
Ø 业务层:对业务流程、信息系统的性能等情况进行监控,对业务部门显示业务系统的运行情况,业务流程的执行情况等,满足业务部门的需要。
Ø 管理层:使管理层掌握监控的总体情况及相关信息。目前的监控集中于物理及逻辑层,在业务层面和管理层有欠缺。
广州地铁管理信息系统公园前OCC主机房在2002年启用。在2009年因原机房面积不足、电力负荷、空调故障导致温度过热等问题进行改造,改造后的主机房面积由100㎡扩充到180㎡(包含网络区域、服务器存储区域,不包括UPS、空调等辅助区),改造工程解决了电力负荷问题,温度过热和机房容量得到了一定的缓解。随着公司信息化建设的快速发展,机房设备数量的不断增加,中心机房的问题也越来越迫切需要给予高度关注,包括以下主要问题:
容量问题:机房最多能够放置22个服务器机柜,目前已使用了20个服务器机柜,使用率达90%。
供冷问题:机房现有供冷不均匀,且机房位于顶楼,受热面积大,外部高温天气也严重的影响了机房温度,致使机房局部温度过热,达31°C,距标准温度23°C相差甚远,且没有备用空调,空调故障将导致设备温度升高,除非空调改造,否则无法在现有情况下继续增加设备;设计的制冷系统遵循国家现行的建筑行业标准,使用非一类用电,造成供电检修时,空调停用,机房温度较高,只能对数据中心的设备进行关机,极大影响了信息服务的可用性及系统硬件的资产保护。
漏水问题:由于机房建设在顶楼,经常出现漏水现象,虽然经过修补现象有所缓解,但每逢雨季机房的漏水情况还是十分突出,严重影响机房的正常运作。
由于机房容量的原因,从08年开始每年的硬件采购都需要对机房进行评估,硬件部署比较困难,机房的空间、电力、制冷方面的压力越来越大。由于主机房容量有限,部分硬件存放在大石控制中心机房,硬件分散,维护成本较高,机房的集成度低,现有机房的条件无法满足我司信息化建设的需要,我司迫切需要设计和建设一个新的数据中心。
此外,目前我司各线网有不少的网络设备备件及硬件备件等,分散在各机房,没有专门管理的仓库,基础架构建设项目实施也没有专门的硬件保存位置,我司有建立备件仓库的需求。
其他机房存在问题主要如下:
远程监控问题:目前已在公园前OCC、赤沙、大石等机房通过监控系统对视频、温湿度、漏水、消防烟感、电压电流和重要开关进行监控,其他机房存在监控技术手段不足的现象,机房检查主要依赖人手,效率不高。
机房容量问题:除了公园前和赤沙机房原设计作为数据中心可以安装服务器及存储以外,其他机房设计为网络机房,专门部署网络设备使用,在电源容量、制冷量不充裕,如需安装并运行服务器及存储等设备,需要对相关机房的电源容量、制冷量进行扩容,此外,空间也有限,不能安装太多的服务器和存储。
造成上述问题的主要原因有如下三点:
1. 机房规模不明确
当初2002年难以估计我司信息化的发展及业界技术的发展,每年的硬件容量以25%的规模增长,导致不断需要对数据中心进行补充、改造,准确预测数据中心的规模(由网络、系统硬件等规模决定)需要专业的团队,丰富的经验及多年的知识积累。
2. 数据中心选址不合理
数据中心选址不合理,在顶楼,存在漏水威胁,由于阳光爆晒,对空调的要求高,能耗要求高,承重也进行了多次加固,数据中心的选址也需要专业的团队。
3. 设计有缺陷
数据中心的设计也有缺陷,空调系统无冗余,坏一台空调或供电检测造成数据中心的可用性降低;面积、电量、制冷量不平衡,造成即使有空间,也因为制冷效果不好而不能使用。
数据中心的设计涉及物理位置的选择、物理访问控制、防盗窃和防破环、防雷击、防火、防水和防潮、防静电、温湿度控制、电力供应、电磁防护等条件,涉及条件广,需要专业的团队。
主因是数据中心的咨询设计引起,数据中心的建设涉及到业务、IT 和场地建设等多个层次的需求整合,同时需要IT、通信、机电建筑等不同专业领域的通力协作,是多技术系统综合的复杂工程,需要请专业团队进行设计,以规避设计的不足与缺陷。
广州地铁为企业信息化建设已建设了10个机房,主要分布在各线网车辆段或控制中心,其中有1个主机房在公园前OCC,还有赤沙机房是备份数据中心。机房管理采取了计算机系统监控加手工巡查的方法。
现有机房的空间、电源容量、空调环境等条件降低机房的可用性,原有机房容量不能满足我司的业务及信息化的发展,我司迫切需要建立一个新的数据中心。
在公司改制后,作为公司一级职能部门,信息管理部负责总公司信息化工作的归口管理。代表总公司对委托给运营总部的IT运维服务业务进行管理,为IT运维服务提出服务目标,并负责对该服务目标的执行情况进行考评。
对于IT运维服务业务的监管是信息管理部的一项重要工作,根据改制工作的指导精神,信息管理部对于IT运维服务业务的管理方式是“管标准,管考核”的方式进行。目前信息管理部尚无专门的人员和机制对IT运维服务进行管理,在服务标准方面,尚未建立一套较为全面和完善的运维服务目标。
“被委托方”——运营总部,未来将挂牌成立为独立法人公司。其主要负责IT运维服务工作的IT运维服务部是其下属通号中心之下的二级部门,受总公司委托负责已建成信息系统的维护和管理。其部门工作在行政上隶属通号中心进行管理,在业务上运营总部的职能部门——企业管理部负责其信息化工作的管理。与此同时,信息管理部代表“委托方”——总公司及各投资企业,对其提供的IT运维服务的标准进行管理。
针对目前我司的IT运维服务业务,公司从2004年开始在CA Unicenter ServiceDesk平台上建设了部分基本服务运维流程,并在2006年底实施了二期优化,目前,已涉及事件管理、变更管理、满意度管理、设备借用领用、设备保修管理以及简单的知识库管理等,并制定了一系列IT服务管理制度,包括有管理总则、运维细则、软硬件系统管理办法制度,应急预案流程初稿,外包管理规范流程等。但与完善的流程体系相比较仍有较大差距,如缺乏配置管理,问题管理,发布管理等服务支持流程,服务交付流程以及服务级别管理。
同时,广州地铁已经初步建立起了以服务台作为受理使用者服务申请或报障的服务窗口,以一线、二线和三线支持为服务力量的运维管理模式,在服务级别上对外有服务时间和停机时限承诺。但服务承诺作为较为简单,没有按照服务水平管理体系运作。IT运维服务团队依然常常扮演应急排障的救火者角色,往往缺乏对信息系统的适用性、主动性运维,这与建设规范、稳定、高效的运维体系目标相比仍有很大差距。
广州地下铁道总公司对信息化工作实行“协同建设、统一管理”战略原则,对信息化工作主要划分为IT战略与控制、IT建设管理、IT数据与技术管理、IT运维服务管理四大核心职能。其中IT运维服务管理由信息管理部代表总公司授权给广州地铁运营事业总部负责,目前尚未有完善的运维服务管理体系支撑。
信息管理部,总公司信息化工作归口管理部门,主要负责公司IT战略规划与管控、IT建设管理和IT数据与技术管理工作。信息管理部同时代表总公司对授权给运营总部的IT运维服务业务进行管理,为IT运维服务提出服务目标,并负责对该服务目标的执行情况进行考评。当前对IT运维的管理以“管标准,管考核”的方式进行。目前信息管理部尚无专门的人员、机制和信息化手段对IT运维服务进行管理,在服务标准方面,尚未建立一套较为全面和完善的运维服务标准。与此同时,信息管理部代表IT运维服务使用方——总公司各职能部门及各投资企业,对运营总部提供的IT运维服务的标准进行管理。
运营总部,其主要负责IT运维服务工作的IT运维服务部是其下属通号中心之下的二级部门,该部门行政上隶属通号中心,在业务上由运营总部的职能部门——企业管理部负责其信息化工作的管理。IT运维服务部主要负责已建成信息系统的维护和管理。其管理体系设立二个层次,即业务管理层、流程管理层。业务管理层包括桌面服务、应用管理、系统管理、网络管理和安全管理。流程管理层主要通过服务台实现了事件管理、变更管理两个流程。
广州地铁IT运维管理工作面临着一些问题,其中包括:
1. 运维服务管理业务委托给运营事业总部后,相应的管理体系尚未建立和完善,不能满足总公司对IT运维服务管理的管控要求;
2. 相应沟通体系及管理流程未完善导致总公司与运营总部就此业务沟通不顺畅,工作效率较低;
3. 未有相应的绩效考核体系和服务标准,作为信息化归口管理部门——信息管理部,无法对IT运维业务进行管理与考核;
4. 广州地铁办公区域分布分散、范围广、应用者数目多、设备类型多样、信息系统环境复杂、应用环境复杂的问题。计算机网络覆盖5个办公区域,7个车辆段、8条线路与142座车站,终端使用者数超6000个,有近数17台小型机、过百台服务器,超过500台网络设备和8000台计算机及外设,操作系统平台有windows/UNIX/HPUX等,数据库平台有Oracle/SQL,在建或已建成应用五十多个,此外还运行使用了多个中高端交换机、路由器、互联网防火墙及负载均衡等网络设备;
5. 广州地铁处于公司信息化建设高峰期,每年新建成近十个应用系统、基础架构系统、新线网络系统上线后进入运维期,如何在有限的资源基础上支撑起庞大而复杂的信息系统服务运维,达到稳定、规范及高效的服务运维管理目标。
6. IT运维服务体系的建设是基于近年公司信息化战略规划及自身实施经验总结的基础上逐步梳理的,虽然其中大部分内容引自IT行业最佳实践标准,期间也主动与外部同行或厂商进行多方面的学习与交流,但由于实施经验、行业视角的原因,难免在体系建设的科学性、系统性及完整性等方面存在缺陷,更缺乏从服务运维运行生命周期的全局角度去审视思考的经验;
7. IT运维服务部除了负责信息系统日常系统维稳业务工作以外,还承担新信息化应用的系统建设的配合工作,接受总公司信息管理部及总部企业管理部的管理。由于人力资源的限制,如何平衡好、处理好系统建设与运维服务、应急处理与信息化建设之间的关系,往往成为长期困扰运维人的难题;
8. IT运维服务团队依然常常扮演应急排障的救火者角色,往往缺乏对信息系统的适用性、主动性运维。如何做好主动式运维,把故障隐患排除爆发之前,而与此同时又能平衡好运维资源的有效运用;
9. 各服务运维职能的IT系统功能、组织结构和流程分散,主要以业务为单位设立工作组织,运维事故出现后团队成员之间沟通配合变得尤为重要,这种以功能为导向设置的运维组织是否适合未来运维管理优化和发展;
10. 由于信息系统规模及技术要求日趋复杂。以现有运维服务组织的能力难以独立完成全部的运维服务工作任务,因此有必要借助外部力量来解决工作中遇到的技术难题和紧急问题。而如何定位这种外力,以什么方式借助,怎样管理也是服务运维组织考虑的重点问题;
11. 运维管理工具虽然在04年始建的服务运维管理平台,而且现今运行使用的运维管理平台仅实现事件管理、变更管理及满意度管理等比较基础模块,在使用多年后,由于环境、业务及组织上的变化,管理平台的可进行功能调整的灵活性较差或代价较高,厂商的支持策略也发生了很大的调整,基本不提供本地支持。实际来说,平台与现今管理不相适应,有时甚至成为体系改善改进的制约条件。
总公司从2004年开始在CA Unicenter平台上建设了部分基本IT运维服务流程,并在2006年底实施了二期优化,目前,已实现事件管理、变更管理、满意度管理、设备借用领用、设备保修管理以及简单的知识库管理等,并制定了一系列IT服务管理制度,包括有管理总则、运维细则、软硬件系统管理办法制度,应急预案流程初稿,外包管理规范流程等。但与完善的流程体系相比较仍有较大差距,如缺乏配置管理、问题管理、发布管理、服务级别管理等服务支持和交付流程。
同时,广州地铁已经初步建立起了以服务台作为受理使用者服务申请或报障的服务窗口,以一线、二线和三线支持为服务力量的运维管理模式,在服务级别上对外有服务时间和停机时限承诺。但服务承诺较为简单,没有按照服务水平管理体系运作。IT运维服务团队依然常常扮演应急排障的救火者角色,往往缺乏对信息系统的适用性、主动性运维,这与建设规范、稳定、高效的运维体系目标相比仍有很大差距。
从04年开始,我司已开展系统管理及服务管理软件的实施项目,先后部署了各类系统及服务管理系统对现有的基础架构环境进行统一的监控及管理,相关情况如下:
功能模块
|
品牌
|
规格型号/版本
|
系统性能管理
|
CA
|
NSM 3.1
|
网络管理
|
CISCO
|
Cisco work2000
|
主机访问控制
|
CA
|
eTrust Access Control 5.2 r8 SP1
|
安全事件管理
|
CA
|
eTrust Audit 8.0 r8 sp1
|
安全总控中心
|
CA
|
eTrust SCC r8 sp1
|
服务管理(服务台、变更、事件、知识库、满意度调查)
|
CA
|
Unicenter ServicePlus Service Desk 6.0
|
机房环境监控软件
|
GNC
|
GNC-Manager
|
机房动力监控软件
|
美电贝尔
|
BL-iNVR2000E
|
当前,这些服务管理系统存在着厂商支持不足,功能模块较少,功能难以扩展等困难,已不能适应业务发展及管控要求。
总体功能要求概述、项目实施原则,提出总体技术要求,运行维护要求,数据规范要求,主要性能要求和知识转移要求。
在现有信息化基础架构平台的基础上,通过机房改造、对业务系统以及新建项目的硬件设备进行扩容和新购,同时做好保障设备正常运作的数据中心设计、运维管理体系设计和系统实施,保证在新线建设规模不断扩大后业务系统的正常运行和对信息化基础架构的支撑。
项目要求以采购软硬产品为基础,结合具体需求进行数据中心的咨询设计、IT运维体系咨询以及运维系统定制和二次开发的方式进行实施,能缩短项目实施周期,降低项目实施的风险。所有的软硬件产品要求能够提供7×24级别的厂家的广州技术支持。
1. 总体规划
本项目涉及咨询的工作内容,应从组织、业务、工具整体上着眼对IT运维服务管理体系进行总体规划,能够指导未来不同阶段的实施。
2. 业务驱动
应从广州地铁的业务实际需要出发,选择重点与关键的环节进行信息化管理与控制,解决目前在基础架构应用中存在的呼声比较高的问题,在信息化价值和灵活性、管理工作量之间取得良好的平衡,保证在系统实施后能提高工作效率、降低成本。
3. 可靠性
要求系统架构健壮、运行稳定、功能可靠。支持通过容错、热备、故障恢复等方式,实现在系统发生故障时仍能保持正常工作。对于规范要求以外的输入能够判断出其不符合规范要求,并能具备合理的处理方式。保持系统运行稳定,确保数据不因意外情况丢失或损坏。
4. 先进性
要求系统的软硬件平台以及应用软件应采用先进成熟的设备和技术,确保系统的技术先进性,保证投资的有效性和延续性。
5. 可扩展性
要求系统有良好的可扩展性,能够快速响应业务需求的变化。系统采用松耦合构件方式进行设计,对于应用功能的扩展可采用发布新构件方式实现,且新功能的部署不影响客户的使用。
6. 安全性
广州地铁内部已建立起多层次、全方位的信息安全保障体系, 技术平台必须要符合广州地铁信息安全体系的管理要求,并遵循国际安全设计规范。系统关键信息进行机密管理,实现关键信息的加解密保存;系统数据完整,有效防止信息被非法修改。
7. 易用性
要求系统采用简体中文实现,采用人性化的操作界面及符合广州地铁用户操作习惯的设计,提供良好的用户体验,降低用户对操作的适应时间以提高工作效率。项目成果中提供充分的使用指引及说明资料,系统易于学习、使用和管理维护。
8. 经济性
系统应具备高性价比,能对系统资源的使用进行优化,在实现系统功能的前提下,尽量节省硬件开销。
9. 可伸缩性
要求在不用修改系统架构的情况下,通过增加或增强相应的设备即可实现系统功能的扩展支持,包括垂直扩展和水平扩展;
纵向伸缩:能够通过增加硬件资源提高目标平均性能和峰值性能(即响应时间、延迟等)及目标平均负荷和峰值负荷(即并发用户、信息量等);
横向伸缩:能够通过增加应用服务器及实现应用服务器负载均衡、多节点等措施提高目标平均性能和峰值性能(即响应时间、延迟等)及目标平均负荷和峰值负荷(即并发用户、信息量等)。
数据中心的咨询设计建筑的空间布局、各子系统的选择及容量规划应满足未来2030年前的IT系统实际使用需求,避免浪费或规划不足,以建成一个绿色、高可用、高扩展的数据中心。
咨询设计应达到如下要求:
l 绿色节能。计算机机房区及其能源动力保障区的设计应采用切实有效的措施来保证节能、环保的要求,建设绿色的数据中心。本数据中心的PUE值要求小于2.0。
l 灵活性及可扩展性。各系统应具有可持续发展的能力,在系统设计上具有较大的灵活性。本项目建设要求“统一规划、分期实施”,即空间规划、容量规划和系统设计要求“一步到位”,但使用过程中可以随着IT系统的实际规模逐步启用预留空间、安装设备。扩容过程中,应该不影响已建成系统的正常使用。在平面规划和主要系统的设计上,应当采用模块化的手段。
l 可参观性。该数据中心为展示广州地铁总公司IT应用成果的窗口,应具备优秀的展示效果,可全面展示出广州地铁总公司IT应用成果。
l 适用性。投标人要充分考虑IT技术发展趋势和广州地铁总公司整体业务发展需要,对广州地铁总公司数据中心的业务应用进行充分的了解与分析,为广州地铁总公司全方位地整合业务、IT、场地的需求,分析出未来2030年前数据中心在面积、电量、制冷方面的数据以及建设等级标准,清晰描绘出IT和场地的发展路线图。为后期的设计确定明确的需求。
应按照国际标准、国家标准和规范进行咨询设计,并应充分考虑并达到3.2项目实施原则的要求。在不影响总体建设思路的前提下,对于本文档中没有具体明确或描述不尽合理的要求及事项,投标人可以提出更好的方案。
1. 实用性和先进性
采用先进成熟的技术和设备,满足当前的需求,兼顾未来的业务需求,尽可能采用最先进的技术、设备和材料,以适应高速的数据传输需要,使整个系统在一段时期内保持技术的先进性,并具有良好的发展潜力,以适应未来信息产业业务的发展和技术升级的需要。各系统的规划应考虑先进性与实用性相结合,采用成熟的国际先进技术,在满足功能需求和可靠性要求的前提下,尽量节省总体建设投资、降低长期运营成本。
2. 安全可靠性
为保证各项业务应用,网络必须具有高可靠性,决不能出现单点故障。要对数据中心机房布局、结构设计、设备选型、日常维护等各个方面进行高可靠性的设计和建设。在关键设备采用硬件备份、冗余等可靠性技术的基础上,采用相关的软件技术提供较强的管理机制、控制手段和事故监控与安全保密等技术措施提高电脑机房的安全可靠性。为保证提供连续不间断的机房环境服务,数据中心机房必须具有高可靠性。在规划时要减少单点故障的存在,对可能存在单点故障的环节在规划上要尽可能减少其对整个系统的影响。对不同可靠性要求的机房区域,应保留一定的灵活性,即随着未来IT系统部署的变化,相应的机房区域可以较灵活地提高或降低可靠性级别。
3. 灵活性与可扩展性
数据中心机房必须具有良好的灵活性与可扩展性,能够根据今后业务不断深入发展的需要,扩大设备容量和提高用户数量和质量的功能。具备支持多种网络传输、多种物理接口的能力,提供技术升级、设备更新的灵活性。
4. 标准化
在数据中心机房系统结构设计,基于国际标准和国家颁布的有关标准,包括各种建筑、机房设计标准,电力电气保障标准以及计算机局域网、广域网标准,坚持统一规范的原则,从而为未来的业务发展,设备增容奠定基础。
5. 工程的可分期性
在该IDC项目设计中,数据中心机房的工程和设备都为模块化结构,相当于将该工程分期实施,而各期工程可以无缝结合,不造成重复施工和浪费。
6. 经济性/投资保护
应以较高的性能价格比构建数据中心,使资金的产出投入比达到最大值。能以较低的成本、较少的人员投入来维持系统运转,提供高效能与高效益。尽可能保留并延长已有系统的投资,充分利用以往在资金与技术方面的投入。
7. 可管理性
在数据中心的设计中,必须建立一套全面、完善的机房管理和监控系统。所选用的设备应具有智能化,可管理的功能,同时采用先进的管理监控系统设备及软件,实现先进的集中管理监控,实时监控、监测整个电脑机房的运行状况,实时灯光、语音报警,实时事件记录,这样可以迅速确定故障,提高的运行性能、可靠性,简化机房管理人员的维护工作,从而为其数据中心机房安全、可靠的运行提供最有力的保障。
本数据中心设计要求依据ANSI-TIA-942-2005标准不同等级要求进行咨询,并结合广州地铁总公司不同的业务应用进行优化,确定相应等级。同时,需保证设计满足国内相关各专业规范及标准要求,数据中心设计主要参考的标准包括但不限于以下规范:
Ø ANSI-TIA-942-2005(数据中心用远程通信基础设施标准)
Ø TierClassification_WP(Uptime institute)
Ø 电子信息系统机房设计规范 GB/T 50174-2008
Ø 国家各专业规范要求
IT运维管理系统运行在高端PC服务器上,应用服务器、数据库服务器共需要两台,数据存放于高性能存储系统中。目前,广州地铁已实现了容灾保护,要求本项目的建设能支持和符合广州地铁容灾管理要求。
其中,应用管理服务器要求实现软件负载均衡,数据库服务器实现硬件双机热备。
备注:所有硬件由广州地铁提供。
系统需要考虑扩展性和与内部系统的集成性,采用的二次开发技术必须符合广州地铁相关软件开发标准和规范要求。系统应采用三层的架构、B/S或者C/S结构的方式进行应用设计、开发,遵循业界通用开放标准。数据访问层采用数据持久化技术实现数据的访问,以数据库连接池实现,并采用缓存的设计,以保证系统的性能。
1. 系统应具有高可用性,支持在线用户数300以上,支撑并发用户数100个以上,自动实现负载均衡,保持系统运行稳定,确保数据不因意外情况丢失或损坏。
2. 系统的高可靠性和高可扩展性,即便在用户量增大时,也能保持一个良好的响应时间。
3. 系统平均响应时间不超过5秒。
4. 系统各模块/典型事件的响应时间应符合用户需求。系统支持磁带库备份,确保数据不因意外情况丢失或损坏。
5. 系统可保证主机、操作系统、网络、数据库和应用软件能7*24小时平稳运行。
6. 系统支持集群扩展,能通过扩充机器数量扩充系统能力,支持异质资源作群集。
7. 系统支持双机热备,单台设备的故障不影响业务进行,进行故障恢复不中断业务服务。
8. 系统网络带宽达到1Gbs,CPU最大使用率<70%,内存最大使用率<70%。
1. 支持故障的透明迁移,自动容错和故障恢复。
2. 确保硬件出现单点故障时,不影响信息系统的使用。
3. 系统无故障运行时间是7*24小时,实现故障恢复不中断业务服务。
4. 系统的业务可用性应达到:99.9%。
5. 系统MTBF(平均故障间隔)>6个月。
6. 系统MTBR(平均修复时间)<1小时。
客户端机器配置:
浏览器:MS Internet Explorer 6 及以上
操作系统: Windows2000\ WindowsXP及以上
内存:1GB及以上
CPU:cpu1.2GHz及以上
服务端系统软件:
内容
|
类型和版本
|
备注
|
操作系统
|
Windows Server
|
广州地铁提供
|
数据库
|
Oracle数据库/ Microsoft Sql Server 2005
|
广州地铁提供
|
运行环境
|
WebLogic/Microsoft IIS6.0及以上
|
广州地铁提供
|
压力测试软件
|
LoadRunner
|
乙方提供
|
系统安全要求包括:鉴权认证、授权管理、操作审计、系统日志、加解密、异常处理、SQL注入、备份/恢复、非法入侵(集成接口)。
遵循国际安全规范及国家安全规范,系统达到国家计算机信息系统安全保护等级第二级的要求,并通过广州地铁的安全性测试。要求包括但不限于如下内容:
1. 身份鉴别:实现与广州地铁域的集成,对公司内部用户以AD为统一鉴权要求.
2. 必须遵循广州地铁、网络安全、主机系统安全、应用安全的要求;
3. 权限管理:系统以RBAC方式进行授权系统,能够导出权限清单。
4. 接口安全:保证集成接口的安全,集成接口具备调用权限的鉴别和传递数据的加解密机制。
5. 安全协议:使用https等安全协议。
6. 系统日志:记录系统错误、异常跟踪信息。
7. 审计日志:可以通过日志记录用户登录、数据操作信息等关键操作,提供对记录的操作日志进行检索和查询的方式,并生成统计信息。
8. 软件容错:支持通过容错、热备、故障恢复等方式,实现在系统发生故障时仍能保持正常工作。
9. 数据加解密:用户密码等敏感数据必须机密,Web Service的XML SCHEMA请求文件,必须包括加密的用户和密码的认证信息。
10. 备份恢复:实现系统的全备、增量、差分等备份方式,在需要时可以快速恢复到所需的状态。
采用基于SOA架构的集成方式进行设计,系统须提供多层次的应用开发接口,所有的功能基于软件产品集成组件的方式进行函数化或者过程化,为进一步的应用开发提供接口基础。系统接口要求如下:
1. 接口以WebService作为标准实现方式,交互集成可通过BizTalk进行,对集成的接口标准、参数要求等内容须符合《广州地铁企业应用集成规范和标准》的规范要求。
2. 能够支持广州地铁企业内部门户、单点登录、广州地铁统一认证平台的集成,为适应广州地铁信息化环境,便于维护;
3. 支持业界的开放性标准,包括:XML,LDAP,CORBA,WML,Web Services,J2CA规范等。
提供企业级的Web Services,支持与Microsoft Web Services之间的互联,支持WSDL、UDDI、SOAP标准和协议。
1. 项目实施需要需求符合广州地铁数据架构、数据标准体系和管理规范、符合业界标准规范。
2. 项目实施有数据准确性要求,数据需求真实反映业务需求。
3. 项目实施对数据更新、传输、交互等有及时性要求,满足业务和数据管理要求。
4. 项目实施有数据一致性要求,对数据在系统间、系统内不同模块间的数据要保持一致。
5. 项目实施需对系统/模块间的信息(数据)流转进行分析,要保持信息(数据)的定义和属性的唯一和一致。
6. 项目实施需对本系统与其它系统集成、交互、共享数据进行梳理和分析,满足业务和管理需求。
7. 项目实施如涉及历史数据的清理、转换和导入,需提出合理可行的方案。
8. 必须对数据录入和导入进行规范性校验,数据录入界面符合易操作性的要求。
9. 从初始化开始,系统的数据必须真实、有效,所有的测试数据必须清除。
10. 项目实施内容和交付成果有数据相关内容,需求分析、总体设计和详细设计方案、初始化方案及报告(含数据收集模板)、系统维护和管理手册满足业务数据需求和管理要求,符合数据标准和管理规范。
甲乙双方将共同组成实施团队负责本项目的实施工作。
1. 甲乙双方共组实施团队目的是促进知识转移,适当降低项目成本,使项目总体效益最大化,项目实施工作以乙方团队为主导、甲方人员配合的方式开展。
2. 乙方在编制工作计划时应充分考虑甲方团队的工作能力,乙方应在事前进行方法论的培训,以确保甲方实施的方法与乙方相一致,工作标准能够统一。
3. 乙方应合理安排工作,能够让甲方团队参与到项目各个环节有代表性的工作中,安排资源对甲方团队承担的工作给予适时的指导和支持。
4. 项目实施的工作标准和验收标准,对甲乙方团队各自负责的工作要求应一致。
5. 上述要求将作为考核和检验乙方知识转移的实现程度和工作质量。