本文出自 “叶俊生” 博客,请务必保留此出处http://yejunsheng.blog.51cto.com/793131/175814

 
了解可用性、可靠性和可伸缩性: 可用性-->可用性(%)=(总的使用时间-总的故障时间)/总的使用时间。可用性级别为"三个九"的解决方案能够在99.9%的时间内支持其预期功能,相当于在24x7x365(每天24小时/每周七天/一年365天)的基础上,每年8.76小时的年停机时间。而可用性别为"四个九"的解决方案为每年52.56分钟。
可靠性-->平均故障间隔时间(MTBF)=(总的使用时间-总的故障时间)/总的故障数量
可伸缩性-->向上扩展 横向扩展
了解企业应用的高可用性规划过程: Microsoft Operations Framework(MOF)-->MOF是一个为您提供操作指南的最佳实践、原则和模型的集合。Solution Accelerator for MSA Enterprise Messaging-->微软系统体系结构企业消息处理的解决方案加速器提供了参考和实施指南。
了解技术、人员及过程对高可用性的影响: 技术-->高可用性解决方案的技术部分由许多方面组成,例如,服务器硬件、操作系统、设备驱动程序、应用程序以及网络。
人-->适当的培训和技能证书可以确保管理关键任务系统和应用程序的人具有胜任此工作所需的知识和经验。
过程-->组织必须制定并强制施行一组正确定义的过程, 这些过程应涵盖一个解决方案周期的所有阶段。
了解如何为应用高可用性建立服务级别协议: SLA类别 SLA元素
运行时间 系统服务时间、停机时间
服务可用性 服务运行时间百分比、邮箱存储装入时间百分比、域控制器服务运行时间百分比
系统性能 邮件系统同时支持的内部用户数、远程连接用户数、每个时间单位支持的邮件事务数、系统延迟可接受程度
灾难恢复 故障恢复时间、恢复服务所需时间、恢复数据所需时间
帮助中心/支持 帮助中心对用户各种问题的响应及处理
其他 用户邮箱容量及特殊要求
了解如何确定风险和评估高可用性解决方案: 环境问题 硬件问题 通信和连接问题 软件问题 服务问题 过程问题 应用程序设计问题 人员配备问题
Exchange Server 2003的高可用性回顾(一)-->见下图:
20032595
Exchange Server 2003的高可用性回顾(二)-->见下图:
20032596
Exchange Server 2003的高可用性回顾(三)-->见下图:
20032597
Exchange邮件系统的日志功能: 应邮件服务器发生故障时恢复需要-->电力中断 硬盘故障 系统损坏
维护邮件系统数据库的一致性
提高效能-->Write-ahead日志-->写入数据库的时机: 邮件操作首先写入日志 检查点出现时才写入数据库 操作直接写入日志非常快 批量将操作写入数据库比较有效率
企业拓扑结构-->见下图:
20032598
数据库和日志的运作情景-->见下图:
20032599
LCR/CCR的连续复制运作结构图-->见下图:
20032600
LCR/CCR的复制路径-->见下图:
20032601
ESE日志文件: 日志的举例-->E0000000001.log E0000000002.log E00.log(正在使用的日志)
当E00.log已满时-->E0000000001.log E0000000002.log E00.log改名为E0000000003.log 新的E00.log会被建立
每个存储组有一个对应的号码-->第一个存储组为00 第二个存储组为01 ...
CCR的计划系统中断: Passive Node只拷贝logfiles-->Exx.log使用中 在线转移Active Node时'Exx.log会直接被拷贝至Passive Node 见下图:
20032602
有数据丢失时的故障转移: 当故障转移没有来得及有拷贝所有日志文件时 备用节点的数据库没有完全更新 日志的号码被重复使用 主备节点中的日志文件已是不同的内容 见下图:
20032603
丢失日志回弹: 延迟写入数据库
减少数据库全部复制的必要性
增加可靠性-->减少丢失日志所造成的不一致性
减少eseutil的使用-->consistency 不用修复即可装入
允许故障后数据丢失到LLR相同的深度-->数据库相同 日志不同
本地连续复制的基本体系结构-->见下图:
20032604
本地连续复制的特点: 可有多个存储组,必须每个存储组使用一个数据库 如果组织中存在多个公用文件夹数据库,则不能对公用文件夹数据库使用 利用日志重放技术进行工作,共有两份数据库的拷贝 设置简单,但是故障恢复需要手动处理 为提高性能和恢复能力对磁盘进行分区 确保充足的磁盘空间 最好选择多通道的硬盘控制卡,甚至是采用不同的硬盘控制卡 确保充足的CPU和内存资源
LCR降低了Exchange2007的总拥有成本: 允许快速切换到数据辅助副本,从而缩短了数据级灾难的恢复时间。少了数据保护所需的定期备份次数。发生灾难时,数据备份非常重要。尽管使用LCR时仍然需要进行备份,但它确实明显降低了对常规每日完整备份的需要。允许将备份进程从生产存储组转移到存储组副本。所有四种备份类型(完整、复制、增量和差异)均可以从LCR副本位置建立,这样就可以保留活动数据库逻辑单元号(LUNs)上的重要磁盘I/O,以便为客户端提供服务。
如何部署本地连续复制: 准备LCR副本的磁盘管理活动-->存储组系统文件目录 存储组日志文件目录 数据库数据文件目录
启用LCR-->指定LCR的目的目录 启用存储组的LCR
故障恢复-->卸载数据库 使用Restore-StorageGroupCopy cmdlet激活数据库的副本-->例:Restore-StorageGroupCopy-Identity:"server\First Storage Group"
群集连续复制的基本体系结构-->见下图:
20032605
群集连续复制的故障恢复: 群集服务器监督系统资源-->故障转移的监测不是即时的
将会造成故障转移的情形-->操作系统停止错误;检测到的操作系统挂起(停止响应);电源完全中断;处理器芯片、母板以及底板不可恢复的故障;或节点的通信完全失败 主节点数据中心故障 主节点信息存储故障
不会造成故障转移的情形-->应用程序磁盘、数据库和日志磁盘空间不足 部分数据信息、日志信息丢失、损坏 系统驱动器及应用程序驱动器故障
群集连续复制的部署-->安装多数节点集文件共享见证功能 为群集连续复制配置网络连接 为群集邮箱服务器创建新群集 配置文件共享见证 将MNS仲裁配置为使用文件共享见证 安装系统所需的必要组件和补丁 在主动节点上安装邮箱服务器角色 在被动节点上安装邮箱服务器角色 配置传输Dumpster容量
安装多数节点集文件共享见证功能(一): 设定MNS File Share-->配合Majority Node Set(MNS)quorum with file share witness技术 可将MNS File Share建立在Hub Transport Server Role上 KB921181 Hotfix(X86)-->http://www.microsoft.com/downloads/details.aspx?familyid=EE26BCF1-42AC-4B33-B3D8-863AC089A1AB&displaylang=en KB921181 Hotfix(X64)-->http://www.microsoft.com/downloads/details.aspx?familyid=C62E21D9-192C-44DD-9C80-403BDA97990C&displaylang=en
为群集连续复制配置网络连接(二): 公用网络配置-->设置公用IP、DNS、WINS地址 选中Microsoft网络的文件和打印机共享 在"WINS"选项卡上,确保选中"禁用TCP/IP上的NetBIOS"
专用网络配置-->设置专用IP地址 选中"Microsoft网络的文件和打印机共享"和"Microsoft网络的客户端"复选框 在"高级TCP/IP设置"中的"DNS"选项卡上,在"DNS服务器地址(按使用顺序排列)"下,确保未列出任何地址及确保已清除"在DNS中注册此连接的地址"复选框。在"WINS"选项卡上,确保选中"禁用TCP/IP上的NetBIOS"。
为群集邮箱服务器创建新群集(三): 使用Cluster.exe新建服务器群集向导新建群集-->指定群集名称(例如:EXCluster) 指定群集IP 制定群集服务账户 指定群集仲裁为多数节点集
使用Cluster.exe在群集中安装第二个或后续节点-->指定需要加入的群集名称 制定群集服务账户
创建文件共享见证(四): 在File Share Server上执行-->mkdir<ShareDirectory> net share<ShareName>=<ShareDirectory/GRANT:<CSA>,FULL cacls<ShareDirectory>/G BUILTIN\Administrators:F<CSA>:F 注意: CSA指Cluster Server Account,例如: cms\CluService
将MNS仲裁配置为使用文件共享见证(五): Cluster res"多数节点组合"/priv MNSFileShare="<ShareName>" Cluster group"群集组"/move Cluster res"多数节点组合"/priv
安装系统所需的必要组件和补丁(六): 在非群集服务器上安装-->Hub Transport Server Role Client Access Server Role
在Active & Passive Node安装-->.Net Framework 2.0 Microsoft Management Console(MMC)3.0 Microsoft Windows Powershell 1.0 IIS
安装Hotfix KB898060, KB904639, KB926676, KB918980
在Active Node安装Exchange(七): 安装类型-->选择[自定义Exchange Server安装]
选择服务器角色-->选择[主动群集邮箱服务器角色]
群集设定-->群集类型: 选择[群集连续复制]
指定此群集的安装选项: 群集服务器名称 群集邮箱服务器IP地址 指定群集邮箱服务器数据库路径
在Passive Node安装Exchange(八): 安装类型-->选择[自定义Exchange Server安装]
选择服务器角色-->选择[被动群集邮箱服务器角色]
设定传输Dumpster的容量: 在Exchange Hub Transport server应确保: 有足够的硬盘存储空间给每一个CCR型的Storage Group transport dumpster queue 权限必须为Exchange Organization Administrators group的成员
设定指令-->Get-transportconfig Set-transportconfig -MaxDumpsterSizePerStorageGroup<size> -MaxDumpsterTime<timespan>
例子-->Set-transportconfig -MaxDumpsterSizePerStorageGroup 20MB -MaxDumpsterTime 07.00:00:00
单一副本群集的基本体系结构-->见下图:
20032662
单一副本群集的部署: 创建两节点以上的Windows群集系统 安装系统所必须的组件和Hotfix 在主节点上面安装Exchange 在备用节点上面安装Exchange
创建两节点的Windows群集系统(一): 各个节点利用共享磁盘建立仲裁磁盘
配置专用网络网卡-->Netbios over tcp/ip关闭 DNS留空白
使用cluster /create /wizard加入节点1
使用cluster /add /wizard加入节点2
将专用网卡指定为群集内部通信所使用
将公用网卡指定为群集内部通信及外部通信所使用,即可用
安装系统所需的必要组件和补丁(二): 在非群集服务器上安装-->Hub Transport Server Role Client Access Server Role
在Active & Passive Node安装-->.Net Framework 2.0 Microsoft Management Console(MMC)3.0 Microsoft Windows Powershell 1.0 IIS
安装Hotfix KB898060,KB904639,KB926676,KB918980
在Active Node安装Exchange(三): 安装类型-->选择[自定义Exchange Server安装] 选择服务器角色-->选择[主动群集邮箱服务器角色] 群集设定-->群集类型: 选择[单一副本群集] 指定此群集的安装选项: 群集服务器名称 群集邮箱服务器IP地址 指定群集邮箱服务器数据库路径
在Passive Node安装Exchange(四): 安装类型-->选择[自定义Exchange Server安装] 选择服务器角色-->选择[被动群集邮箱服务器角色]
Exchange Server 2007与Exchange Server 2003的高可用性解决方案比较:
以前版本的Exchange邮件系统高可用性解决方案-->前后端,前端冗余,后端群集 特点: 构建成本较高,服务冗余,数据库不冗余,实现服务器冗余需采用第三方硬件或软件厂家的解决方案
Exchange Server 2007的高可用性解决方案-->LCR、CCR、SCC 特点: 同时提供了对服务和数据库的冗余,允许一台单独的服务器在本地复制其数据库用于灾难恢复,客户可以实现多种存储选择,通过日志文件重演进行连续复制以提高性能,可以在不影响主动节点性能的情况下在被动节点上备份邮件系统数据库和事务日志,以把主动节点和被动节点放在不同的物理位置
Exchange Server 2007是企业值得信赖的低成本高可用邮件系统解决方案:
由于使用CCR降低了从备份数据进行恢复的必要性, 因此用户可以通过重新评估自己的备份策略来降低运营成本。
LCR允许从磁盘或数据库的问题中进行快速恢复,而只需一块或多块额外磁盘来存储数据库副本。
在没有存储冗余的情况下,共享存储群集只提供服务的故障转移,共享存储中的数据库是一个单一的故障点。
对于没有该需求或对多节点群集有预算的组织来说,LCR是一种很好的方式,它提供了经济的冗余方案,在磁盘出现故障或数据库损坏的情况下可以缩短宕机的时间。
如何配置Exchange Server 2007群集连续复制呢?
David物流公司去年新购置了Exchange2007服务器,但在使用中发现,由于服务器偶尔出现故障,导致公司暂时不能收到客户邮件问题严重,公司IT信息部提倡,将Exchange Server群集化,即可解决上述问题
下面我就把David物流公司此次Exchange Server群集化改造过程给大家分享一下吧。
简单介绍一下本地连续复制、群集单一复制和群集连续复制的区别:
(1)本地连续复制,数据是两份,但是服务就是一份
(2)群集单一复制,数据是一份,但是服务是两份
(3)群集连续复制,数据是两份,服务也是两份。
故名思义,单一副本群集包含单个邮箱数据副本。承载邮箱数据的存储出现故障时,不会导致自动恢复。实际上,这类故障通常会导致长时间的中断和数据丢失。在 SCC 中通过以前的群集解决方案进行的改进解决了客户对以前的高可用性解决方案提供的许多反馈。但是,SCC 仍然涉及使用共享存储所具有的复杂性。它至少具有两个现成的单个故障点:单个仲裁磁盘和 Exchange 数据的单一副本。在 Exchange 2007 中,存在另一种类型的高可用性配置,可以提供完全冗余,无需 Windows Server Catalog of Tested Products 的 Cluster Solutions 类别中的硬件。此解决方案称为群集连续复制 (CCR)。
CCR 使用内置的异步日志传送功能,在故障转移群集中的两个服务器之间复制邮箱数据。通过将复制和群集相集成产生了一个解决方案,该解决方案无任何单点故障,但提供从服务器故障自动恢复的功能。此外,也不需要共享存储,因而降低了部署成本和复杂性。CCR 仅支持二节点群集,而且仅支持两个数据副本(主动副本和被动副本)。下图描述了典型的 CCR 配置。
20032605
我用了3台虚拟机完成上述拓扑中的角色:
DC+Exchange+集线器传输角色 IP:192.168.0.1
主动节点CCR-Node-1 IP:192.168.0.2 心跳IP:10.0.0.2
被动节点CCR-Node-2 IP:192.168.0.3 心跳IP:10.0.0.3
Cluster-CCR: 192.168.0.6
Excluster-CCR:192.168.0.8
系统:Windows 2003 SP2
软件:Exchange Server 2007
开始部署:
1、创建DC(怎样创建?dcpromo,具体我就不多说了,如有不明白的同志去搜一下,很多的。),提升AD模式,安装.NET2.0 2.0HOTFIX 夏令时补丁 POWER SHELL,COM+ WWW服务等安装EXCHANGE SERVER 2007的必要组件,这里我只安装客户端访问角色和集线器传输角色2个组建,邮箱角色是要做成群集,所以这里不安装。
简单介绍一下安装吧, 一定要注意,只安装这两个角色(如果需要统一消息服务也可勾选,这里指不要勾选邮箱角色)。见下图:
20032608
OK,这两个角色安装完毕。见下图:
20032609
2、现在开始把另外2台Server部署成集群,先将他们加入域,部署两个NODE,再做相同的Exchange群集邮箱角色。
客户机需要2块网卡,一块做外网,一块做心跳,两台Server的心跳网卡用一根交叉线对接就可以了。
我先介绍一下心跳的设置,有些细节网上没有写清。
注意只填写IP和子网掩码就OK了。
20032610
将高级设置中,在DNS中注册此连接的地址前的勾去掉。
20032611
在WINS选项中,选择禁用TCP/IP上的NetBIOS(S)。见下图:
20032612
在连接中只使用Internet协议(TCP/IP)。见下图:
20032613
从高级设置中,将外网的访问顺序调整到第一位。见下面二张图:
20032614
20032615
重复上述步骤设置CCR-Node-2,然后Ping一下,看心跳是否通。
20032616
心跳网卡配置完了,外网网卡我就不介绍了o(∩_∩)o…我们开始配置群集,我先强调一下,这里配置的群集和网上介绍的有些不同,网上介绍的大多是单节点群集,需要仲裁设备,而我们今天用的是连续复制,不是仲裁,所以要配置多节点群集。
选择创建新群集 见下图:
20032617
20032618
输入群集名称 见下图:
20032619
检查计算机名是否为你要添加的节点计算机名 见下图:
20032620
这里需要注意,有两个黄叹号,是没有找到仲裁设备的警告,之前我们说了,我们今天配置的是多节点群集,不需要仲裁设备,所以忽略它。见下图:
20032621
输入群集IP 见下图:
20032622
输入域中有权限的用户名、密码,这里我用Administrator代替了,建议部署时单独创建。见下图:
20032623
这里注意了,不要急着点下一步,我们先选择仲裁。见下图:
20032624
在弹出的群集配置仲裁对话框中选择多数节点集后再按下一步。见下图:
20032625
群集创建完毕 见下面二张图:
2003262620032627
查看群集管理器 见下图:
20032628
登陆到CCR-Node-2,打开群集Cluster,选择新建节点。见下图:
20032629
向导 见下图:
20032630
检查计算机名是否为你要添加的节点计算机名,单击添加按钮。见下面二张图:
20032631
20032632
添加CCR-Node-2前检查。见下图:
20032633
输入Administrator的密码
20032634
确认信息 见下图:
20032635
完成CCR-Node-2到Cluster的添加。见下面二张图:
20032636
20032637
两个节点都已成功添加,现在可以开始配置群集设置,并检查各各节点是否正常工作了。
配置心跳网络属性 见下面二张图:
20032638
20032639
配置外部网络属性 见下面二张图:
20032640
20032641
为了确保群集正常工作,要开始正式配置CCR了。配置CCR,MNSFileShare是不可少的一部分,并且强烈建议大家把这个共享放在Exchange 2007的集线器传输(Hub Transport)角色上。但是也可以在其他服务器上创建这个共享文件夹,这里我在CCR-Node-1这台机的C盘创建了一个名为MNS的共享文件夹,并赋予完全控制权限,然后开始配置多数节点集。
使用命令行配置文件共享见证的多数节点集(MNS).
Cluster res "Majority Node Set" /priv MNSFileShare="<shareName>" 见下图:
20032642
现在可以在我的CCR-Node-1上安装主动群集邮箱角色了,(这里注意,如果您的系统是Windows 2003 SP1请打补丁KB921181 Http://go.microsoft.com/fwlink/?linkid=69785 ) 。
那些欢迎、许可条款等界面我就不一一列出了,这里注意,一定要选择自定义安装。见下图:
20032643
只勾选主动群集邮箱角色 见下图:
20032644
选择群集类型为群集连续复制,设置群集邮箱服务器名和群集邮箱服务器IP地址。见下图:
20032645
准备情况检查(检查项很少了吧)。见下图:
20032646
好了,主动群集邮箱角色安装完成。见下图:
20032647
到CCR-Node-2上开始安装被动群集邮箱角色。见下图:
20032648
准备情况检查(只有一项)见下图:
20032649
被动邮箱角色也安装完成了,庆祝下(啪啪)o(∩_∩)o… 见下图:
20032650
打开群集管理器。看看自动生成的Exchange虚拟服务器,并确认这些资源可以在两个节点间转移。见下图:
20032651
在命令提示符下查看,群集IP也都在CCR-Node-1上。见下图:
20032652
观察CCR-Node-2上没有资源 见下图:
20032653
在命令提示符下观察CCR-Node-2上也没有群集IP。见下图:
20032654
先建两个用户测试下邮箱是否可用 见下面几张图:
20032655
20032656
再建一个 见下面二张图:
20032657
20032658
以用户CCR-01登陆,给自己和用户CCR-02发两封邮件,自己收到正常。见下图:
20032659
模拟故障,将资源飘至CCR-Node-2。令我不太相信的就是切换速度如此之快,汗……
见下图:
20032660
再以用户CCR-Node-2登陆,可以收到CCR-Node-1发送的两封邮件,并且再发送给自己一封,也成功收到。见下图:
20032661
好了,就先到这里吧,本人废话太多,实验设备配置很低,写的也很匆忙,有错误或遗漏的地方还请好心人在评论中指出。