常见AD排错工具

分类: AD技術 418人阅读 评论(0) 收藏 举报

enable ndsi diagnostics log:

    hklm/system/currentcontrolset/services/ntds/diagnostics

    取值范围:0-3

    可在事件查看器目录服务中查看,3为上限,日志量相当大,应注意调整日志文件大小。

    2、dcdiag

    dcdiag /v(详细输出) /c(开启所有项的测试) /a(对站点内所有DC进行测试)

    3、netdom

    对客户机加入域及信任关系管理

    Example:

    netdom query dc

    netdom query fsmo

    5%-10%的错误是由于对网络结构的错误认识。

    4、netdiag

    Example:

    netdiag /debug 〉netdiag041218.txt (加debug参数为最详细记录)

    notepad netdiag0411218.txt

    5%错误是由网络配置造成的

    第二部分:AD维护中三种常见故障:

    一、DNS配置相关故障

    1、综述:AD中DNS起到路标和指示灯的作用,至少50%的AD故障源于DNS.

    DNS中最重要的是SRV纪录而不是A纪录,通常SRV纪录对应有一个A纪录

    SRV Record example: _ldap._tcp,dc._msdcs.xyz.com.600 IN srv 0 100 389 dcserver1.xyz.com

    用户登录域时通过dns服务器找寻dc的,_msdcs区域中包含所有dc的服务纪录,作用就是为了定位域控制器和全局编目服务器,win2k中若有多个域则只有根域中有该区域,子域中没有。

    2、几个验证和修复工具

    (1)使用nslookup来记录dns记录是否完整

    (2)若dns记录缺失,可通过:

    a:重新启动Net Logon服务

    b:使用nltest.exe /seregdns (安装support tools工具后才会有)

    注意dns配置要求:允许动态更新,区域名称和AD域名相一致,dns服务器本身需要配置dns域名后缀

    3、实例演示:验证和修复dns故障

    2003中_msdcs区域作为独立一个区域存在,若出现机器登录域非常慢,90%是dns出了问题。

    (1)若出现记录缺失情况:

    stop netlogon & start netlogon 重新启动该服务,其实每次关机重启时均会重新启动该服务。

    (2)若无任何记录区域

    则新建记录区域,若操作过程中出现无法删除和拒绝提示时,则可能是因为多台DC之间状态没有同步,只需稍等片刻即可。

    多域环境中,_msdcs区域必须分开创建,否则只能找到本域的dc,而找不到森林中其它域的gc服务器

    (3)修复工具

    nltest.exe /dzregdns

    特点:速度快且不会对用户有影响

    从安全角度考虑,最好将dns配置成活动目录集成区域,2003中新添条件转发特性。

    二、关于DC之间的复制故障

    nt4单向复制,PDC-〉BDC,存在很多弊端。

    DC之间复制的内容:

    (1)目录服务复制:主要是数据库的复制(AD对象,包括用户,计算机等)

    (2)文件复制服务(FRS)sysvol文件夹,包括组策略实体。

    2、排错工具

    (1)AD replication monitor图形工具

    a.检查ad复制

    b.图形化显示复制拓扑

    c.强制复制

    (2)命令行工具repadmin

    a.诊断dc间复制故障

    b.确认复制伙伴

    c.确认活动目录对象复制来源

    d.强制复制

    dc之间的文件复制服务

    dc之间复制sysvol共享文件夹

    (1)netlogon共享:低版本客户端的登录脚本和系统策略

    (2)sysvol共享:为win2k及以后客户端提供组策略,导致组策略分发不成功

    命令行排错工具:ntfsutil

    3、通常复制故障:

    (1)拒绝访问:时钟不同步,网络故障

    (2)dns查找故障,dsa操作无法继续

    (3)操作被排队或没有显示任何复制链接

    (4)复制访问被拒绝或正在删除名称上下文

    (5)站点之间存在重复的连接对象

    (6)多个域控中所应用的组策略不一致

    (7)目录服务因太忙而无法完成操作

    其中3-7项建议等待一段时间一般会自动解决

    4、实例演示:使用工具诊断复制故障

    (1)AD中通常会自动生成环形复制拓扑结构,域服务器之间的复制间隔为5分钟,3台DC之间的同步大概需要为15分钟左右(基于100M以太网),使用站点和服务来操作。

    (2)若无法复制成功,可利用复制监视器工具来控制复制。

    强制生成复制拓扑结构和显示复制拓扑结构,拓扑结构图中可以查看操作主机角色是否正常工作;察看复制对象的USN(update serial number);察看复制过程中的一些错误

    (3)dsastat

    三、Operation Master Roles(fsmo)

    1、何时需要转移操作主机角色?

    2、决定操作主机角色拥有者:图形化接口工具和ntdsutil

    3、移转方式:transfer(在线移转)和seize(强制转移)

    4、移转工具:图形化接口工具(AD用户和计算机、AD域和信任关系、AD架构)

    5、命令行方式下转移FSMO角色:

    ntdsutil.exe

    roles

    connections

    connect to server servername

    quit

    seize pdc

           rid master

           infrastructure master

           schema master

           domain naming master

    transfer

    quit

    尽可能使用transfer而不是seize,当中的servername是即将成为操作主机角色的服务器,图形方式下,需要先连接其他的域控制器后才可以更改操作主机角色

    第三部分:Troubleshooting Case Study

    1、AD的问题一般分四个层面:网络问题、活动目录的支撑服务(dns/wins/etc)、活动目录的复制问题、域控制器的个体原因。

    2、典型案例:

    case(1):时间源同步问题

    case(2):

    问题背景:用户登录或访问服务器,经常出现“由于时间差异,访问拒绝“的提示

    问题解决:

    与kerveros协议有关,用来代替原先的ntlm协议,所有的计算机(包括client和server,os为win2k及以上),会自动将根域的PDC模拟器作为时间服务器,W32Time服务按照一定的周期进行时钟校正:从计算机启动开始,尝试以45分钟作为间隔,联系时钟服务器,进行时钟同步;如果同步成功,以8小时为间隔,进行同步验证;如果同步失败,开始尝试进行时钟同步。为了保证时间服务器正常工作,在根域的PDC模拟器上建议设置外部时间源,指向INTERNET上的时间服务器,在其他计算机上保证Windows Time服务正常启动。

    具体要求:dc之间时间相差不能超过5分钟,client与dc之间相差不能超过30分钟

    问题根源:kerberos协议要求计算机时钟同步经过分析,发现客户端计算机启动某个应用程序,会在启动时与服务器(一台unix计算机)进行时钟校准,而该服务器时钟与DC始终存在约45分钟的差异,将域控制器时钟与服务器同步,并建议设定同一时间源。

    CASE(3)

    问题描述:某客户报告,客户端计算机启动缓慢,在出现“正在准备网络连接“提示时,会有长时间停留,经过检查发现,客户端计算机虽然已经正确配置了DNS服务器地址,但在同时作为域控制器的DNS服务器上,发现没有相应的记录,客户使用了SOMEDOMAIN形式的域名。

    问题原因:Win2k sp4/winxp/2003不在顶级域下注册dns记录

    解决方法:修改注册表和使用组策略(客户端本地计算机策略/管理模版/网络/DNS客户端),在客户现场,临时使用了手动加载netlogon.dns文件的方法(应该注册的dns记录)

    %systemroot%/system32/config/netlogon.dns(应该写到dns服务器内的记录),将记录复制到dns服务器数据库中,应先将集成的dns区域改成主区域,然后到dns数据库记录文件进行粘贴,然后再修改为AD集成的DNS区域(存在多个域时工作量大)

    CASE(4)通过修改注册表强行卸载dc:

    键值位置:hklm/system/controlsset/control/productoptions/ProductType LanmanNt修改为/ServerNT,重启机器此时然后便可以卸载dc了,原理为启动时会检查该键值,如果为ServerNT,便不启动dc所需的相应服务,但也有些副作用,如intersitemesseging服务会报错,应为它仍然会启动,而它相关联的服务均已停止故出现报错信息,此时应该将该服务设为手动或禁用,强行卸载完DC后,应该在保留的DC上利用NTDSUTIL工具中的metadata cleanup将无用的信息清除掉。


不能卸载之可能原因:网络问题,不能连通操作主机;长久没有同步等等