最近被OSD折腾了个半死。RP问题都出了,甚至还有几个遗留问题没有解决。
不过倒是好好学习了一下SCCM OSD排错方面的知识,给大家分享一下。
要进行故障分析,我们先要了解一下OSD的原理。
我们从需要被部署的客户机从开机分析整个流程:
1、是否支持网络唤醒,还是手动开机;
2、开始对应网卡的PxE;
3、获取IP地址;
4、访问DHCP提供的PxE源IP,检查是否有该机器的任务;
5、通过Pxe源IP,使用TFTP协议下载Boot镜像(SCCM OSD加载的是WinPE);
6、完成加载,WinPE初始化硬件设备;
7、WinPE访问SCCM下载任务序列;
8、WinPE加载对应的任务序列;
9、分区、格盘;
10、下载Install的Wim;
11、释放Wim;
12、安装ConfigMgr Client Package;
13、重启;
14、通过Sysprep封装系统;
15、Over!

接下来我们来分析每一个过程可能发生的错误,及错误的表现,已经可以查询的日志:
1、这个我还没有试过。。。。。。不过记得要在站点那里开启对应的功能;
SCCM OSD排错分析(一)_职场
2、这里需要注意的是服务器部署,一般的PC出现故障的几率较小;
由于服务器通常都拥有双网卡,而默认情况下都只会开启第一块网卡的PxE功能;
已DELL 2950为例:
在“Integrated Devices”(集成设备)屏幕中,需要开启下面设置:
SCCM OSD排错分析(一)_职场_02 
另外,如果是裸机安装,可能还需要获取机器的GUID和MAC地址信息。
而部分服务器开启了高级设置,屏蔽该部分信息;
还是以DELL 2950为例,这部分信息就被BMC 管理公用程序所托管。
默认情况下,是无法查看到相关信息的。所以,我们要开启BMC中的IPMI SHELL:
SCCM OSD排错分析(一)_休闲_03 
3、获取IP地址。这个只要网络通畅、DHCP没有挂就Pass;否则我们将会看到如下场景:
SCCM OSD排错分析(一)_职场_04
4、获取地址就成功了4分之1,但如果DHCP没有设置正确,你将发现上面的界面得到IP之后一闪而过。。。
千万不要忘记DHCP 60 Code的设置(如果你的WDS和DHCP不在同一台机):
SCCM OSD排错分析(一)_SCCM_05 
如果,你的DHCP不是微软的DHCP也记得加入一个060Code,字符串值;
SCCM OSD排错分析(一)_OSD_06
5、通过TFTP下载这部分只要WDS没有挂,基本上没有太大的问题,这里提供一个tracing WDS服务的方法:
跟踪日志
若要获取跟踪信息,请您必须启用 Windows 部署服务服务器组件中的跟踪。 设置下面注册表项:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Tracing\WDSServer
名称: EnableFileTracing
值类型: REG_DWORD
值数据: 1
设置此注册表项后,Windows 部署服务服务器组件的跟踪信息被记录在以下文件:
%windir%\Tracing\wdsserver.log
通过上面的日志基本上可以清楚的查看WDS的状态;当然,在SCCM部分还有一些日志,后面会做讲解。
 SCCM OSD排错分析(一)_职场_07