http://www.seven-fire.cn/archives/174
一、Shader与Shader Variants
着色器(Shader)是在GPU上执行的小程序,通常情况下,我们自己写的一个着色器文件(xxx.shader)对应一个着色器变体,对应一个GPU程序。但如果着色器中引入了关键字(Keyword)或者可变的RenderSetup等技术,那么一个着色器文件就可能对应N个着色器变体,对应N个GPU程序。
怎样理解这里面的对应关系呢?可以这样简单的认为,着色器文件:着色器变体:GPU Program=1:N:N
查看一个着色器对应几个变体的方法:
1、点击着色器文件在Inspector面板中查看
就这样一个普通的新建的SurfaceShader就有569个变体,全编译会生成569个GPU程序
2、在ShaderVaruantsCollection中查看
在这里显示有356+4=360个变体,少了9个,原因嘛就要问Unity官方了,或者你也可以在留言中告诉我
二、加载和编译
加载和编译着色器需要一点点时间。通常加载单个独立的GPU程序不需要多少时间,但是就如上面所说,着色器有时会有很多的着色器变体。
完全编译的话,会有几万个不同的GPU程序(后面会有图示),而这会引发两个问题:
总包体积变大;
消耗大量的内存。
当然这两个问题都是我们不愿意看到了,怎么解决呢?继续往下看。
三、剔除多余着色器变体
1、在生成时剔除多余着色器变体
在生成游戏包时,Unity可以检测如果某些内置的着色器变体没有被使用到,就不会把他们打到游戏包中,这个方法可适用于以下几种情况:
1)个别着色器特性,比如使用 #pragma shader_feature的着色器,如果没有材质使用到了这个特性,那么就不会把它打包进去;
2)没有被任何场景使用到的雾效(Fog)或光照贴图模式(Lightmap)的着色器变体,也不会打包进去。
通过以上两种方式的结合可以大大减少着色器变体的数量。比如Standard着色器有35254中变体,如果完全编译的话,就会占用有几百兆存储,但是一般的工程用到的只会有几兆,而且打包时会进一步压缩。
2、在加载时剔除多余着色器变体
1)Unity Shader的默认加载行为
在默认设置中,Unity加载着色器文件到内存中,但内部使用的着色器变体(GPUProgram)直到真正使用的时候才会创建(这里要区分4.x和5.x,后面解释)。这也就是说,打进游戏包中的着色器变体只是可能被用到,但是在用到之前是不消耗加载时间和占用内存的。
比如,着色器常常有一个处理点光源阴影的变体,但是如果游戏中从来没有使用过点光源阴影,那么就不会加载这个相应的变体。
当然这个默认的行为就会造成一些变体在第一次被用到的时候会出现卡顿(因为需要加载一个新的GPU程序代码到图形驱动中),这是不能接受的,因此Unity提供了另一个方案来解决这个问题。
PS:shader加载造成的卡顿有两种情况,
只需要加载该变体,创建GPUProgram就可以了
解析和编译相应的变种,然后创建GUPProgram
以上两种情况都是实际中遇到过的,但后一种使用目前的项目工程难以重现,所以图片来自网络,只作参考。等有时间了在单独创建测试工程来重现这两种情况。
2)使用着色器变体群(ShaderVariantCollection)
ShaderVariantCollection是Unity在5.x后提供的一个着色器预编译的方案,使用它可以轻松的指定需要着色器变体,在需要的时候加载、解析、编译等一条龙服务。
ShaderVariantCollection其实就是一个着色器资源列表,是一个由通道类型+着色器关键字组合的列表。如下图
添加着色器窗口
添加着色器变体就是如下一个关键字选择器
四、创建ShaderVariantCollection
1、全手工创建
这是最笨的一种方法,需要自己在Project视图下创建ShaderVariantCollection资源,然后使用上面介绍的两个窗口自己添加着色器变体
2、使用Unity收集当前使用到的着色器变体
为了最快速、最方便的帮助我们创建和收集那些真正被用到的着色器和他们的变体,Unity已经在编辑器中内置了可以追踪那些已经被使用到的着色器和他们的变体,并可以直接生成相应的ShaderVariantCollection资源。
打开图形设置面板(Edit->Project Settings->Graphics)
这时候只需要依次打开我们的所有场景,把需要的物体都显示一遍,Unity就会自动记录下来哪些着色器的哪些着色器变体已经被使用到。统计完后只需点击下面的保存按钮就可以生成我们所需要的ShaderVariantCollection资源。当然你也可以为你的每一个场景或者按需生成足够多的ShaderVariantCollection资源。
五、使用ShaderVariantCollection
1、启动时加载
最简单最粗暴的使用方式就是在游戏启动的瞬间就直接加载ShaderVariantCollection资源并编译里面的着色器变体,Unity已经为我们做好这一步了,依然还是在图形设置面板里,只需把需要启动是就编译的ShaderVariantCollection添加在Preloaded Shaders里面,如下图所示:
2、使用代码加载
由于ShaderVariantCollection也是一种资源,可以跟纹理、模型等等资源一起打包和加载等,只需在加载之后调用一句WarmUp,如下:
C#
|
六、一些后话
目前来说,对于shader的预编译有两种:
ShaderVariantCollection::WarmUp和Shader::WarmupAllShaders
该怎么选择呢?
1、如果你是Unity4.x,就大胆的使用Shader::WarmupAllShaders吧,因为没得选
2、如果你是Unity5.x
i、没有使用5.x新的shader(Standard和StandardSpecular),自定义shader也没有使用大量关键字等还是可以使用Shader::WarmupAllShaders
ii、使用了5.x新的shader,自定义shader也使用有大量关键字的话,你可以考虑使用ShaderVariantCollection::WarmUp了
iii、还有一些很特殊的情况,就看情况而论了
Unity4.x和5.x对于shader编译上的一些差异:
在Unity4.x中,只要把shader加载进内存后就会自动的编译该shader,而在Unity5.x中,加载就仅仅只是加载了,如果还需要编译的话,需要游戏中实际使用到或者主动使用shader.WarmupAllShaders又或者ShaderVariantCollection.WarmUp来编译shader。
至于原因嘛,大概是在Unity5.0以前,每一种shader都比较独立,单个shader对应的变种并不多,所以5.0以前的shader的文件数量会比较多;但是到了5.0以后,引入Standard和StandardSpecular这两个shader后,由于这两个着色器的变种实在太多(Standard有35254个变种,StandardSpecular有32950个变种),如果这两个着色器全编译,后果就是内存一下少了几百兆(当然这是官方的说法,实际测试貌似不是这样的)。
如果文中有错误的地方,欢迎指出和留言,如果你有不同的见解,也可以留言告诉我。
参考资料:
http://docs.unity3d.com/Manual/OptimizingShaderLoadTime.html