在今年的CJ CGDC 中国游戏开发者大会上,来自Unity大中华区的技术支持经理张鑫带来了关于《全新的Unity移动游戏优化解决方案》的精彩主题演讲。本次演讲分享的内容,包括从渲染模块、物理模块、动画模块的CPU优化;如何对堆内存的管理以及面对内存泄露和资源冗余的解决方案;以及对代码的优化处理。
CPU优化
首先通过Profiler来找到具体的瓶颈,通过Profiler可以看到每一帧里每个函数的具体开销。
自身逻辑代码效率
如果我们的代码逻辑很复杂,上万行,那么可以借助Begin/EndSample 来拆分,得到真正开销大的代码块。
渲染模块效率
在移动设备上,半透明渲染的开销是需要特别注意的(像花,树,草等),因为在移动设备上会造成更多的overdraw
不同的设备对Drawcall的敏感度不同,因此可以针对设备做一个“LOD”,在高端机上允许更多的drawcall(即可以开启更多的特效等)。
动画模块效率
MeshSkinning.Update 是蒙皮计算的开销,Animator.Update 是骨骼动画的更新开销。OptimizeGameObject的优化选项默认是关闭的。在红米上,一个100人的测试案例中,开启之后,前者可以提高70%的效率,而后者可以提高30%的效率。
另一个测试也是在红米上,200人同屏,单个角色400个顶点,560面左右,动画的总时长为6秒,骨骼数量平均为12个。通过序列帧的形式实现skinnedMeshRenderer到MeshRenderer 的转换。可以跑到25帧。
BakeMesh (SkinnedMeshRenderer.BakeMesh)
- 200+
- ~400 顶点
- ~500+ 60 面
- ~6 s 动画
- ~12 骨骼
UI模块效率
上图是一个Ui的例子,由一位工程师在两周左右的时间完成,美术除外(来自scaleform在Assetstore上的资源)。
UI系统的渲染顺序是由UI元素在Hierarchy中的顺序决定的。而Ui系统会通过重排UI元素的渲染顺序来减少drawcall,但前提是不改变渲染结果。因此发生重叠之后,drawcall可能会上升。
内存管理
游戏制作的中后期通常会开始遇到内存上的问题。
- 总体内存:
•Used Total:当前帧的Unity内存、Mono内存、GfxDriver内存、Profiler内存的总和。
- Mono内存:
- 记录代码堆内存的分配情况,由Mono控制
- 内存只增不减
- 建议<40MB
Mono内存有80%的团队都不太关心,但却是很重要,会影响游戏的流畅性。
- 常见问题:Log输出
StackTraceUtility.PostprocessStacktrace ()
StackTraceUtility.ExtractStackTrace()
Log的输出不仅会消耗CPU,同时也会引起较大的堆内存分配。
- 内存泄露
- 资源被强行Hold无法释放
- 表现症状:Profiler中内存增长趋势明显,且资源无法回收
- DetailedMemory Profiler
- 资源冗余
- 资源通过AB加载,且资源在AB建立时存在多份
- 对AB打包机制进行详细排查
- 依赖关系打包
代码优化
- 游戏优化深度检测:
- 通过Profiler逐帧查看和分析CPU占用较高的函数
- GC.Alloc
- Shader.Parse
- Shader加载时的解析耗时
这部分耗时的避免,可以通过将shader打入单独的assetbundle包,并在进入场景时就进行预加载。
同一时间Load过多的非“基础”AB,且不及时Unload,会导致过多的内存消耗,如WebStream 和Serialized File 的内存。
而PersistentManager.Remapper 的意义是:PersistentManager维护资源的持久化存储功能,Remapper保存的是加载到内存的资源heapID与源数据FileID的映射关系,但Remapper是memory pool,只增不减,因此建议不要一次性加载过多的assetbundle,而是以流式的方式来加载,以减小其峰值。
小结:性能优化是没有定式的,它需要“因时因地”制宜。