在识别技术研发过程中,提高识别率是个艰难而又长期的过程,不仅要有较强的创新能力,更需要有坚强的毅力。当识别算法大体设计出来后,后期便是逐渐细化识别算法的过程:不断地调试,不断地完善,识别率不断地得到提高,直至最后达到用户满意的程度。这个过程一定要有稳扎稳打的思想,不要以为改进某个算法后,在识别率上一定会有大的提高,相反地,更多情况下是识别率的降低,在提高识别率的过程中,会有一个起起伏伏的现象,这是检验算法改进的正常现象,这时我们需要稳扎稳打:当识别率提高时,则加入改进方法,当识别率降低时,则放弃当前所改进的方法。要做到稳扎稳打,需要从如下五个方面来实现:
1、首先需要有一个充分的测试集用于检验识别算法的可靠性,测试数据量大、包含各种需要考虑到的情况,这样的测试数据才算是充分的;
2、需要有一个自动化的批量测试程序,测试数据量大,如果靠手工一个一个数据去测试,不仅浪费时间,也会使人懒得去测试,有了自动化测试程序,会让我们更加专注于算法的改进上;
3、做好每次改进算法的记录,以便于对改进过程的跟踪和总结,记录内容包括:改进时间、改进方法概述、各种数据内容概述、识别率等等;
4、备份每次改进的代码、识别所需要的数据、测试结果数据等,以便于当下一次改进方法不好时回退到上一次的改进中,还有,把测试结果备份好,也可以在不同测试结果之间进行对比,以发现问题所在;
5、及时进行总结并做好相关技术文档,写文档的过程其实也是个对自己的研发工作进行总结的过程,边写文档,边思考,边总结,会让我们的思路更加清晰,也经常会让我们有意外的发现。
识别率的提高到后面会越来越难,直至最后会有“沙里淘金”的感觉,当识别率达到一定较高程度时,识别率一点点的提高都会让人欣喜万分,有了稳扎稳打的方法,会让我们最终从沙里淘出金块来。