如何快速搭建一个大型基于深度学习的项目来验证自己的idea

原创

wx5ba0c87f1984b 2021-08-13 09:29:22 博主文章分类：算法理论与程序设计 ©著作权

©著作权归作者所有：来自51CTO博客作者wx5ba0c87f1984b的原创作品，请联系作者获取转载授权，否则将追究法律责任

深度学习项目一般分为三部分，输入读入、模型和损失、训练和测试。我们实现我们自己的项目时大部分代码都可以在Github上找到，能找到就不要自己写，这里面考验的主要能力是搭建大型项目的能力，而不是某个具体模块的实现。下面讲下实现过程：

数据读入部分一般都能在Github上找到，这部分的代码应该选择较为复杂的。有的Github项目只涉及1个数据集，有的涉及到4个数据集，应该选择四个数据集的代码作为自己的数据集读入部分。

因为一般的idea是有baseline的，我们只需要关注baseline的核心代码即可。如果使用了Dectron或MMdetection，我们只需将核心代码拿出即可，然后根据自己的idea对核心代码进行修改。

模型和损失修改完成后，下来不管效果将整个训练代码调通。然后观察损失，损失没有梯度消失和梯度爆炸就完成了。

测试代码大部分也能在Github上找到，应该选简单的，然后根据自己需求进行更改。

调整网络结构、损失，以及损失中的超参数，重复三、四步。

注意：能适用开源项目比如Dectron或者MMdetection就不要自己定义，因为这种代码一般比较标准。打训练代码和测试代码首先应该寻求调试通，然后在检查结果对不对。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯