第一部分
faster r-cnn是区域建议网络,fast r-cnn和区域建议网络的组合,以图搜商品的准确率,会根据物体类别有所不同,大致分为三个类别。
1 平面物体,画报,装饰画,准确率可以达到95%以上
2 三位刚性物体,立体家具模型,准确率可以得到80%
3 对于柔性和纹理单一物品,如纺织类,纹理单一物品等,识别相对困难
目标检测的第一步就是要区域提名,类似与光学字符识别,问题的核心就是如何有效的区冗余候选框,其实融合与候选框大多是发生了重叠,选择性搜索利用率这一点,自顶向上合并相邻的重叠区域,从而减少冗余
感知hash算法的应用
hash算法是一个有可比较的hash函数的类,图像特征被用于生成独特的指纹,而这些指纹是可比较的,提取家具图像的hash值我们需要以下的步骤
1 缩小尺寸:去除高频和细节的有效办法就是缩小图片,将图片缩小到88的尺寸,总公64个像素
2 简化色彩,将88的小图片转化为灰度图片
3计算平均值,计算64个像素的灰度平均值
4 比较像素灰度 将每个像素的灰度,与平均值进行比较,大于或等于平均值记为1,小于平均值记为0,
5 计算hash值,组合在一起,就构成了一个64为的整数,这就是这张图片的指纹
第二部分-知识蒸馏从入门到精通
知识蒸馏是一种模型压缩的办法,知识蒸馏可以利用一个已经训练的复杂的模型,来指导一个轻量级的模型训练,从而减小模型训练大小和计算资源的同时,尽量的保持原始大规模的准确率的方法,