Structured Inhomogeneous Density Map Learning for Crowd Counting
https://arxiv.org/abs/1801.06642
针对人群密度估计问题,本文分析了当前基于密度估计问题算法存在的问题, inhomogeneous density distribution problem,随后提出解决这个问题的方法,将密度图由2D 拓展到 3D,网络具体实现由 Density-Aware Network
当前基于密度图估计算法主要网络结构有以下几种:
A. Problem Formulation
这问题的描述中介绍了人群密度估计问题是如何由标记图像变为人群密度图,以及将密度估计问题变为回归问题,设计损失函数
B. The Inhomogeneous Density Distribution
根据以前的研究结论,我们观察到三个有意思的现象:
a) local model 的性能比 global model 的性能要好,这个结论是从分析 Switch-CNN [2] 和 MCNN [28] 这两个网络结构得出的。Switch-CNN 和 MCNN 整体网络结构基本一样,Switch-CNN 自动选择一个 column 来做预测,而 MCNN 融合三个 column 得到一个 global regressor。Switch-CNN 和 MCNN 两个网络,哪个性能更好了? 对此文献数据就可以知道了
b) DNNs 相对于 shallow networks 表现的更差,尤其是在 人群密度差异较大的数据库上( especially on datasets with various density levels)
c) 当前方法的 mean absolute error (MAE) 和 数据的密度差异成正比, is proportional to the relative density level
也就是说增加网络的深度 不能帮助我们解决问题,为什么会这样了?
主要是图像中的 inhomogeneous density distribution 导致这个问题的。
接着我们深入分析了这个 inhomogeneous density distribution 具体形式以及现实中为什么会出现这个问题
接着我们用这个 inhomogeneous density distribution 解释了上面三个现象。
接着我们指出了三个可能存在的问题:Dying ReLU;Exploding Gradients;Saddle Points
Density-Aware Network (DAN)
A. Separating Inhomogeneous Density Distribution as Structured Learning
我们解决这个 inhomogeneous density distribution 方法也很简单: extend the 2D density maps to the structured density maps (3D),第三维度我们表示 density levels,每个等级使用一个 独立的 Gaussian kernel
网络主要修改的地方:
常用数据库一些统计指标:
实验对比效果: