简介

论文名称：《Body Structure Aware Deep Crowd Counting》
CNN分类
- 基础CNN
- 上下文感知
- 多任务模型
输入数据的分类
- 基于完整图像

个人收获

通过引入人的具体形状来避免了树叶，还有灯灯对人群计数的混淆;
在没有perspective map的情况下手动标记一张，然后应用全部，这是论文选择数据集的一个标准；

观点引入

影响人流统计的三个因素：行人、头、上下文信息（context structure）。2016 CVPR, 2017 CVPR 只考虑了行人因素（这个观点不能赞同，神经网络应该会自动提取上下文信息的），没有加入上下文信息。文中通过语义分割的观点来实现人流统计。两部分场景解析模型：第一部分为身体部分图，用来标记身体的部分，如图1，用不同的颜色标记出人的头，上身，和腿，文中接采用的是[2013 iccv Pedestrain parsing via deep decompositional network]提出的网络，及训练好的参数。第二部分为结构人群密度图。利用身体部分图产生的各个行人的详细形状，构建结构化的人群密度图。