"); //-->
编者按:杜甫在《江南逢李龟年》中曾写道:“正是江南好风景,落花时节又逢君。”
讲的是杜甫与李龟年在江南重逢的场景,其实在计算机视觉领域,在跨摄像头跟踪等场景下,也时常面临着重逢,如果与某一目标重逢时无法准确地识别出其身份,将极大地影响整个系统的跟踪性能。因此,学术界衍生出了行人再识别这一研究方向。
本文中,来自浙江大学的李玺教授,将为大家介绍过去一年中,行人再识别领域所取得的研究进展。
文末提供文中提到参考文献的下载链接。
Person ReID(Person Re-identification)解决的问题是在有多个摄像头的情况下,如何快速识别一个人的ID。这是学术界和工业界都非常关注的问题,也是一个具有挑战性的问题。
这个过程的关键是如何识别和匹配两个人的特征信息和语义结构特点。这个过程主要分为两个步骤。第一个步骤是特征提取,主流方法是CNN。
第二个步骤是特征Matching,核心方法有两种:一种是基于预先定义的位置,例如gloabl,local stripes和grid patches,是比较启发式的;另一种是基于semantic region,借助Person parts, salient regions和attention regions,具有一定的语义含义。
下面从四个比较重要的领域,stripes方法,grids方法,attention方法以及pose方法来回顾一下ReID的进展。
Stripes角度主要有三个方面的工作:DeepMetric,DeepReID和AlignedReID。
DeepMetric把一幅图片强行分成三大块,每一大块做一个SCNN,再将各个部分整合。想法非常简单,实际应用过程中相对有效。
DeepReID更复杂,相当于把一个人的结构分成很多小块,每一个小块进行操作。这个方法比较直接,更加细致。缺陷是在识别较为复杂的情况时,或者任何人之间特征区分较差时会受到噪音干扰。
Stripes效果最好的是王老师的工作AlignedReID,他们通过动态规划计算距离,需要动态匹配的过程,比较复杂,但效果不错。过程分为两个部分,一个是水平的pooling,一个是global pooling,再将两部分融合,得到local distance和global distance,再加入hard sample mining。
第二种思路是基于网格的方法,主要有两个工作。
首先是发表在CVPR2015的工作IDLA。它将两个图片转化匹配,认为在另一个图像的邻域网格总能找到匹配。在难以匹配的情况下,可以到邻域寻找匹配,所以性能提高很多。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。