新闻  |   论坛  |   博客  |   在线研讨会
高新波:异质图像合成与识别(2)
深度学习大讲堂 | 2020-11-12 13:20:36    阅读:406   发布文章

我们首先来简要看一下data-driven的相关内容。

24.jpg

上图是汤晓鸥教授最早在ICCV2003上发表的一个名为Eigen-Sketch的工作。利用Eigenface的思想,对照片利用训练样本进行线性组合生成,得到照片线性组合的系数以后,将组合系数叠加到画像上,可以合成出画像。这是最早的异质图像合成的工作,也是奠基性的工作。

23.jpg

上图是刘青山教授在CVPR2005上提出的改进工作。受启发于当时如火如荼的流形学习,他认为把整幅图像进行合成的做法存在不足,他利用LLE的思想把照片分割成一个个照片块或者画像块,再对每一块进行线性组合,组合以后把对应画像利用对应的系数合成照片,这样就把整幅图像的线性转变成局部线性嵌入。

22.jpg

在上述工作中仍然存在两个问题。一是选择K近邻来线性组合,K值是固定的,有的时候K个近邻块的距离是比较近的,有的时候却是比较远的,如此线性组合以后会出现模糊。这个时候正是稀疏表示发展起来的时候,我们基于稀疏表示做了相应的改进工作。

21.jpg20.jpg19.jpg18.jpg

另一方面,由于线性叠加相当于低通滤波,为了使它更清晰我们又加了高通增强,对高频成分也进行线性组合以后叠加上。利用稀疏表示来自适应选择K值,K是动态变化的。另外把高频分量也进行类似学习,合成以后得到比较清晰的画像。具体算法这里不再赘述,我们在相应数据库上做了很多实验。

17.jpg

上图是香港中文大学做的数据库,这个数据库共有606张照片。

16.jpg

我们利用照片可以生成相应的画像,上图是我们生成的画像,中间一行只是利用稀疏表示生成的画像,显然不够清晰。

15.jpg

同样给一个画像可以反过来生成照片的例子,上图我们生成的照片。

14.jpg

相似的技术还可以用在其他方面,比如说我们在公安部数据库看照片的时候,都是打着网纹的,这是一种数据保护。通过我们的技术可以实现去网纹的工作,上图展示了我们的效果。

13.jpg

另外,同样的技术还可以利用非正面的、侧面的照片合成正面照片。

12.jpg

实际上,基于data-driven的方法也还存在其它问题。比如,上图所示的训练数据库里面没有出现的情况我们很难合成出来。比如说背景不一样,或者训练数据库里面都是年轻人,香港中文大学的数据库中的照片都是年轻人的,如果合成老年人,它的皱纹很难合成出来;如果数据库里面没有戴眼镜的,要想合成戴眼镜很难,因为我们眼睛的合成区域总是找相应的眼睛区域来合成的。这样就使得合成出的画像与待测试样本之间有差别,为此我们利用稀疏表示和贪婪学习的方法设计新的方法,就是进行全局搜索。

11.jpg

原先我们的合成是基于local mean的,这个新的学习算法实际上是一个nonlocal mean。nonlocal mean存在一个问题,如果我们要搜索一个眼睛的话,需要在整幅图上搜索它的近邻区域,这样的整幅图像搜索速度非常慢,为此我的团队提出了上图所示的基于稀疏表示的贪婪学习方法。利用训练样本我们可以构造一个字典,把每一个图像块利用字典来表示,得到基于字典的表示系数,形成一个稀疏系数矩阵,这样来一个测试图像以后,同样的也可以用字典来表示成一个系数序列。进行匹配的时候就像一个哈希搜索一样就变得非常快,这样一来就解决了快速全局搜索的问题。

10.jpg

上图是我们和其他方法合成效果的对比图。对于第一行戴发卡的女孩,其他方法生成出来很难有发卡,我们的方法可以很好地把发卡合成出来。同样戴眼镜的照片也是,以前的方法本身合成不出来眼镜,因为训练样本里面没有人戴眼镜,但是通过全局学习,眼镜可能就是利用他的下巴合的轮廓成出来,这样一来可以合成训练样本中没有的细节信息。

9.jpg

前面的学习都是基于大量训练样本的,如果我们有一个应用只有一对训练样本怎么办?也就是说我们的训练只有上图所示的一个照片和画像对,它也是可以工作的。因为可以利用人脸的多尺度构造更多的图像,一个大人通过缩放可以变成小孩;另外一个图像里面有自相似结构,比如左脸和右脸非常相似。

8.jpg

利用上述性质,一方面可以利用高斯金字塔生成多尺度图像,构造更多的图像和画像对。

7.jpg

另一方面利用图像自相似结构也可以进行合成。

6.jpg

这样如果只有一个训练对的话,利用高斯金字塔可以生成一系列不同尺度的照片和图像对。可以通过合成字典,同样利用刚才讲的贪婪学习方法合成出初始的画像。然后把训练样本和测试样本生成的初始画像这两对放在里面进行迭代,依然可以生成高质量的合成画像。

5.jpg

上图是我们逐次迭代生成的的画像结果。

4.jpg

上图展示了采用不同的方法由照片合成的画像的效果,虽然只有一个照片-画像训练对,但是所合成的画像质量还是不错的。

2.jpg

我们进一步来把约束条件进行松弛。如果只有一个画像,连照片也没有,这就变成风格的合成,这样一来我们仍然可以合成出需要的画像。

1.jpg

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客