会模仿人类视觉锁定图像目标的计算机算法:识别性能好、训练效率高

2021年02月04日

近年来,图片搜索作为一种新的功能,逐渐被应用在多个购物平台。购物者只需要提供一张图片,系统就能够从复杂的背景中推测出他所想要购买的物品,进行推荐。在享受便利的同时,你是否也有这样的疑惑,计算机是如何学会从图像数据中快速地获取关键信息的?

近日,西交利物浦大学智能工程学院博士生团队使用图像处理技术和计算机视觉算法让计算机模拟人的注意力,准确定位出图像中最引人注目的前景区域。这项关于显著性检测的研究被第35届AAAI大会收录,该项目也获得了国家自然科学基金面上项目的资助。

据论文的第一作者博士生俞思悦介绍,论文中提出了一种弱监督显著性检测的方法,这项技术可以作为其他图像识别与分割技术的底层预处理模式,更高效地获取图像中的重要信息,在图片编辑、图像检索、目标检测、机器人领域也有多种应用。

俞思悦的指导老师肖继民博士表示:“弱监督显著性检测是一个非常前沿的研究方向,同一个物体在不同图片里的重要性,即对人的吸引力,是会变化的,在前一张图中最吸引人的物体,下一张可能就变成了背景,所以要教会计算机区分这种变化也是一个难点。我们的训练的方法比较简单,通过一次训练就可以得出检测结果,且无需后续处理,在多个数据集上进行了测试,均达到了最高的性能。”

俞思悦解释说,“在使用弱监督的方法来训练计算机时,只提供给计算机有限的信息,例如用几个像素点来代表前景与背景,获得最终的输出。相比较于把每个像素点属于前景还是背景通过人工标注提供给计算机的强监督训练方法,弱监督能够节约时间和人力,但同时也更具挑战性。

(图片说明:上图红色线条代表前景,绿色线条代表背景)

“弱监督训练方法的缺点在于:由于只提供了有限信息,这样就会导致结构信息缺失,无法提供良好的轮廓。所以,通常还需要用别的方法来补充轮廓,准确预测前景的形状。”

她进一步解释说:“之前的一些研究会用边缘检测等方法来补充提供物体的轮廓信息,但边缘检测大多是用强监督的方法来训练,一个像素点是否属于边缘,都需要人工标注出来。

“相较之下,我们提出的弱监督显著性检测方法能够利用图片本身的信息,比如颜色信息或者位置信息来补全我们需要的这个物体的一些结构信息,从而得到比较良好的性能,也能在工业上节省人力标注投入,并且提高计算机图像识别的准确率。”。

(图片说明:上图为博士生俞思悦提出的学习方法)

(图片说明:博士生俞思悦的检测结果与其他弱监督显著性检测的方法输出的结果,左起第三列为俞思悦所在研究团队的检测结果。)

智能工程学院院长、俞思悦的指导老师林永义教授表示:“国际上通常会以一些顶会文章来衡量学院的科研水平。智能工程学院近几年陆续在人工智能的顶级会议CVPR、AAAI、ECCV发表论文,充分说明了我们在AI领域达到了国际上较高的水准。”

记者:金画恬

编辑:寇博

图片来源:俞思悦

2021年02月04日