西浦博士生设计深度学习模型助力自动驾驶发展

2022年10月13日

日前，西浦-集萃学院的博士生管润玮设计了一种用于目标检测及分类的深度学习模型。该技术在生活中有广泛应用场景，例如可在无人驾驶中监测交通、躲避行人等。

在复杂的道路监控中，它能够强化目标特征，让目标识别变得更加容易；也能在识别结果基础上，框选给定目标；还能对目标进行分类，辨别出目标属于机动车还是非机动车。

相关论文已被国际期刊《超级计算杂志》The Journal of Supercomputing收录。

西浦校内导师、智能工程学院的Ka Lok Man教授和集萃产业导师、深度感知技术研究所的岳玉涛博士共同指导管润玮进行该项研究。

据管润玮介绍，目前，常用的两种深度学习模型架构分别为卷积神经网络（CNN）和视觉变形器（ViT）。基于CNN的模型，推理速度快，对图像纹理比较敏感，但不擅长识别部分被遮挡的物体；基于ViT的模型，训练及推理速度都较慢，但对目标的形状轮廓更敏感，即使目标被部分遮挡，也能进行推理识别。

“我们先把两种模型的优势结合起来，设计并开发了混合注意模块（Mix Attention Module，MAM）。它能即插即用于任何基于CNN的深度学习模型，从而提升对目标特征的识别能力，保证下游的检测与分类任务顺利进行。”

“然而，很多道路监控摄像头等设备，其自身的硬件条件限制了融合CNN和ViT深度学习模型的识别速度，对模型提出了更高的要求，这是我们接下来将重点攻克的难点之一。”

“同时，我们还提出了一种称为MANet的图像分类网络，该网络具有先进的图像分类性能，能够给检测出目标种类，并打上标签。”

结合以上几项研究，研究团队最终设计出一个名为CAT-YOLO的轻量级实时目标检测网络，兼具快速、精确识别功能及分类功能。

管润玮硕士研究生毕业于英国南安普顿大学数据科学专业，留学期间就了解到西浦-集萃学院。

谈到为何选择西浦时，他说：“目前智慧城市、智慧交通领域比较热门，我对交叉型科研课题也感兴趣，综合考虑地理位置等多项因素，最后选择了在无锡的集萃深度感知所。”

“西浦-集萃的联合培养模式扎根产业实际需求，这样的科研离问题更近，更能把握市场动态，能在一定程度上有效避免与产业脱节的科研。” 管润玮说。

记者：金画恬
编辑：张蔚
图片提供：管润玮

2022年10月13日

西浦博士生设计深度学习模型 助力自动驾驶发展