2025年11月13日
在人工智能的世界里,数据就像燃料。
有了足够多、足够高质量的数据,AI算法才能被“喂养”得越来越聪明,越学越准。
但现实中,许多关键领域——例如医学影像、工业检测、自动驾驶——都面临同一个问题:数据难找、难得、难用。
出于隐私保护或成本限制,研究人员往往拿不到成千上万张训练样本。结果是:AI模型学得慢、识别不准,还容易“翻车”。

那有没有可能,让AI在“小数据”的世界里也变聪明?
西交利物浦大学智能工程学院博士生姚思玥及其团队给出了答案。
他们提出了一种名为 “Crucial-Diff” 的创新AI框架,它能像一位“AI教练”,在数据稀缺时主动为AI设计“挑战题”,引导它攻克弱点、举一反三。
这项成果近日发表在国际顶级期刊《IEEE 图像处理汇刊》(Transactions on Image Processing, TIP)上,该期刊在中国科学院(CAS)分区中位列 Q1,是人工智能图像领域的顶级学术刊物。
研究突破:从“多看数据”到“看对数据”
传统提升AI准确率的做法,是通过旋转、裁剪或复制图像来“扩充”数据量——就像给学生不停地换练习册,但内容其实大同小异。
这中“数量堆砌”的方法虽然能让AI看到了更多样本,却没真正帮它理解问题的关键。
姚思玥团队选择了另一条路:
“我们的目标不是让AI看到更多数据,而是看到更有价值的数据,”她解释说,“提升AI识别准确率需要的是关键样本——那些能暴露它盲点、迫使它改进的‘挑战题’。”

(图为基于真实图片生成的缺陷图片,Crucial-Diff生成的(右上)在视觉特征上具有更高挑战性,能有效模拟真实应用中难以辨识的异常模式;而现有方法生成的(右下)直接简单复现了典型模式。)
于是,Crucial-Diff 框架就像一位洞察学生短板的“资深教练”,会自动分析AI在哪些地方最容易出错,并生成一批针对性的高质量样本来“强化训练”。
这种方式让AI的学习更有针对性,不再靠“海量堆叠”取胜,而是靠“精准施教”变强。
技术原理:AI的“翻译官”与“教练”
Crucial-Diff 框架由两个关键模块组成:场景无关特征提取器和弱点感知样本挖掘器。
前者就像一位“翻译官”,能识别图像背后的通用规律,让AI能在不同领域间“举一反三”——比如工业零件检测的经验,也能迁移到医学影像识别中。
后者扮演“资深教练”的角色,负责找出AI“学不好的地方”,再生成有针对性的训练样本,让AI在反复攻克弱点的过程中变得更聪明、更稳健,甚至还能判断哪些样本最能帮助AI变得更强。
通过这套机制,Crucial-Diff 不仅能生成逼真的新图像,还能自动生成原本需要人工完成的像素级标注信息,明确指出图像中每个区域的含义,显著节省人力成本。
应用成果:工业质检与医疗诊断的“双突破”
在工业生产线上,AI常用于检测产品缺陷,比如划痕、裂纹或气泡。然而,这些缺陷图片往往数量稀少、差异巨大。
Crucial-Diff 能自动生成这些“稀缺场景”的样本——例如光线不均、边缘模糊的划痕图像——帮助AI更好识别难辨缺陷。
实验结果显示,使用 Crucial-Diff 生成的训练样本后,AI的检测准确率提升至83.63%,性能远超传统方法。

(使用Crucial-Diff生成样本训练后产品缺陷检测效果)
在医疗影像分析中,研究团队还利用这一框架生成不同光照、角度和遮挡条件下的内镜图像,帮助AI识别更多类型的病灶。实验结果表明,使用Crucial-Diff生产的数据后,AI在息肉分割等任务中的精度显著提升,为医生提供了更可靠的辅助诊断工具。

(使用Crucial-Diff生成样本训练后息肉分割效果)
AI从“重数量”到“重质量”的转变
该研究由西浦智能工程学院Eng Gee Lim教授和苏州大学孙铭杰副教授共同指导。

(由左至右为Eng Gee Lim教授、姚思玥和孙铭杰副教授)
孙铭杰副教授表示:“Crucial-Diff代表了AI数据生成技术从‘重量’向‘重质’的转变。它让AI不再只是被动接收信息,而能主动找到该学什么、怎么学。”
Eng Gee Lim 教授也指出:“这项研究展示了生成式AI在真实世界的应用潜力。它能显著降低AI训练成本,让人工智能在资源受限的环境中发挥更大价值。”
他补充说:“未来,AI不一定需要无穷无尽的’大数据’。通过更聪明的学习方式,AI同样能在‘小数据’中变得强大。”
研究团队计划将 Crucial-Diff 框架进一步拓展至三维视觉等更复杂的领域,探索AI在多维、动态等复杂环境中的自主学习机制。
(记者:金画恬 编辑:寇博)
2025年11月13日