36.4万超声图文对!中国团队构建首个大规模超声专属数据集,让AI真正读懂临床诊断语义丨CVPR’26

背景与行业需求

超声影像在医学诊断中具有实时、无辐射、可移动性强等优势,广泛应用于妇产科、心脏科、肿瘤科等多个临床场景。然而,由于缺乏大规模、标注精细的专属数据集,AI在超声领域的应用一直受限。通用医学图像数据集无法满足超声影像特有的时序性、多角度和动态变化需求,导致模型泛化能力差、临床实用性低。

此前,全球范围内尚无专门针对超声影像的大规模图文配对数据集,严重阻碍了AI技术在该领域的深入发展。为填补这一空白,一支来自中国的科研团队在CVPR’26上发布了首个超声影像专属的大规模数据集,共计包含36.4万组图文对。

数据集构建详情

该数据集由中国多个顶尖医疗机构与高校联合构建,涵盖多种临床场景下的超声图像与对应诊断文本。图像部分包括二维、三维及动态视频超声图像,涵盖心脏、肝脏、乳腺、甲状腺、妇产等多个器官系统。文本部分则来源于真实临床报告,内容涵盖超声特征描述、病灶定位、病理推断等关键语义信息。

数据标注采用多阶段审核机制,确保图像与文本在语义上精准对应。团队还开发了专门的数据增强与去隐私化处理技术,保护患者隐私的同时提高数据多样性。通过构建该数据集,AI模型能够更准确地理解医生的诊断逻辑和语义表达。

36.4万超声图文对!中国团队构建首个大规模超声专属数据集,让AI真正读懂临床诊断语义丨CVPR’26

技术突破与研究亮点

该团队在CVPR’26上不仅发布了数据集,还提出了一种新型的多模态融合架构,用于处理超声图像与文本之间的复杂关系。其核心创新在于引入“临床语义嵌入层”,使模型在学习过程中能够自动捕捉医生诊断中的关键信息,如病灶大小、边界清晰度、回声特征等。

此外,他们还设计了一种动态注意力机制,用于处理超声图像中的多区域特征,并与文本描述建立细粒度对应关系。这一技术的提出,标志着AI在超声辅助诊断领域的语义理解能力迈上新台阶。

临床应用与行业影响

该数据集的发布为超声影像的智能分析提供了坚实基础,推动了AI辅助诊断、自动报告生成、异常检测等多项技术的突破。多家医院已开始测试基于该数据集训练的AI系统,初步结果显示其在乳腺癌筛查、胎儿畸形识别等任务中表现接近甚至超过初级医师水平。

对医疗行业而言,这一进展有助于缓解超声医生资源紧张的问题,提升基层医疗机构的诊断能力。同时,也为后续开发具备自主理解能力的AI诊疗助手提供了标准化训练与评估平台。

未来展望与研究方向

此次发布的超声专属数据集是迈向专业医疗大模型的重要一步。团队计划在未来版本中加入多语言标注、病理随访数据以及手术治疗结果,以支持跨语言、跨模态的医学AI研究。

此外,他们还与多家企业展开合作,探索将该模型部署至移动超声设备与远程医疗系统,实现“床边智能诊断”。预计未来几年,该数据集将成为全球超声AI研究的核心资源,推动人工智能在精准医疗、个性化诊疗等方向的深入发展。