36.4万超声图文对！中国团队构建首个大规模超声专属数据集，让AI真正读懂临床诊断语义丨CVPR’26

3 个月前

AI资讯

122 阅读

AI数据集 [医学影像超声诊断 CVPR]

超声影像在医学诊断中具有实时、无辐射、可移动性强等优势，广泛应用于妇产科、心脏科、肿瘤科等多个临床场景。然而，由于缺乏大规模、标注精细的专属数据集，AI在超声领域的应用一直受限。通用医学图像数据集无法满足超声影像特有的时序性、多角度和动态变化需求，导致模型泛化能力差、临床实用性低。

此前，全球范围内尚无专门针对超声影像的大规模图文配对数据集，严重阻碍了AI技术在该领域的深入发展。为填补这一空白，一支来自中国的科研团队在CVPR’26上发布了首个超声影像专属的大规模数据集，共计包含36.4万组图文对。

该数据集由中国多个顶尖医疗机构与高校联合构建，涵盖多种临床场景下的超声图像与对应诊断文本。图像部分包括二维、三维及动态视频超声图像，涵盖心脏、肝脏、乳腺、甲状腺、妇产等多个器官系统。文本部分则来源于真实临床报告，内容涵盖超声特征描述、病灶定位、病理推断等关键语义信息。

数据标注采用多阶段审核机制，确保图像与文本在语义上精准对应。团队还开发了专门的数据增强与去隐私化处理技术，保护患者隐私的同时提高数据多样性。通过构建该数据集，AI模型能够更准确地理解医生的诊断逻辑和语义表达。

36.4万超声图文对！中国团队构建首个大规模超声专属数据集，让AI真正读懂临床诊断语义丨CVPR’26

该团队在CVPR’26上不仅发布了数据集，还提出了一种新型的多模态融合架构，用于处理超声图像与文本之间的复杂关系。其核心创新在于引入“临床语义嵌入层”，使模型在学习过程中能够自动捕捉医生诊断中的关键信息，如病灶大小、边界清晰度、回声特征等。

此外，他们还设计了一种动态注意力机制，用于处理超声图像中的多区域特征，并与文本描述建立细粒度对应关系。这一技术的提出，标志着AI在超声辅助诊断领域的语义理解能力迈上新台阶。

该数据集的发布为超声影像的智能分析提供了坚实基础，推动了AI辅助诊断、自动报告生成、异常检测等多项技术的突破。多家医院已开始测试基于该数据集训练的AI系统，初步结果显示其在乳腺癌筛查、胎儿畸形识别等任务中表现接近甚至超过初级医师水平。

对医疗行业而言，这一进展有助于缓解超声医生资源紧张的问题，提升基层医疗机构的诊断能力。同时，也为后续开发具备自主理解能力的AI诊疗助手提供了标准化训练与评估平台。

此次发布的超声专属数据集是迈向专业医疗大模型的重要一步。团队计划在未来版本中加入多语言标注、病理随访数据以及手术治疗结果，以支持跨语言、跨模态的医学AI研究。

此外，他们还与多家企业展开合作，探索将该模型部署至移动超声设备与远程医疗系统，实现“床边智能诊断”。预计未来几年，该数据集将成为全球超声AI研究的核心资源，推动人工智能在精准医疗、个性化诊疗等方向的深入发展。