Prima:97.5%准确率秒诊50余种脑病的视觉语言模型
本文目录:
核心观点
- 美国密歇根大学的研究团队开发了一款名为 Prima 的新型人工智能模型,它能够在数秒内从磁共振成像(MRI)扫描中诊断出超过50种脑部疾病,准确率高达97.5%。
- Prima 是一种视觉语言模型,具备基础模型的特性,这意味着它灵活、通用,可针对广泛的医学影像应用进行定制,代表了神经影像诊断领域的一次重大突破。
Prima 模型的技术特性
模型定位与优势
- 首个服务于神经影像的视觉语言模型:能够处理真实世界的临床MRI研究数据作为输入。
- 基础模型属性:与依赖精选数据集和预选序列的早期神经影像模型不同,Prima 擅长处理大量、未经筛选的影像数据,使其在现实世界的AI应用中非常实用。
- 性能持续提升:随着更多健康系统训练数据和更大计算预算的投入,其报告的性能将继续提高。
训练与数据规模
- 海量数据训练:使用来自 22万项MRI研究 的超过 560万个三维序列 进行训练。
- 广泛验证:在为期一年的研究中,评估了超过 2.94万项MRI研究,覆盖了健康系统的广泛范围。
诊断能力与范围
全面覆盖:测试涵盖了所有主要的神经病学诊断类别,包括:
- 成人与儿童脑肿瘤
- 创伤、脊柱疾病
- 炎症性、缺血性、出血性疾病
- 感染性、发育性、囊性病变
- 脑室、血管、鞍区疾病
- 结构性及术后病变
- 类放射科医生的工作方式:整合临床背景、研究指征和所有MRI序列信息,生成完整研究的全面向量表示,从而在广泛的预测任务中实现更好性能。
实际应用与性能表现
卓越的诊断性能
- 在诊断 52种脑部疾病 和 优先排序严重程度 方面,表现优于其他AI医学模型以及最先进的通用AI模型。
关键的临床功能
- 自动警报系统:当检测到需要快速反应的疾病(如脑出血和中风)时,可自动向临床医生发送警报。
背景:AI基础模型
概念与定义
- 基础模型:指通过自监督学习在海量未标记数据集上训练的大规模AI深度学习神经网络。
- 应用领域广泛:除医疗保健外,还用于计算机视觉、自动驾驶、自然语言处理、机器人技术、内容生成和软件代码生成等。
知名示例
大型语言模型是基础模型的一种,例如:
- ChatGPT(基于GPT模型)
- BERT、Claude、Codex、DALL-E、BLOOM、Imagen、Granite、Stable Diffusion、Cohere 等。
未来发展方向
下一步研究计划
研究人员计划探索以下增强功能:
- 开放式诊断
- 自动报告生成
- 整合电子健康记录和临床笔记中的数据
广泛的适应性
所提出的AI框架可广泛适应其他生物医学成像模式,例如:
- 计算机断层扫描
- 放射照相
- 超声