研究人员为下一代人工智能在医学领域的设计、测试和实施绘制了路线。
今天医学中使用的绝大多数人工智能模型都是“狭义专家”,他们被训练来执行一两项任务,例如扫描乳房X光检查以发现乳腺癌的迹象或在胸部X光片上检测肺部疾病。
但医学的日常实践涉及无穷无尽的临床场景、症状表现、可能的诊断和治疗难题。
因此,假设人工智能要兑现其重塑临床护理的承诺。在这种情况下,它必须反映医学的复杂性,并以高保真度做到这一点,HMS布拉瓦特尼克研究所生物医学信息学助理教授Pranav Rajpurkar说。
进入通才医疗AI,这是一种更进化的机器学习形式,能够在各种场景中执行复杂的任务。
Rajpurkar解释说,类似于普通医学医生,通才医疗AI模型可以集成多种数据类型 - 例如MRI扫描,X射线,血液测试结果,医学文本和基因组测试 - 以执行一系列任务,从进行复杂的诊断呼叫到支持临床决策再到选择最佳治疗。它们可以部署在各种环境中,从检查室到医院病房,从门诊胃肠道手术室到心脏手术室。
虽然最早版本的通才医疗人工智能已经开始出现,但其真正的潜力和能力深度尚未实现。
“人工智能领域快速发展的能力完全重新定义了我们在医疗人工智能领域可以做的事情,”Rajpurkar在《自然》杂志上新发表的一篇观点中写道,他与斯克里普斯研究所的埃里克·托波尔(Eric Topol)以及斯坦福大学、耶鲁大学和多伦多大学的同事共同撰写了该观点。
作者说,正如我们所知,通才医疗人工智能正处于改变临床医学的风口浪尖,但随着这个机会而来的是严峻的挑战。
在本文中,作者讨论了通才医疗AI的定义特征,确定了可以使用这些模型的各种临床场景,并为其设计,开发和部署绘制了前进的道路。
通才医疗AI的特点
使通才医疗人工智能模型优于传统模型的关键特征是它们的适应性、多功能性以及将现有知识应用于新环境的能力。
例如,训练用于在脑MRI上发现脑肿瘤的传统AI模型将查看图像上的病变以确定它是否是肿瘤。除此之外,它无法提供任何信息。相比之下,通才模型会观察病变并确定它是什么类型的病变——肿瘤、囊肿、感染或其他东西。它可能会建议进一步检查,并根据诊断建议治疗方案。
“与目前的模型相比,通才医疗人工智能将能够执行更复杂的推理并整合多种数据类型,这使其能够更详细地了解患者的病例,”该研究的共同第一作者Oishi Banerjee说,他是Rajpurkar实验室的研究助理,该实验室已经在设计此类模型。
根据作者的说法,通才模型将能够:
轻松适应新任务,无需正式再培训。他们将通过简单地用简单的英语或其他语言向他们解释来执行任务。
分析各种类型的数据——图像、医学文本、实验室结果、基因测序、患者病史或其任何组合——并生成决策。相比之下,传统的AI模型仅限于使用预定义的数据类型(仅文本,仅图像),并且只能使用某些组合。
通过以前看不见的任务应用医学知识进行推理,并使用医学上准确的语言来解释他们的推理。
使用通才医疗AI的临床场景
研究人员概述了通才医疗AI模型将提供全面解决方案的许多领域。
其中一些是:
放射学报告。
通才医疗人工智能将充当多功能数字放射学助手,以减少工作量并最大限度地减少死记硬背的工作。
这些模型可以起草放射学报告,描述异常和相关正常发现,同时考虑患者的病史。
这些模型还将文本叙述与可视化相结合,以突出显示文本描述的图像上的区域。
这些模型还能够比较患者图像上先前和当前的发现,以阐明提示疾病进展的明显变化。
实时手术协助。
如果手术团队在手术过程中遇到障碍,例如未能在器官中找到肿块,外科医生可以要求模型查看手术的最后15分钟,以寻找任何遗漏或疏忽。
如果外科医生在手术过程中遇到超罕见的解剖特征,该模型可以快速访问有关该手术的所有已发表工作,以实时提供见解。
患者床边的决策支持。
通才模型将通过持续监测患者的生命体征和其他参数(包括患者的记录)为住院患者提供警报和治疗建议。
这些模型将能够在迫在眉睫的紧急情况发生之前预测它们。例如,当患者处于循环休克的边缘时,模型可能会提醒临床团队,并立即建议避免休克的步骤。
前方,承诺与危险
作者说,通才医疗人工智能模型有可能改变医疗保健。它们可以减轻临床医生的倦怠,减少临床错误,并加快和改善临床决策。
然而,这些模式带来了独特的挑战。研究人员警告说,它们最强大的特征 - 极端的多功能性和适应性 - 也带来了最大的风险,因为它们将需要收集大量不同的数据。
一些关键的陷阱包括:
需要广泛、持续的培训。
为了确保模型能够快速切换数据模式并根据所提问题的上下文和类型实时调整,它们将需要对来自多个互补来源和模式的各种数据进行广泛的培训。
必须定期进行这种培训,以跟上新的信息。
例如,对于新的SARS-CoV-2变种,模型必须能够快速检索由旧变种引起的的X射线图像上的关键特征,以与与新变种相关的肺部变化形成对比。
验证。
通才模型将特别难以验证,因为它们将被要求执行的任务的多功能性和复杂性。
这意味着模型需要在可能遇到的各种情况下进行测试,以确保其适当的性能。
Rajpurkar说,这归结为定义模型执行的条件以及它们失败的条件。
验证。
与传统模型相比,通才医疗人工智能将处理更多的数据、更多样化的数据类型和更复杂的数据。这将使临床医生更难确定模型决策的准确性。
例如,传统模型在对患者的肿瘤进行分类时会查看成像研究或全玻片图像。单个放射科医生或病理学家可以验证模型是否正确。
相比之下,通才模型可以分析病理切片,CT扫描和医学文献以及许多其他变量,以对疾病进行分类和分期并提出治疗建议。
如此复杂的决定需要由包括放射科医生、病理学家和肿瘤学家在内的多学科小组进行验证,以评估模型的准确性。
研究人员指出,设计师可以通过结合解释(例如文献中支持段落的可点击链接)来简化验证过程,以使临床医生能够有效地验证模型的预测。
另一个重要特征是建立量化其不确定性水平的模型。
偏见。
众所周知,医疗人工智能模型可以使偏见永久化,当暴露于从非多样化人群获得的有限数据集时,它们可以在训练期间获得偏见。
在设计通才医疗人工智能时,这种风险将被放大,因为在训练期间所需的数据集具有前所未有的规模和复杂性。
研究人员建议,为了最大限度地降低这种风险,必须对通才医疗人工智能模型进行彻底验证,以确保它们在特定人群(如少数群体)上的表现不会不佳。
此外,它们在部署后需要进行持续的审核和监管。
“这些都是严重但并非不可逾越的障碍,”Rajpurkar说。“尽早对所有挑战有一个清醒的认识将有助于确保通才医疗人工智能实现其巨大的承诺,使医学实践变得更好。