X
... ... ... ... ... ... ... ...
科研进展

科研进展

大语言模型赋能肝癌精准治疗:系统评估AI在晚期肝癌免疫治疗反应预测中的价值

许军 王腾飞 发布时间:2025-05-27 浏览次数:239

近日,中国科学院合肥物质科学研究院健康所李海研究员团队在肝细胞癌(HCC)免疫治疗反应预测研究中取得进展。团队首次系统性评估了当前主流大语言模型(Large Language Models, LLMs)在肝癌治疗效果预测这一复杂医疗推理任务中的应用潜力和价值,为AI驱动的精准医疗提供了实践和参照。相关成果已发表于医学信息学领域的国际权威期刊 Journal of Medical Systems。

HCC是全球范围内发病率和致死率均居前列的恶性肿瘤,免疫检查点抑制剂(ICIs)联合靶向治疗是晚期HCC治疗的重要手段,但综合有效率仅为30%左右。因此,临床需要新的策略来优化针对HCC患者的免疫疗法使用路径,特别是迫切需要新的预后判断工具来识别最有可能从这些疗法中受益的患者,以减轻由于免疫异质性而带来的个体疗效的显著差异。

近年来快速发展的大语言模型(LLMs),包括GPT-4o、Google Gemini和DeepSeek等,由于其出色的文本、图像理解以及推理能力,为包括医学在内的各个领域带来了革命性的变化。在最近的一些AI+医学研究中,LLMs模型也已表现出熟练的病变检测和分类能力,但它们在复杂医学推理任务(如,基于多模态数据的HCC免疫疗法反应预测)中的准确性仍不确定。同时,临床专家如何更好地使用快速发展的LLMs工具,实现真正的临床混合智能决策也是一个重要的话题。

在此背景下,研究团队引入大语言模型(LLMs),包括GPT-4、GPT-4o与Google Gemini等,探索其在整合多模态临床数据(包括病人信息与CT图像等)以预测免疫治疗反应中的潜力。该研究采用186例不可切除HCC患者的多中心临床数据,通过“零样本提示”(zero-shot prompting)方式,构建了一个与临床专家对标的诊断测试体系。团队评估了多种决策策略(“投票法”与“或规则”法)对LLMs预测性能的影响,并引入“Gemini-GPT”模型对结果进行整合优化。

研究结果显示,Gemini-GPT模型在准确率方面已接近具有15年以上临床经验的高级医生,显著优于初级和中级医生的表现。此外,该模型预测所需时间远低于人工诊断,体现出极强的效率优势与临床可操作性。进一步的分析表明,Gemini-GPT对不同治疗方案与不同疾病阶段患者,均表现出良好的预测稳定性与鲁棒性。值得一提的是,LLMs在本研究中展现出比医生更高的判断一致性,尤其在对“响应者”识别的敏感度优化上,通过“或规则”策略实现了更强的临床实用性。

这项研究不仅验证了AI大模型在复杂医疗推理任务中的可行性,也为未来构建基于AI的智能辅助诊疗系统提供了重要理论基础与实践模板。

LLMs与医生在肝癌免疫治疗反应预测中的对比研究流程

该论文的第一作者为中国科学技术大学2022级博士研究生许军,通讯作者是健康所李海研究员和王腾飞博士。本研究得到了国家自然科学基金和安徽省重点研发项目的支持。

文章链接:https://link.springer.com/article/10.1007/s10916-025-02192-1

top