撰文 | 知识分子
● ● ●
2025年,国产大模型Deepseek横空出世,掀起一波AI狂潮。数百家中国医院本地化部署了Deepseek大模型,并尝试将其整合到临床诊断与决策支持、患者教育、科学研究以及医院管理系统等实际任务中。
2024年12月,一场AI医疗模型与医生的巅峰对决在北京美中爱瑞肿瘤医院上演。由8名副高以上资质、在顶级三甲医院历经多年磨砺的医生组成的MDT(多学科诊疗)团队,与国内外五个知名AI医疗模型——豆包、百川、小荷、ChatGPT o3、Google Gemini同堂竞技。这次比赛,人类医生勉强和AI打个平手,而且在某些环节的表现已经输给了AI。“这让我感到惶恐”,这次比赛主持者、北京美中爱瑞肿瘤医院院长徐仲煌说道。
今年4月,清华大学宣布成立人工智能医院(Tsinghua AI Agent Hospital)。其以全科医学科和眼科、放射诊断科、呼吸科等专科为试点,从设计底层融入AI智能体功能,协助医生精准决策,长远计划实体化运行人工智能医院。清华大学副教务长、医学院院长黄天荫和清华大学智能产业研究院院长张亚勤,共同担任这家AI医院的院长。几家英文科技媒体称其为全球首个完全由AI驱动的虚拟医院。
医院们纷纷行动,美中爱瑞就即将在北京的望京建设一家小型AI医院。而科技企业也在加速布局“AI造医生”。今年3月,“大模型六小虎”之一百川智能与北京儿童医院、小儿方健康科技公司共同发布国内首个儿科大模型,以及AI儿科医生基层版、专家版。这被视为百川智能从通用大模型转向医疗垂直领域的一份阶段性答卷。
围绕AI在医疗领域发展的应用和挑战,北京市海淀区智识前沿科技促进中心(简称“智识学研社”,《知识分子》《赛先生》出品方)今年6月组织了一次科学四十人圆桌讨论会。讨论会邀请到这场AI医生变革的几位参与者:
黄天荫:清华大学副教务长、医学院院长,新加坡国家科学院院士、英国皇家学会院士,美国国家医学院外籍院士、澳大利亚健康与医学科学院外籍院士
王小川:百川智能创始人兼CEO
徐仲煌:北京美中爱瑞肿瘤医院院长
王仲:清华长庚医院全科与健康医学部部长
此次科学四十人圆桌由刘远立主持,他是北京协和医学院长聘教授、卫生健康管理政策学院原执行院长。以下为文字实录。
01
AI已经可以战胜医生了吗?
刘远立:今天的讨论开始之前,我们一起来梳理一下医疗健康人工智能、特别是AI医生总体的发展情况。相信很多人都很好奇,在哪些特定的领域或者场景,AI医生的诊疗能力已经达到了临床医生的水准。
首先请教一下黄教授,2016年,你在《美国医学会杂志》JAMA上就发表过关于人工智能医学应用的论文,您如何评价过去十年AI医生的发展现状?哪些是你当初写那篇paper的时候预料到的,哪些是没有预料到的?
黄天荫:回顾从2016年到现在2025年,AI在医疗领域确实取得了很多进展。2016年我们在《美国医学会杂志》那篇论文,是关于糖尿病视网膜病变的AI应用研究。当时我们用到了深度学习技术,这也是AI领域一个非常重要的技术突破。
这10年来,技术上确实有了很大进步。比如,2022年和2023年,大语言模型(LLM)和基础模型(Foundation Model)的出现,让AI从专科领域逐步扩展到全科领域,包括影像、放射、病理等方向。基础科研方面,我们也看到了大量顶尖的研究成果。但是,技术的进步并不代表它已经很好地融入了我们的医疗体系。
我觉得这里有一个很大的问题,就是技术和实际应用之间的脱节。AI在医疗体系中的应用还没有达到理想的广泛程度,我们的医疗体系在这方面还有很大的发展空间。我曾经提出过一个“5P”概念框架来分析这个问题:
第一个P是人(People)。医生对AI的了解还不够,医疗团队中懂AI的工程师也很少。AI要真正融入医疗体系,首先需要有懂AI又懂医疗的人才。
第二个P是平台(Platform)。目前很多医院的数据化、数字化基础设施还不完善,很多患者的病历还是传统的纸质记录。这种情况下,AI的应用就很难顺畅地展开。
第三个P是流程(Process)。我们现在的医疗管理流程,还是基于传统的看病模式。如果要引入AI,需要重新设计流程,让AI和现有体系更好地协同,而不是简单地把技术加进去。
第四个P是产品(Product)。我们需要明确AI在医疗中的具体定位,比如它是一个算法、软件、硬件,还是一个机器人?这些都需要清晰的定义。
最后一个P是政策(Policy)。政策支持非常重要,比如如何管理AI的风险和安全性,如何将AI纳入医保体系?这些问题都需要从国家和国际层面去解决。
总的来说,我的观点是,技术已经非常前沿了,但我们的医疗体系还不够成熟,尤其是在团队建设、基础设施、流程设计、产品定位和政策支持这些方面,还有很多工作要做。

刘远立:谢谢黄院长精彩的开场,从眼科领域切入,既展现了技术的飞速发展,也点出了应用层面在人力资源、平台、流程、产品和政策这5大瓶颈问题。总体来看,黄院长作为国际顶级专家,对AI医疗持审慎乐观的态度。接下来我们请肿瘤领域的专家徐院长分享。徐院长,半年前美中爱瑞肿瘤医院组织了一场人机大赛,8位资深医生组成多学科团队,与5个国内外知名医疗AI大模型PK肿瘤病例的精准诊疗。据说比赛中您和参赛医生们一度心情失落,当时为什么会有这样的感受?
徐仲煌:首先,我特别认同黄院长刚才提到的观点。其实我今天来之前心里还有点忐忑,因为说实话,医生对AI和算法的了解确实有限,包括我自己,现在还在努力恶补一些相关术语,比如什么“蒸馏”之类的。坦白讲,这些东西我们并不真正懂。但是,刚才提到的一些AI相关的设计,我们医院其实也有一些小规模的实践。比如在病例记录、预案制定等方面,AI已经开始成为医生手中的一个工具。不过,要真正做到大规模应用,或者正式使用,还涉及到很多问题,比如伦理问题,这些都需要进一步探讨。
说到那次人机比赛,其实当时DeepSeek R1还没出来,我们用的是百川、豆包、小荷、ChatGPT o3、Gemini等AI模型。我们的医生团队也很强,基本上来自协和、301等三甲医院的资深医生。因为我们医院是肿瘤专科医院,肿瘤又是特别复杂的疾病,所以我们采用的是全程实时的多学科诊疗模式(MDT)。比赛时,我们选择了协和的一个病例集,这个病例是有完整答案和结局的。整个比赛从问诊开始,到诊断、鉴别诊断、诊疗方案的制定,再到二次复发后的诊疗方案,每一步都进行了评分。
刘远立:这个比赛是双盲的吗?
徐仲煌:是的,绝对是双盲。评委也是分区操作,完全遵循双盲原则。我们还有5位IT人员在后台同步操作。这次比赛让我感到惶恐,因为AI的表现确实很强。虽然在处理非结构化数据时稍弱一些,但一旦进入到结构化数据的阶段,它的表现就非常出色。最终,经过所有环节的评分,我们人类医生只能勉强和AI打个平手。
我们医院是北京第三家肿瘤三级专科医院,排名仅次于东肿(中国医科院肿瘤医院)和北肿(北京大学肿瘤医院)。我们的医生团队实力很强,各科室的专家都参与了比赛,但即便如此,面对AI的推理能力,我们还是感到压力很大。尤其是AI在某些环节的表现,已经超越了人类医生。虽然我们在几个环节上还有优势,但整体来看,AI的能力确实让人惶恐。
不仅是我,参赛的医生们也有同样的感受。比赛结束后,大家甚至有点不服气,纷纷嚷着“再来一次”。
刘远立:徐院长,首先我敬佩您的勇气,我想你的老东家协和医院恐怕是不太敢于参加这种比赛。
徐仲煌:我们医院一向是敢于尝试、不怕犯错的,这也是我们拥抱未来的一种态度。当然我们也有一定底气,就像我跟小川老师提到的,我们院内的HIS系统是我们自己研发的,我敢说,数据的实时性和完整性在国内都是非常领先的。
不过,第一次比赛之后,我们确实不服气,但又不想让医生们的自尊心受到太大打击。所以第二次比赛,我们调整了方式,采取“人机协同”的模式。具体来说,就是医生先出一个方案,AI也出一个方案,然后两边互相交流,取长补短,看看能不能形成更优的结果。我们还特意选了一个协和的经典病例,一个淋巴瘤患者的病例,这个病例是协和各个科室都跑了一遍的,属于非常复杂的病例。结果显示,在AI工具的帮助下,医生的表现确实提升了很多,整体效果也更加贴合实际。
刘远立:第二次比赛中,有发现AI的一些不足吗?
徐仲煌:AI的不足当然是有的,而且一直都存在。虽然它在规范性、完整性和缜密性上表现得非常强,甚至已经有了某种AGI的能力,而不仅仅是专项AI的能力,但它在某些细节上还是不如人类医生。比如,有些病例中,像沟回部的肿物,医生可能会判断这个位置穿刺不到,直接选择放弃穿刺或者跳过某些步骤,转而考虑更直接的手术。但AI却往往会严格按照步骤来,比如step one、step two,完全按部就班,不会灵活调整。
另外,AI在考虑患者经济条件、家庭支持等温度化的因素上也是缺失的。它不会像医生那样综合考虑这些“人性化”的细节。但是,当AI和医生互相协作时,这些问题就能得到很好的补充。比如医生可以指出某些地方AI的不足,AI则可以提醒医生某些遗漏的细节。通过这样的协同,最终的诊疗方案明显更加完善。
不过,我依然对AI的发展速度感到惶恐。它的进步实在是太快了,让人难以预料它未来3年、5年会达到什么样的水平。所以,我对AI始终保持非常大的敬畏之心。
刘远立:谢谢徐院长,刚才谈到一个关键词就是这个人机协同,特别是第二次比赛的体现。请问王老师,刚才两位专科医生,眼科、肿瘤,对AI有两个稍微有点不太同的体验和看法。您作为全科医学的专家,怎么看您专业领域AI到目前为止的发展?
王仲:说到AI替代人类的事儿,其实早在上世纪90年代,计算机就开始替代我们的一些工作了。我印象特别深,我研究生毕业时用640k计算机做了一个彩色的幻灯片,那时候大家还在用蓝底白字的幻灯片,结果我做出来的PPT让所有老师都很震惊。后来互联网开始普及,又替代了我们很多工作,比如取片子、拿化验单这些事儿。
再后来,计算机和系统的进步又替代了数据存储的工作。协和有三宝,其中一宝就是病例,过去我们靠手写保存病例,现在有了电子病历,存病例已经不再是问题了。所以替代是一步步走过来的。但说到医生被替代,这里我想讲一个小插曲。有位企业家曾经说过,30年后医生会下岗。当时我很气愤,我说只要还有人会生病、会死人,医生就不会下岗。
但现在我发现,人工智能的出现真的可能让一部分医生下岗。为什么?因为医生的核心工作是拿到数据、分析信息、梳理逻辑、找到关键点、给出诊断并制定治疗方案。而这些AI正在做得越来越好。比如,AI可以把一个生化化验单分析得非常细致,它还能把不同时间维度的数据进行横向和纵向的对比分析,这些是人类医生做不到的。但AI能做到,甚至比我们更强。
所以我一点都不意外AI的快速发展,甚至可以说它一定会在某些方面超越我们。比如,我可能会记不住某个病人,但AI不会,它只要有足够多的知识库和逻辑体系,就能比我们更精准、更高效。未来,AI替代医生的某些岗位和工作是必然的,只是替代到什么程度还需要时间去验证。总之,我认为AI不会完全脱离人类,但它一定会改变我们的工作方式,甚至重新定义医疗行业。
02
AI造医生的时代到了吗?
刘远立:王仲院长刚才提到协和的三宝,病例、图书馆、教授。毫无疑问病例现在我们的AI代替了,图书馆也代替了,我特别感到有点震惊的,我们协和的前专家居然说协和的教授现在也迅速被代替,这个我确实是感觉有点冒冷汗。如果这三位我们形容为在前方、为人民的疾病来做斗争的前方将领,小川总相当于送枪送炮的后勤部长。你刚才听到了前方作战的将领们的发言,你觉得你的枪炮现在已经充分发挥了作用,还是说他们还没有意识到你很多仓库里面的秘密武器?
王小川:我觉得这个场子对我们太友好了。因为以前提出“AI医生”受到很多的挑战和质疑。今天“清华+协和”这个场子,大家都已经认为AI能干很多事情了。我很佩服徐院长的实践,当时比赛的结果公开我也看见了。刚刚徐院长没好意思说,Gemini和chatgpt当时是优于他们的医生,百川还差一些,没到医生的水平。但我很佩服他们有勇气公开这个结果,在当时还没人敢说“机器比医生好”的时候,他们就把这个情况摆出来了。
2023年,我鼓吹了一件事,叫“AI元年”。以前的AI都是假的,但这次是真的。以前的AI主要做图像处理,或者在统计上产生一些效益,而这次不一样,AI掌握了语言。语言是对世界的认知、沟通和抽象推理的核心。掌握了语言,AI就能像人一样去认识世界,并且建立起自己的思考能力。这是历史上从未有过的事情,甚至马克思都说,人和动物的区别在于人会用语言,而动物不会。
在医疗圈和科技圈之间,其实过去是有点“互相伤害”的。医疗圈会说,“你们AI快过来帮忙吧”,但AI来了之后一看,“不太灵”。而科技圈的AI团队冲进来,烧了1000亿,不是投在制药上,而是投在信息化和AI化上,结果钱没赚着,还赔了很多。但这次不一样了,核心原因是技术发生了翻天覆地的变化。
实际上再往前,刚才黄教授提到的2016年,对我来说是个很特别的年份。当时AlphaGo大胜人类围棋高手,让全世界震惊。其实早在2013年,我就想用机器下围棋了。我去(清华)大学找了系主任、党委书记、高性能所所长、人工智能研究室的主任,说我们一起来玩这个,但可能是我说服能力有限,没人愿意陪我玩,这事儿就搁下了。到了2016年,Google说要比赛了,还发了论文。我当时很兴奋,在知乎上发帖子说AI能赢,当时不是说下围棋的不相信,科技圈大多数人也不相信,大佬们都打赌说机器赢不了,结果最后他们每人输了1万块钱。
2016年AlphaGo比赛的时候,新浪直播请了我去做嘉宾。他们找了两个代表,一个是支持AI能赢的,就是我;另一个是支持人能赢的,是中国围棋队总教练俞斌。他不仅是围棋高手,还会写程序,是围棋队里程序写得最好的一个。他当时觉得我们这些人相信机器能赢的脑子都抽了。但比赛的结果让所有人震惊,机器赢了。俞斌当场就有点蒙圈了,甚至都不知道怎么下楼回家,最后是新浪体育频道的编辑们把他送下楼,帮他打上车。那一刻我就深刻理解到,AI的突破,对一个顶尖的人类高手会造成多么大的冲击和压力。
我在医疗领域也遇到过很多质疑,比如有院士就直接diss我,说“你学啥的?”我说学计算机的,他就说医疗太复杂了,计算机怎么可能搞定?但我觉得正因为学计算机,我才知道这事儿是靠谱的,就像AlphaGo用计算机下围棋一样,我知道这里面有很大的鸿沟,但技术是有机会突破的。尤其是语言被AI突破后,这次真的不一样。不仅医生这个职业,很多其他职业都可能被颠覆性地改变。
我的预测是,AGI未来几年就会到来。外界看到百川从AGI转向医疗,觉得是转型,但其实这是我的初心。我从2023年开始就是想做“造医生”这件事儿,但当时不敢明说,否则团队招不到人,投资人也不信。他们只会问技术行不行、监管怎么办、商业模式怎么搞?这些问题确实很复杂,但我始终有一个信仰,就是机器能比人更强,而医疗是人类最需要的一种服务。
早在2016年我们就做了一款“搜狗明医”的产品,虽然没做到根本性突破,但它的目标是帮助患者明明白白地看病,懂得如何与医生沟通。这也为后来AI医疗的发展打下了基础。2018年,我作为政协委员就提出,让AI赋能基层医疗,我觉得突破点在基层上。
但更远一点,我有一个更大的畅想,就是“生命建模”。生命科学和物理学不一样,物理学看似严谨,但最终走向熵增,是不可计算的,比如天气预报或者三体问题,轨道最后都不确定。但生命科学不一样,它有规律。比如一个受精卵10个月后变成婴儿,长得还像父母,这是清晰的结果。所以我一直在想,生命怎么建模?今天AI医疗谈的是像医生一样的工作,但未来更大的颠覆不是医生,而是让机器能为每个病人建立“数字孪生”,了解病人的生命模型,从而预测健康状况。这是医生今天做不到的,但AI可以做到。
建模并不一定要从基础科学开始,临床数据就足够了。生命是可约的,不像传统的超算那样复杂。比如Alphafold通过智算直接从基因推导到蛋白质,比传统超算快了几万倍。未来,用AI模型为人建立生命模型,也可以实现类似的效率提升。所以我觉得,下一个发展的方向,除了“造医生”,还包括为生命建模,通过AI医生和数字孪生的结合,推动医疗领域的巨大突破。这是我对未来的畅想。
03
AI医院怎么建?
刘远立:好,谢谢小川总的精彩分享!果然不愧是“四清”——本科、硕士、博士、EMBA,都是清华的。“造医生”这件事情,小川总是吃螃蟹的人,他展现出了巨大的勇气和开创精神。当然,今天在场的还有同样值得敬佩的“吃螃蟹的人”。小川总是“造医生”,他们是“造医院”。
大家可能已经知道了,2025年4月26日,清华大学成立人工智能医院。围绕着刚才小川总谈的“造医生”,接下来我们就来谈谈“造医院”这件事儿。黄院长,现在大家对你的AI医院非常关注,能不能给我们介绍一下?清华成立的AI医院和我们传统的医院到底有什么不同?
黄天荫:这是很重要的一个责任。因为怎么样做一个AI医院,目前还没有人能够完全确定。我们需要明确AI医院的模型和医疗模式到底是什么?
传统的医院,无论是在中国还是全球范围内,都是依靠床位、医生和医护人员的数量来扩展服务能力。也就是说,增加医生和床位,就能增加对患者的服务。但这种模式已经很难满足未来的医疗需求。现在很多医院,包括海外的医院,也在尝试把AI技术融入现有的体系。但这种做法并不容易,因为传统医院的体系非常复杂,比如协和医院有100多年的历史,积累了很多宝贵的经验和资源,要在这样的体系中加入AI技术并不简单。
所以,我们清华在设计AI医院时,选择了一条不同的道路。我们不是在传统医院的基础上逐步加入AI,而是从零开始,从一张白纸出发,重新设计一个医院。如果没有既定的医院,我们会如何设计?这是我们遵循的原则。我们希望技术与医疗模式共同创建这个AI医院,而不是先有医院后加技术,也不是先有技术再找医疗体系。张亚勤院长从技术和AI的方向提供支持,而我主要负责临床医疗的方向。我们强调,技术与医疗必须同步推进,而不是一个先行另一个跟随。
我们的核心目标是通过AI技术大幅降低医疗成本,同时提升医疗服务的质量和效率。比如,一个普通医院可能1000张床位只能服务100万人,但我们希望通过AI技术,用10或100张床位服务1000万患者。这不仅是一个技术上的挑战,更是一个医疗模式的创新。
我们计划先从三个示范点开始推进AI医院的建设:全科医疗、眼科AI门诊、放射影像。我们AI医院的目标不是发论文,也不是做研发,而是让每一个患者真正进来享受AI医院的服务。
刘远立:好的,我稍微解释一下,现在世界上的医院大致可以分为两种类型:一种叫“大综合小专科”,另一种叫“小综合大专科”。刚才黄院长给我们描绘了他心目中关于专科与全科之间平衡的愿景。这确实是一项非常有挑战性的工作。这个工作到了执行这一块就更有挑战性了,王仲教授,假设AI技术方面和临床意见不一致,你怎么办?
王仲:好在现在我们团队的意见还是一致的。不过刚才天荫院长也说了,他也不知道该怎么做,所以我就更不知道该怎么做了(笑)。像我刚刚说的,我是被加入这个团队的,但我觉得非常荣幸。同时,这也给了我一个很好的机会去思考:AI医院和“医院+AI”到底是什么关系?
如果回到传统医院的建设,我是有一些经验的。我有幸参与过协和医院新楼的筹建工作,后来又参与了清华长庚医院的筹建,所以我很清楚建一家传统医院的流程是什么样的。通常我们会先有一组人去规划:我要建一个多少张床的医院,占地多少面积,楼能建多高,设置多少个科室,是手术科室还是非手术科室,手术科室占比多少,需要配多少个手术间等等。接下来,我们会采购设备,比如CT、核磁共振,然后决定这些设备放在哪个房间、电源怎么配置,最后才是搭建信息系统。这是传统医院建设的思路。
但是,AI医院可能完全颠覆了这种逻辑。AI医院的核心不是先建一个物理空间,而是要建一个数据流向系统。比如说,我们现在的医院是病人挂号后走到诊室,才开始和医疗机构建立联系。医生问诊、查体、开检验单,病人和医院的联系从这一刻开始。等结果出来后,医生再根据结果判断治疗方案。但在未来,可能很多数据的采集并不发生在一个物理空间的医院,而是在一个信息化的医院。这个医院是一个“范畴”,而不是一个具体的空间。它可能在美国、欧洲,也可能在北京。通过AI分析数据,帮助判断病人是否需要进一步的人工检查或治疗。
所以,我的理解是,未来的模式可能是“小物理医院+大AI医疗服务”。在这样的思路下,我们正在黄天荫院长和张亚勤院长的指导下,紧锣密鼓地思考这些问题。同时,我们也希望能够尽快搭建起一个平台,实现天荫院长提到的愿景:尽早进来第一个病人。
刘远立:好的,我们从一些创新的医院建设,再回到我们相对比较熟悉的专科,肿瘤和儿科,先请徐院长谈谈在肿瘤专科人工智能的发展和应用当中,您主要的体会。
徐仲煌:其实我还真想谈谈AI医院。清华作为“航空母舰”,资源力量非常雄厚,所以我特别赞成王教授刚才提到的“白纸上画图”。去年5月份我去了Mayo Clinic,也考察了日本仙台一家医院,但他们还没有达到AI医院的描述和标准。我们还请了他们两位年轻教授来谈他们建设AI医院的思路,但显然目前在全球范围内还没有形成明确的共识。不过有一点我认为是确定的,无论医院是虚拟的还是实体的,采集数据的功能一定不会改变。
刚才小川总提到的“模拟人”(数字孪生),我觉得很可能成为未来AI医院的重要替代技术,但这种模拟应该是个体化的(individual),而不是通用的(general),甚至可以是模拟局部。医学跟其他自然科学相比发展较慢,主要原因是容错率低,无法反复试验。但如果有了模拟技术,医学技术的进步速度可能会大幅提升。
我想象中的AI医院可能会有类似的应用场景。比如说,在眼科手术中可以通过模拟技术提前演练手术方案,这需要结合VR、AR等技术。AI医院的建设思路可能是从AGI入手,再逐步发展针对性的AI医疗技术。我们也需要关注医疗的特殊性,比如数据隐私、生物学等问题。
我们目前也在迈出探索的步伐。我们计划在望京建设一家小型AI医院,规模不大,有800张床,但占地22万平方米。(与AI虚拟医院不一样,美中爱瑞将依托火山云三层架构,以AI Agent重塑数据与应用生态,借助智能体打造以数据为基础的智能医疗平台,建设AI原生医院。)去年考察Mayo Clinic时发现,他们已经部署了600多个医疗AI,但更像是“智慧型医院”,而非真正意义上的AI医院。我觉得要正本溯源一下,当前许多医院只是简单地部署一些AI技术,比如DeepSeek,就号称是AI医院,但这与真正的AI医院相差甚远。AI医院里AI是“大脑”,而不仅仅是提高效率的工具。
AI在医疗中的潜力是巨大的。我们曾有一个案例,通过AI分析全基因库,推算出一个从未作为适应症使用的药物,最后证明效果很好。这是AI的力量所在,但也有局限性,比如有些最新的专科文献,AI可能无法及时获取。
刘远立:徐院长的分享总是充满激情。在这里,我顺便分享一个挺有意思的信息。我有一个硕士生今年毕业,他的毕业论文是关于中美两国一流医院科研产出的比较研究。他选择了美国的4家顶级医院,包括梅奥(Mayo),以及我们中国排名前4的医院,得出了两个很有意思的发现。
第一个发现是,在顶级期刊上发表的文章数量,美国医院是中国医院的20倍。这说明我们在传统科研领域还有很大的差距。但第二个发现让我觉得很有希望:在人工智能这个新兴领域,美国医院的优势缩小到了2倍左右,几乎是一种并跑的状态。
所以我想问一下小川总,作为在这个领域最有发言权的人之一,您怎么看?我们是不是有可能在人工智能领域实现并跑甚至领跑?
王小川:美国的0到1创新能力确实比我们强很多,他们的创新意识和文化很成熟;而中国在1到100的规模化上更有优势,比如大模型技术,美国先发明了,国内像DeepSeek就能快速跟上,做得更工程化、更便宜。医疗领域也是这样,美国在创新上更强,但中国顶尖专家的个人能力比美国更强。不过,中国的医疗难点在于支付体系,保险支付能力比美国差很多。在美国,你帮医生省一半时间,他就能赚很多钱;但在中国,医生省了时间也赚不到钱,这就特别难。
所以,我们要找到自己的切入点。我提了两个愿景,一是为人类造医生,二是给生命建模型,这是我最想做的事。不做制药,是因为我觉得那块太深了。越专业的东西,AI在其中越做配角,我认为“造医生”是离大模型最近的一件事。
AI为什么从儿科切入?因为儿科医生尤其短缺,按人均配比缺100万。而且,AI在医疗场景中,大医院对AI需求小,小医院和基层对AI需求大,所以AI应该往基层走,帮助实现分级诊疗。全科和儿科是我们的优先选择,全科医生是家庭医生的核心,每家需要一个;儿科医生是儿童健康的保障,但因为儿科不赚钱,医生越来越少。我们希望通过AI技术,让基层医疗和居家诊疗更普惠,既符合国策,也满足老百姓的需求。
04
如何在未来十年培养出适应AI时代的医生
刘远立:小川总提到选赛道和补短板很重要,我想补充一点,儿科不仅需要医生,还需要家长的参与,这是一个天然可以融合to B和to C的领域。刚才4位专家已经讨论了人工智能领域的发展现状及其未来的巨大价值。接下来,我们想探讨这个领域主要面临的挑战。具体到垂直赛道的人工智能,核心在于研发如何让现有的大模型更优,以及应用的落地。从大模型的角度看,算力、算法和大数据是三大约束条件。请各位专家从小川总开始,谈谈在医学人工智能领域,如果我们想保持并跑并争取领跑,主要的挑战和约束条件是什么?
王小川:关于算力、算法和数据的问题,我觉得医疗领域的算力其实不是主要瓶颈。极端地讲,人的DNA里agct的总量不到一个G,只有0.75个G,说明生命最底层的模型并不复杂。今天的复杂性是因为我们还没找到好的模型去模拟它,甚至我认为不需要万亿级参数就能解决问题,这是我的第一性思考。
接下来是算法和数据的问题,尤其是数据,大家都知道这是个大瓶颈。数据既有用户隐私脱敏的问题,又有医院利益的问题,还有数据质量差的问题。很多数据打开一看,根本没法用。我的构想是,数据的解决不仅仅依赖专病的优质数据,还可能需要AI医生陪伴用户,通过全病程、全生命周期去收集数据,形成数据飞轮。这样,AI医生不仅能收集数据,还能推动医院数据的使用,形成双轮驱动的状态。
算法方面,我的看法可能和大家不太一样。现在大家造医生模型时,习惯于遇到垂直领域数据就往大模型上fine-tune一下,但我觉得不光是这样。除了医生模型,还需要数字孪生模型。医疗数据并不是完全用来训练医生的,现实中的医生也不是靠读了1000万个病例学会看病的。因此,算法中间还有很多挑战需要解决,比如医院里用DeepSeek挂个东西加个rag,或者用数据fine-tune一个模型,这些做法我觉得都是吹牛的,不是这么玩的。要走这条路,还有很多科研问题需要攻克。
另外,我认为解决数据、算法、算力这些问题的根本,不是从技术本身出发,而是看你跟谁合作。做科技公司,如果没有医疗场景的支持,很难独立完成。比如你跟政府讲自己能做AI医生,政府也无法验证。所以好的合作伙伴非常重要。像清华现在把医学和技术结合起来,比如亚勤和天荫的合作,这些跨学科的融合是关键。最终,基层医疗可能是AI医疗的主要应用场景,而不是大医院。所以,我觉得要跳出算力、算法、数据的框架,关键还是找到好的合作伙伴,推动技术落地。
刘远立:刚才谈到医学和人工智能两大领域的合作,这种紧密的合作需要优秀的合作伙伴。最近我在做专题调研时,特别是在中科院计算所,他们提出新型复合型人才,既懂临床语言,又懂计算机语言,这类人才现在是最为缺乏的,他们可以起到桥梁作用。黄院长,您既是医学家也是教育家,您认为中国在医学人工智能的大模型发展和创新中,如何才能在全球医学领域发挥更大的作用?目前最大的挑战和约束条件是什么?
黄天荫:刚才小川讲的我非常赞同。现在我们面临的核心问题已经不是算法,而是人才培养的问题。作为高校,清华大学的核心责任就是人才培养。然而,我们需要思考,2025年培养出来的医学生,在2035年进入医疗行业时,是否能够适应AI时代的医疗体系?目前我们的培养模式并不能完全满足这一需求。
首先,现在医学生的培养模式还是相当传统。虽然很多大学已经增加了一些AI相关课程,但仅仅在课程中加入AI知识是远远不够的。其次,医学生的重要培养阶段是在临床实习阶段,但他们仍然是在传统的医院环境中学习,缺乏AI医疗体系的实际体验。
因此,我们需要思考如何为2035年的医生构建一个全新的培养模式。清华大学之所以要建设AI医院,不仅是为了应对医疗问题,更是为了给医学生提供一个在AI环境下学习和实践的场所。在这样的AI医院中,医学生可以在全新的医疗模式下学习临床经验,而不是仅仅依赖传统的医生和患者的交流方式。这种环境中,AI将成为重要的一部分。
所以,我认为未来最大的挑战之一,是如何在未来十年内培养出适应AI时代的医生。这需要我们在医学教育模式上进行更多的努力和创新。
除此之外,我们也需要注意,在国际上一些发达国家,很多医生是从研究生阶段开始培养的,本科阶段更多是以工科背景为主,然后研究生阶段进入临床学习。而我们现在仍然从本科阶段开始培养医学生,导致医生缺乏多样化的背景,尤其是工科背景的医生非常少。相比之下,一些发达国家的医生大多具备工科背景,这让他们在AI时代更具优势。我们的医学教育模式相对传统和保守,还未能完全适应AI时代的需求,我们需要思考这个问题。
刘远立:前面徐院长还有王院长都提到医生未来会不会失业的问题,黄院长给出的答案是未来能不能有你的岗位,取决于你现在怎么培养,是不是能够适应未来的挑战和需求。好,徐院长请发表你的高见。
徐仲煌:我非常赞同两位的意见,目前IT人员与医务人员的沟通效率很低,IT人员常以为自己懂了,但做出来的东西并不符合临床需求。我们曾找了一个北大的博士后,能较好地理解两边,但这种复合型人才非常稀缺。虽然不需要每个医生都精通AI,但这类交叉型人才的比例需要提高。
我特别希望将来清华医学院AI+医学这部分可以做起来。我对打通数据那部分是悲观的,当下怎么也做不到。目前医学教育时间长、课程紧,医生还自带优越感,不愿意从事跨领域的工作,导致培养两头都精通的人才非常困难且不现实。因此,现阶段更需要偏年轻、对医学和AI都有一定理解的复合型人才,减少医疗与AI沟通中的低效问题。这种人才的培养迫在眉睫。
王仲:三位老师讲的我都特别认同。AI医院是一个全新的概念,目前还在摸索中。我最近读了一本书《未来医院》,里面提到未来医院的发展重点是可穿戴设备和传感器。但小川总你们一直在谈数据的问题,作为一线医生,我认为数据有两个层面:一是培养AI医生的数据,二是病人看病时的具体数据,其中病人数据是最大的难点。
临床诊断中,很多信息是通过医生的观察和经验得出的,比如我在教学门诊时,看病人一眼就能判断他没事,或者通过观察面色判断贫血,再去开化验单。但如果医生没有这种判断,化验单就不会生成,AI也就没有数据支持。同样的,在病房查房时,有医生听诊说没有啰音,但我复查后发现是有的。这种情况下,如果AI依赖的是前者的数据,诊断就会出错。
所以,当AlphaGo战胜围棋棋手,或者像仲煌教授团队将协和的病例输入计算机时,我对机器胜过人类一点也不惊讶。但如果让它面对一个真实病人,问题就会出现——数据的采集可能不够全面或准确。尤其是在基层医疗中,计算机领域有一句话叫“垃圾进,垃圾出”,我关心的不是计算机分析出的结果,而是它所依赖的数据是否可靠。
因此,我建议组建医工交叉的研发团队,开发能够精准采集临床信息的设备,比如通过拍照判断面色是否苍白、结膜是否黄染、喉咙是否红肿或有脓点等。这些看似简单的临床动作“望闻问切”,其实对AI来说非常难。如果不能采集到这些可信信息,AI的诊断和治疗都无法准确。所以,当前的重点和难点是解决数据采集的问题,为AI医生提供可靠的基础数据。
刘远立:谢谢王院长!到目前为止,我们讨论的医学人工智能话题,更多还是聚焦在专业领域的发展。当然,生命科学和医学的进步会对人类健康做出越来越大的贡献。但我想提醒大家,医学对整体健康的贡献目前大约只有10%左右,也就是当人生病后,通过诊断和精准治疗所能带来的影响。相比之下,遗传因素占30%,而环境和生活方式的影响更是高达45%左右。
因此,今天在座的每一位不仅是这个话题的利益相关者,更是健康的第一责任人。接下来,我们将对话的平台开放给大家,感谢各位百忙之中参与讨论,希望大家踊跃提问,提出你们感兴趣的问题!
05
AI医生也需要发表论文吗?
现场嘉宾:感谢几位老师的分享,我有两个问题:第一个,目前AI更多是与医生协作进行诊断,但如果未来AI能单独完成诊断,一旦出现问题,伦理责任应由谁承担?是医生还是AI?第二个,我来自清华新闻传播学院全球发展健康传播研究中心,我们关注医疗资源不平等的问题。请问几位嘉宾,AI的发展会加剧这种不平等,还是有助于弥合医疗资源分配的不平衡?
黄天荫:目前来看,责任还是在医生身上。AI作为工具或辅助医生工作的手段,责任应该归属医生,这一点没有矛盾。至于中长期的情况,比如完全由AI进行诊断或治疗,责任归属就更复杂了。可能涉及两个方面:一是患者自身的责任,二是公司的责任。但目前政策上还没有国家对此做出明确规定,因为我们还没有进入这个阶段。现阶段,责任还是在医生和医院的架构内。
第二个问题问得很好,AI技术是否能弥合医疗资源的不平等,还是会加剧差距?我们的目标当然是让AI帮助实现医疗资源的更平衡、更公平、更共享,让所有人都能受益。但目前还没有达到这个目标。因为很多数据、算法主要来源于资源较丰富的医院、社区和机构,而不是基层医疗。这意味着,如果我们想真正让AI成为公平的工具,就需要在经济不发达的地区、最基层的医疗环节收集数据并解决实际问题。只有这样,才能实现AI推动医疗资源平衡的目标。
刘远立:诊断差错的伦理责任问题,其实已经开始出现了。黄教授最近在《美国医学会杂志》上发表了一篇文章,提到当前无论大小医院都在布置DeepSeek。这当中可能会出现一些乱象,非常值得警惕。
从客观情况看,我们对生命现象的认识还非常浅薄。未来100年后的人回头看我们今天的医学知识,可能会觉得十分可笑。实际上,即便没有AI,我们的医生每天都在犯错误。比如,美国作为医疗最发达的国家,每年因医疗差错导致住院患者死亡的数字在20~40万之间,占住院总人数的0.5%到1%。所以,不要因为AI的出现才担心错误问题。关键在于,AI能否减少我们人为的错误?我相信可能会有所改善,也许小川总会更为乐观。
王小川:伦理的问题看你想听鸡汤的还是现实的。鸡汤角度很鼓舞人心,我老拿无人驾驶做类比,早晚机器会比人表现得更好,甚至未来可能立法禁止人类驾驶,因为人类驾驶事故更多。但现实是,法律上目前很难界定机器是否真的好到可以独立工作。在实际合作中,比如与儿童医院的合作,机器出错了,这个事就做不下去了。因此,目前还是需要将责任归于人,这样更安全,也有利于人机协作和信任的建立。现阶段的人机协作模式,AI应在法律边界内作为辅助,不要直接进行诊断或治疗方案的制定,这样的责任划分并不值得纠结。
公平性的问题更复杂。历史表明,全球化和技术发展常常加剧贫富差距。医学发展中,一些学科因为高价值耗材或药品的推动发展得更快,比如肿瘤。公平性和效率往往冲突,例如“长寿医学”首先服务于有钱人,通过他们的投入推动科研发展,最终可能实现普惠。因此,公平性问题是复杂的,短期内普惠并不现实。社会需要通过政府调节或市场化发展逐步实现平衡,但这注定是一个漫长的过程。
现场嘉宾:各位应该都跟监管部门有很多交流,从国家卫健委的角度来说,目前对大模型的监管会是一个什么想法?我很好奇,这一定程度上决定了行业未来的发展。
刘远立:去年国家卫健委已经出台了一些指导性的意见,但目前一些具体的硬性规定还在研究中,包括国务院参事室也在参与研究。欧盟的做法值得借鉴,他们提出了“预见性规制”(Preemptive Regulation)的概念。既然已经预见到可能会出现的问题,就不应该等到问题发生后再讨论如何规范,而是要提前研究和制定对策。未雨绸缪的方式能够避免问题的大量出现,以及由此引发的社会反响和舆情事件。我非常赞同这种走在前面的思路。
现场嘉宾:作为一名传统的医学生和未来的医生,应该如何学习AI相关知识,并结合临床更好地改进和应用AI?
黄天荫:如果你是学医学的,我鼓励你学其他的学科,比如研究生或者博后学工科,学AI,可以去国外学习。第二个意见,年轻的学生在这个很复杂的国际环境下,还是要和其他学科和国际学生交流,不仅学习专业知识,还要接触不同的文化,这对职业发展非常重要。第三个我也觉得很重要,许多学生出国后转向科研或教学,不再从事临床工作,但这对医疗体系的改革没有帮助。如果想要改革医疗体系,仍然需要关注临床。希望未来你能成为既懂AI又从事临床工作的专家,甚至可能成为AI医院的院长。
现场嘉宾:在癌症治疗领域,AI有哪些探索?除了药物研发之外,AI在临床实践中有哪些重要作用,对患者有哪些实际帮助?
徐仲煌:医生对现在肿瘤的机制,比如免疫逃逸、基因突变这些,其实是有一些了解的,但肯定还不是最终的答案,这里面有一个阶段性的过程。你刚才提到AI的探索,我觉得是这样的,AI现在是在深入到严肃医疗的范畴,比如Google做的AlphaFold,它是做蛋白构型的,这其实就是AI在这方面的一个探索。国内像字节跳动,还有很多AI公司,也都在做药物设计,这些都是AI的一个方向,你说得很对。
但我想从一个临床医生角度来说点别的。你看我们现在中国的医疗,比如一个肺癌,从头到尾都是胸科医生在管,但实际上肿瘤是个系统工程。我们的治疗方式还是比较传统,比如开刀、吃药、放疗、化疗,都是片段化的,很少有系统管理的理念。这个时候,如果能用AI来更好地规划治疗方案,比如我们自己做的案例,用AGI或者类似的医疗AI来设计方案,它可能会更全面一点。甚至你可以要求它语气更温和一点,它都能做到。现在很多公立医院的医生态度不是特别好,比如简单一句“回家吃药”,患者体验很差。但如果有AI,它可以贯穿整个诊疗过程,比如我们现在每个住院病人都会做多学科诊疗(MDT),一级、二级、三级MDT贯穿始终,会有好几个MDT报告去解读。AI在这里就非常强大,它可以考虑到营养这些细节,比医生更全面。
另外,AI还有一个很大的优势,就是evidence-based的能力。以前我们查一个药的文献,可能要花半个月,现在AI几十秒就能完成,直接把背景调查都做好了。这些都是AI的贡献。
作为临床医生,我能体会到传统疗法的很多弊端。不是医生不知道这些问题,而是除了放化疗这些办法,我们确实也没有更好的选择。这才是根本原因。所以我觉得AI的未来在这里面能起到很大的作用。
刘远立:现在肿瘤领域确实还在不断探索,我顺便也给大家分享一个消息。肿瘤这个问题确实是关系千家万户的大事,尤其是我们中国人,普遍“谈癌色变”。大家对现状不满意,这是很普遍的现象。尽管问题很多,像我们今天徐院长的肿瘤科医生、大夫、医院,其实一直在艰苦地做探索,努力改善现状。而且刚好借这个机会,我做个小广告:下个月,我和中国医学科学院肿瘤医院的张勇教授合作编的一本书就要出版了,书名叫《改善肿瘤医疗服务的中国实践》。这本书总结了中国在这方面做得比较好的实践,比如MDT(多学科诊疗模式),还有怎么用数字化的手段来改善肿瘤医疗服务,包括科研等等。这些都是中国的优秀案例。这本书是我们花了将近三年的时间才编出来的,下个月会由人民卫生出版社出版。所以我想借这个机会分享一下这个消息。
现场嘉宾:在中国,医生和护士不仅要看诊,还承担科研任务,如发文章、做实验、优化治疗方法,并推动医学边界的发展。那么,随着AI医生和AI医院的出现,未来AI医生和AI医院是否也需要参与科研?如果需要,它们又该如何开展科研工作?是否也需要发表论文?
刘远立:这方面我们的黄天荫教授最有发言权。
黄天荫:我觉得要有新的模式。要改变我们传统的、已经延续了100多年甚至几千年的医疗模式。传统的医疗模式是医生和患者之间的关系(doctor-patient relationship),但现在需要稍微放松一下这种关系。未来可能会加入AI,形成一个三方的关系。
《新英格兰医学杂志》有一个关于AI的podcast,里面提到一个问题:如果医生不用AI,可能会输给那些使用AI的医生。因为没有充分利用最新的技术,现在仍然是医生用AI时由医生负责,但很多传统医生认为AI不属于他们现有的职业范畴,依然将其视为科研项目。然而,美国已经开始推动,如果医生在诊疗中只依赖传统的医疗方法、个人经验和以前的文献,而没有使用AI,导致诊断错误,可能会被认为失职,甚至可能被质疑为什么没有使用AI。这种趋势正在改变医疗实践的规则,AI可能会成为医疗的标准操作规范(standard of care)。
我们目前还没有达到这个阶段,但未来在AI医院的环境中,将是医生、患者和AI三方共同协作的关系。我们必须接受这种未来的模式,才能走向下一步的发展。
刘远立:很重要一点是,现在我们的临床医生发论文的压力太大,在国外没有这种,这种制度一定要改。
王小川:说到一个让我挺兴奋的事情,其实当时我决定下场做百川的时候,“百”其实就是“bio”,也就是生命科学的意思。从本质上讲,我的目标可以概括为两句话:“给生命建模型,给人类造医生”。不过,“给人类造医生”并不是我的终极理想,“给生命建模型”才是。但如果我只说“给生命建模型”,很多人会觉得我疯了。所以,把这两件事结合起来,对我来说是一个巨大的鼓励,促使我下场参与医疗领域。
在这个过程中,我发现医疗其实在整个科学体系中是一个相对落后的学科。我们对生命的理解非常有限,相较于生命的复杂性而言,目前的研究水平显得非常落后。这种落后不仅表现在对生命的认知上,也体现在科研的方式上。尤其是在临床领域。大多数医生做科研的方式是围绕自己的病人,建立一个专病数据库,进行一些简单的分析。但这种数据收集的能力和维度,包括时间长度,都是远远不够的。
我曾经用过一个比较尖锐的比喻,说大多数医生做科研就像“大炼钢铁”,开个小钢炉,倒两下,发一篇文章。但这些文章往往只是基于几十人、几百人的循证医学分析,对生命的理解非常浅薄。因此,我认为AI智能在这里可以发挥两个重要作用:
第一,帮助数据分析。这是大家目前普遍能看到的AI作用。AI可以大幅提升分析的规模和效率,比如最近我看到几篇研究案例。其中一篇是英国用5,700万人的数据进行了分析,预测了上千种疾病的后续发展。另一篇是关于乳腺癌的研究,利用AI进行了5年生存率的预测,刚刚被批准。这种大规模的数据分析是AI的一个显著优势。
第二,更重要也更“性感”的事情,是让AI帮助我们收集数据。刚才提到的“研究型医院”,其实是一个很有意思的概念。什么叫研究型医院呢?可以用一句话概括:“入院即入组”。也就是说,你一进医院开始看病,你的数据就开始被收集了。如果未来AI医生参与诊疗,是不是可以实现“全病程管理”?甚至可以延伸到“全生命周期”的概念。从你出生那一刻起,你的生命数据就开始被记录。这样的数据收集方式将对医学研究产生巨大的推动作用。
这也和天荫教授提到的观点一致:未来的科研范式将发生巨大的变化。从数据的收集到处理的方式,都将迎来颠覆性的转变。我们从经验医学走向了循证医学,而循证医学的终点一定是个性化精准医学。但这里的“精准”并不仅仅局限于肿瘤领域的基因精准,而是对每个人的全部症状、数据和分析进行综合判断,将每个人当成一个独立的课题,预测出最适合他的治疗方案和方式。
因此,AI是必须要拥抱的工具。因为人类的知识储备和大脑的处理能力远远不够支撑这种复杂的科研和医疗需求。
王仲:我再补充一句。2003年以前,我对科研一点兴趣都没有。2003年以前我只发过一篇文章,是1992年研究生毕业时发表的。现在我对科研非常有兴趣,这种转变的原因是什么?是意识的发展和科研的推动,而不是一种被动的选择。
未来AI医生需不需要写文章?我估计AI医生本身可能不需要写文章,但运行AI系统的医生一定需要写文章、做科研。为什么?因为AI医生引入了一种全新的模式、新的手段和新的数据,这些都会推动AI技术的发展。而且,AI本身也会在某种意义上“被写文章”。
我相信未来的AI医院不会只有一个系统,比如百川系统、DeepSeek系统或者其他系统,而是会有多种AI系统并存。我们需要比较这些系统,看看哪个更符合医生的需求,哪个诊断的准确率更高。百川团队可能会建立一个评价体系,对这些AI系统进行评估。这个评价体系本身就会推动AI的进步,可以说,这相当于让AI“写文章”了。
刘远立:未来肯定还是需要有人写文章,但可以预见的是,AI将成为共同作者,其作用不可替代。两个小时的时间很快就过去了。今天我们讨论的话题既严肃,又与千家万户息息相关,涉及每个人的切身利益。因此,今天的对话可以说是双重的:既有台上嘉宾之间的对话,也有与在座各位参会嘉宾的交流。
通过今天的对话,我们了解到医学人工智能的发展是一把双刃剑。最后,我请台上的嘉宾用两句话总结一下:第一句,您对目前医学人工智能所发挥作用的体会;第二句,您对未来十年医学人工智能的展望。我们先从王仲院长开始。
王仲:第一句,人工智能时代已经来了,第二句话,未来我希望给我看病的AI医生是可信的。
徐仲煌:AI带来的变化是翻天覆地的,涉及社会生产力和世界形态的改变。AI在很长时间内仍是工具,关键在于如何用好这个工具。
黄天荫:在AI的时代拥抱AI,也要学习AI。人类也应像AI一样保持持续学习的精神。
王小川:刚刚提到我们的AI已在MDT环节中达到与医生团队持平的水平。往下我希望发生三个具体的情况,一是居家医疗服务(hospital at home);二是人人拥有AI家庭医生;三是数字伴随(digital companion),AI医生不是你有问才答,而是时时刻刻给你伴随诊断,伴随治疗,全方位的照顾。
注:科学四十人是一个科学交流公益项目,由北京市海淀区智识前沿科技促进中心(简称“智识学研社”,《知识分子》《赛先生》出品方)发起。此次科学四十人圆桌“AI医生:进展与挑战”得到了中关村科学城管委会、北京字节跳动公益基金会、国家(中关村)火炬科创学院、浙江省科汇致远公益基金会的支持。
0
推荐