
图源:AI生成
编者按:最近,南京医科大学生物医学工程与信息学院教授张锡哲在 《Nature》主刊World View栏目,发表了一篇题为 《Will AI spark a scientific renaissance?》的文章。文章探讨了这样一个问题:AI 对科学的影响,不应只从生产率来衡量,不是 AI 能让科学界多发表多少论文,而是它会如何改变科学家选择问题、组织证据和判断原创性的方式。
文章还提出了科研“扩散性同质化” (diffuse monoculture) 的概念,研究主题表面上越来越多样,但底层的数据来源、模型流程、解释模板和科学想象力趋于相似。AI 能否带来真正的科学复兴,取决于科学共同体鼓励什么:是速度、数量和模板化产出,还是原创问题、异常证据和改变领域思考方式的研究。
关于这个话题,《知识分子》邀请张锡哲教授做了更完整的分享。
撰文|张锡哲
● ● ●
人工智能正在成为科学研究的基础设施。
这句话的含义,并不只是科学家多了一个写代码、查文献、润色论文的工具。更深层的变化在于,科学研究的若干关键环节正在被重新组织:文献检索、假说生成、实验设计、数据分析、模型比较、论文写作、同行评议,正在被接入同一套自动化或半自动化流程。AI不只是提高了科研活动的速度,也改变了科学家进入问题、理解证据和组织工作的方式。
在科学史上,工具从来不只是工具。望远镜改变了天文学的问题边界,显微镜改变了生命科学的观察尺度,统计方法改变了医学和社会科学的证据标准,计算模拟改变了物理、气候、生物和工程研究的推理方式。每一种重要工具都会重新划定科学能够看见什么、忽略什么、奖励什么。AI 的特殊之处在于,它不仅影响某一个学科的观察仪器或分析方法,而且正在嵌入几乎所有知识生产环节。
因此,关于 AI 与科学的核心问题不应停留在“能否提高效率”。它当然会提高效率。更值得追问的是:当科研活动越来越容易被自动化,科学共同体会提出更多真正不同的问题,还是会以更快速度生产更多相似的论文?
01
科研生产的门槛正在下降
AI 对科学最直接的影响,是降低复杂研究的进入门槛。过去,一个研究者如果要进入陌生领域,往往需要长期训练、跨学科合作和大量沟通成本。理解文献需要时间,掌握术语需要时间,把一个学科中的问题翻译成另一个学科中的模型也需要时间。许多真正重要的问题之所以长期进展缓慢,并不只是因为缺少数据或算法,而是因为它们位于多个知识系统的交界处。
现在,这种局面正在变化。基于检索增强的科学文献系统已经能够在大规模论文库中寻找相关证据,并生成带有引用依据的综合回答 [1]。自动化科研系统也开始把假说生成、代码执行、实验设计、数据分析和论文写作连接成连续流程 [2]。在化学、材料、生命科学、机器学习等领域,AI已经不仅用于辅助分析,也开始参与实验规划和研究流程设计 [3]。
这带来一种真实的民主化潜力。较小的团队可以更快进入复杂领域;年轻研究者可以更容易接触远离本专业的文献;学科边界不再像过去那样构成高墙。一个研究者可以借助 AI 同时阅读医学、物理、统计、社会科学和工程文献,从不同知识传统中寻找可迁移的方法。对于长期依赖大团队和高门槛基础设施的复杂科学而言,这种变化具有解放性。
但问题随之而来。降低进入门槛并不等于扩大科学想象力。一个系统可以帮助更多人进入科学,也可以让更多人以同样的路径进入科学。它可以扩展问题空间,也可以把可发表路径变成默认路径。
02
更多产出并不必然意味着更多发现
一项发表于Nature的研究分析了 4130 万篇自然科学论文,用预训练语言模型识别 AI 增强研究。研究发现,从事 AI 增强研究的科学家发表论文数量约为其他科学家的 3.02 倍,获得引用数约为 4.84 倍。与此同时,AI 采用也与集体研究主题范围收缩 4.63%、科学家之间互动下降 22% 相关 [4]。
这组结果的重要性,不在于它给出了一个简单结论,而在于它揭示了生产率与多样性之间可能出现的张力。AI 可以显著提高个体科学家的产出和影响力,却不一定扩大科学共同体探索的问题范围。换言之,科学看上去可能更加活跃,论文更多,引用更高,技术更复杂,但其背后的问题类型、文献来源和推理方式反而可能收缩。
这并不难理解。AI 系统通常建立在已有文本、已有数据、已有基准和已有评价标准之上。它擅长从过去的知识中提取模式,组织出连贯叙事,并生成符合既有规范的输出。对于日常科研而言,这种能力非常有用;但对于突破性科学而言,它也可能形成隐性约束。因为真正有价值的问题,常常不是过去文献中最容易被总结出来的问题,而是已有文献没有很好表达、已有框架没有充分容纳的问题。
AI的危险不只是产生错误答案,而是让一个问题过早显得成熟。它可以给出充分的文献综述、合理的方法选择、完整的代码框架、流畅的结果解释和谨慎的论文语言。这些特征会让一个研究看起来很完整,但完整不等于深刻。一个尚未被充分理解的现象,可能被迅速包装成一个可发表项目;一个本应暴露理论裂缝的异常,可能被纳入既有框架并被语言抚平 [5]。
03
科学可能进入一种“扩散性同质化”
AI 时代的同质化,不一定表现为所有人研究同一个题目。相反,它可能表现为题目越来越分散,而研究方式越来越相似。
一个团队可以研究癌症预后,另一个团队研究电池材料,第三个团队研究城市交通,第四个团队研究教育公平。表面上看,这些领域差异极大,甚至可以被称为跨学科研究。但如果它们都采用类似流程——寻找公开数据集,调用通用模型,比较若干指标,报告显著关联,生成一个看似合理的机制解释,再写出结构完整的论文——那么真正趋同的并不是题目,而是科学想象力。
我将这种现象称为“扩散性同质化”。它不是某一个理论或某一个学派垄断科学,而是许多看似独立的研究群体在相似模型、相似语料、相似基准、相似界面和相似评价压力下,逐渐接受同一种关于“好问题”“好方法”“好结果”“好论文”的隐性模板。科学产出看似繁荣,底层的提问方式却在收敛。

Nature杂志World View栏目刊发的文章
这种风险尤其难以识别,因为它并不总是低质量的。许多研究可能技术上合格,统计上严谨,语言上审慎,也能通过同行评议。问题在于,它们未必改变一个领域的理解方式。它们可能只是把已有范式推进了一小步,把已有数据重新分析了一遍,或者把已有解释包装得更加精致 [6]。
科学当然需要常规研究。没有持续积累,就没有可靠知识。但如果 AI 使常规研究的生产效率大幅提高,而评价体系仍然主要奖励产出数量、引用、规模、复杂流程和表面创新,那么科学共同体会自然地滑向一种高效率的保守性。它会生产越来越多“像论文的论文”,却未必产生更多改变问题结构的知识。
04
真正的问题不是论文工厂,
而是高质量研究的收敛
关于 AI 与学术出版的讨论,常常集中在论文工厂、虚假图片、伪造数据和批量生成论文。这些问题确实严重,也需要技术检测、出版规范和学术治理共同应对。Nature等期刊已经多次报道 AI 如何加剧论文工厂问题,使虚假研究更容易被包装成看似可信的成果 [7]。
但如果只把 AI 的风险理解为低质量研究的扩散,就低估了问题的深度。更重要的变化会发生在高质量科学内部。优秀研究者也会使用同样的 AI 系统检索文献、生成代码、比较模型、撰写综述、回应审稿意见。高水平团队也会面对同样的发表压力、基金周期和评价指标。随着 AI 逐渐嵌入科研基础设施,研究者并不需要降低标准,科学也可能发生收敛。
这种收敛不是因为科学家变得不严谨,而是因为许多“严谨”的外观变得更容易自动化。大规模数据、复杂模型、长流程分析、整洁图表、流畅表达,本来可以作为研究能力的信号;当这些信号被工具显著降低成本之后,它们作为科学价值代理指标的可靠性就会下降。
评价体系若不能同步改变,就会奖励最容易被AI放大的部分。AI 擅长整理、补全、优化和包装;科学突破则往往需要怀疑、偏离、停顿和重新定义问题。前者更容易被量化,后者更难进入评价表格。结果可能是,科学越来越擅长回答已经被定义好的问题,却越来越少追问这些问题是否仍然值得被这样定义。
05
AI 应当被用于扩大问题空间,
而不是压缩问题空间
AI 对科学的积极意义,不在于把论文写得更快,而在于帮助科学家更早跨越知识边界,更系统地暴露竞争性解释,更有效地寻找被忽略的证据。换言之,AI最有价值的用法,不应只是“把已有流程自动化”,而应是“让问题变得更开放”。
一个好的 AI 辅助科研流程,不应只问:“如何把这个结果写成论文?”它还应追问:“这个结果可能在哪些条件下失效?”“是否存在同样可以解释数据的其他机制?”“哪些文献群体讨论了相似问题却彼此很少引用?”“这个研究缺少哪些负对照?”“哪些变量被方便的数据结构排除了?”“如果结论是错的,最可能错在哪里?”“什么样的证据能够区分几个竞争性解释?”
这些问题把 AI 从生产工具转变为探索工具。生产工具的目标是让已有路径更快;探索工具的目标是让未被看见的路径显现出来。科学复兴的可能性不在于 AI 使论文数量增加,而在于它能否帮助更多研究者进入过去难以进入的问题空间:跨越学科语言的断裂,连接相互隔离的文献传统,识别被主流框架视为噪音的异常,并设计能够真正区分解释的关键证据。
在这个意义上,AI 更像一种认知放大器。它可以放大好问题,也可以放大坏问题;可以放大原创性,也可以放大从众性;可以帮助科学家反思既有框架,也可以帮助既有框架自动复制自身。关键不在模型本身,而在科学共同体如何使用模型。
06
评价体系需要重新定义“科学价值”
如果 AI 让科研生产变得更快,那么科学评价就必须变得更精细。期刊、基金、大学和评审委员会不能继续过度依赖规模和复杂性来判断研究价值。大数据、复杂模型、长参考文献、跨学科包装和流畅写作,越来越可能只是工具能力与资源投入的体现,而不一定代表科学洞察[8]。
更重要的问题应当是:这项研究是否提出了一个新的可检验问题?是否识别了被忽视的机制?是否提出了能够区分竞争性解释的关键证据?是否改变了一个领域理解问题的方式?是否让某种被忽视的异常变成可以被检验的科学主张?是否使不同学科之间形成真正的概念转译,而不只是方法套用?
这也要求科学评价承认“慢”的价值。原创性研究往往需要在不确定性中停留更久,需要经历更多失败,需要容纳负结果,需要解释异常,而不是立刻把它转化为可发表结论。当AI使快速完成一个标准化项目变得越来越容易时,科学制度更应当保护那些暂时不那么完整、但可能改变问题框架的工作。
对于中国科研生态,这一点尤其重要。近年来,科研评价改革不断强调破除“唯论文”“唯帽子”“唯影响因子”,但在实际运行中,论文数量、期刊等级、项目产出和短周期绩效仍然有强大惯性。AI 一旦进入这种评价结构,最容易被首先吸收为生产力工具:更快写申请书,更快整理文献,更快生成论文初稿,更快回应审稿意见,更快形成可展示成果。
如果评价体系奖励速度,AI 就会放大速度;如果评价体系奖励包装,AI 就会优化包装;如果评价体系奖励真正的问题意识和原创性,AI 才可能成为科学探索的放大器。模型不会自动修正制度偏差。相反,它会把制度偏差变得更高效、更隐蔽、更像专业能力。
07
科学家的价值将向上移动
AI 不会取消科学家的价值,但会改变科学家的稀缺性所在。
在过去,科研能力很大程度上体现为掌握技术流程:会读文献、会写代码、会做实验、会分析数据、会写论文。未来,这些能力仍然重要,但其中相当一部分会被 AI 辅助、加速甚至部分自动化。人的价值将更多体现在更高层次的判断上:选择重要问题,识别证据边界,判断一个模式是否有意义,发现默认输出中的偏见,连接相距遥远的知识传统,抵抗看似合理但缺乏洞察的解释,并决定一个异常是否值得继续追究。
科学家的核心能力,将不只是生产答案,而是维护问题的开放性。AI 可以生成答案,但科学家必须判断哪些答案值得相信,哪些答案只是语言上的连贯;AI 可以提出假说,但科学家必须判断哪些假说有可检验性,哪些只是已有知识的重组;AI 可以给出综述,但科学家必须识别哪些文献被忽略,哪些争论被过早综合,哪些不确定性被流畅叙事掩盖。
这是一种更高层次的科学主体性。它要求研究者不仅会使用 AI,也要理解 AI 如何塑造注意力、证据和评价。未来优秀的科学家,未必是最会让AI写论文的人,而是最会让AI暴露问题的人。
08
科学的未来不在模型里,
而在制度选择里
AI 是否会带来科学复兴,并不是一个由技术性能单独决定的问题。更强的模型可以生成更多文本、处理更多数据、连接更多知识,但科学复兴需要的不只是信息处理能力。它需要科学共同体扩大问题空间,保护原创性,容纳异常,奖励关键证据,并抵抗把一切研究都转化为标准化产品的冲动。
如果 AI 被主要用于提高论文生产速度,科学可能进入一种更高效的同质化:更多论文,更快发表,更复杂方法,更流畅叙事,但真正新的问题变少。如果 AI 被用于连接分散知识、检验竞争性解释、识别被忽视的异常和支持高风险探索,它也可能让更多研究者进入过去难以进入的知识边界,推动科学提出更大、更难、更有变革性的问题。
AI 正在改变科学,但它不会自动决定科学的方向。方向来自科学共同体的日常选择:研究者向 AI 提出什么问题,审稿人把什么称为创新,基金机构资助什么风险,大学奖励什么成果,期刊如何区分“看起来复杂”和“真正重要”。
当论文变得越来越容易,科学必须重新捍卫不容易的东西:好的问题,深的证据,真正的分歧,以及改变一个领域思考方式的能力。
参考文献:
[1] Asai, A. et al. Synthesizing scientific literature with retrieval-augmented language models. Nature 650, 857–863 (2026).
[2] Lu, C. et al. Towards end-to-end automation of AI research. Nature 651, 914–919 (2026).
[3] Boiko, D. A., MacKnight, R., Kline, B. & Gomes, G. Autonomous chemical research with large language models. Nature 624, 570–578 (2023).
[4] Hao, Q. et al. Artificial intelligence tools expand scientists’ impact but contract science’s focus. Nature 649, 1237–1243 (2026).
[5] Messeri, L. & Crockett, M. J. Artificial intelligence and illusions of understanding in scientific research. Nature 627, 49–58 (2024).
[6] Kuhn, T. S. The Structure of Scientific Revolutions. University of Chicago Press, 1962.
[7] Liverpool, L. AI intensifies fight against ‘paper mills’ that churn out fake research. Nature 618, 222–223 (2023).
[8] Hicks, D., Wouters, P., Waltman, L., de Rijcke, S. & Rafols, I. Bibliometrics: The Leiden Manifesto for research metrics. Nature 520, 429–431 (2015).
0
推荐


京公网安备 11010502034662号 