中国科技评价改革：如何演变？趋势如何？-知识分子的财新博客-财新网

编者按：

完全量化的学术评价无疑会造成僵化、诱发学术不端等恶果，以论文为中心的评价体系就是如此，但如果以此为依据，想当然地认为学术评价无需量化，对于中国如此庞大的科研人员群体和以人情关系构建的社会基础，仅仅沿用国外通行的同行评价机制就能高枕无忧，将会走向另一个极端。

李志民认为，中国的学术以及科技评价其实一直以差不多每十年一个周期变化着，并朝着更加公正合理的方向逐步演变。值得注意的是，每次改变都是基于中国国情的嬗变，而非硬性调整，是顺应了时代的自我迭代、更新。

撰文 | 李志民（中国科技评估与成果管理研究会副理事长兼学术委员会主任）

学术与科技评价既是科技管理的工具，是对科技活动进行规划、决策、管理、监督的手段，也是学术共同体对科技发展内在的、基本的学术认识活动，是对科研产出和影响的价值判断。

长期以来，我国科研评价体制和政策的制定始终没有脱离“计划经济”、“政府主导”的束缚，就“科研”评“科研”，评价指标单一，重数量轻质量，重论文轻应用等，比如 SCI 原本就是论文索引工具，硬生生搞成了评价指标和奖励的依据。

学术界对科技评价有很多意见，对评价结果互不服气。产生该现象的原因是：科研几乎所有环节都是市场机制，而评价仍然是计划体制；科研经费主要用于科技开发，只有不到10% 经费用于基础研究，而评价方法却用的是100% 基础研究评价指标；科技评价用短期视点，而科研成果的价值有时却需要长期评价才能得出正确的结论。

科技评价的困难还在于我们把科学和技术混在一起来评价。科学属于文化范畴，技术属于生产力范畴，两者混在一起就很难评价。文化活动产出的是精神食粮，生产活动产生的是物质财富。很难找到一种能兼顾生产力评价和文化评价的具体方法，文献计量评价方法显然不能评价技术创新活动。

当然，完全量化的学术评价无疑会造成僵化、诱发学术不端等恶果，以论文为中心的评价体系就是如此，但如果以此为依据，想当然地认为学术评价无需量化，对于中国如此庞大的科研人员群体和以人情关系构建的社会基础，仅仅沿用国外通行的同行评价机制就能高枕无忧，将会走向另一个极端，在中国的科技评价历程上并非没有过尝试。

这有点像高考制度，都知道但凡有高考这道坎，必然会导致应试教育，但是如果没有高考，整个国家的人才选拔机制马上就会陷入毫无悬念的混乱之中。

公正地说，我国的学术以及科技评价其实一直以差不多每十年一个周期变化着，并朝着更加公正合理的方向逐步演变。值得注意的是，每次改变都是基于中国国情的嬗变，而非硬性调整，是顺应了时代的自我迭代、更新。

改革开放之前的几十年，谁的科研水平高，科研经费给谁，并没有什么量化标准，也没有同行参与评价，完全是由行政部门官员说了算，更多的是主观臆测之下的长官意志。

改革开放后的八十年代开始有了同行评审，但当时直接参与科研工作的人员数量有限，学术圈子非常小，最后成了专家朋友相互评，你好我好他也好，学术评价成了走过场，走形式。

到了九十年代，基于论文是国际通行学术货币这一基本认识，学术界开始重视SCI 论文的写作和发表，当时科研人员发表的论文数量都不多，学术和科技评价成了比论文数量多少，好像谁SCI论文多，谁的水平就高。

2000年之后，当新一代接受比较严格学术训练的大学生成长起来之后，论文数量已经不是问题，海量论文开始迅速积累起来，此时再以论文数量比高低意义就不大了，于是开始比较论文发表期刊的影响因子，中国人还发明了影响因子总和的评价方法，醉心于 SCI 指标。

2010年前后出现了 ESI 的评价标准，高被引论文、高被引作者成了新时代的高水平代表，用学科的前百分之一、千分之一和万分之一反映科研机构在国际上的学术影响力。

ESI 主要有四个一级指标，分别是科研的生产力、影响力、创新力和发展力，每个一级指标下还有二级指标。ESI 只是论文维度下的权重分析。另外，由于 ESI 不收录会议论文集，造成计算机学科的准确性受到怀疑。可以看出，ESI 并不完美，但虽丑不堪言，总比之前的数论文、SCI 指标等要好一些。

梳理中国这数十年的学术、科技评价体系演变，我们会发现经济学中的“稀缺”规律一直在起着作用，中国的学术共同体一直在寻找一种如同上古时代的贝壳或者当代的贵金属为本位的，难以替代又尽量简单明了的学术标的和模型。

可悲的是，一般而言，简单意味着容易复制，继而过剩和泛滥后取代“稀缺”。因此，评价指标的发展是越来越复杂，可另一方面由于（论文）呈现方式在各学科、各领域中的不均衡，必然会造成学科之间指标的失衡和畸形，从而陷入了一简单就乱套，一复杂就畸形的评价怪圈。

从某种意义上讲，并不存在绝对正确的评价指标，只有不断进化发展，与时俱进的评价模式，无论规则定得如何公正，都难免受专家知识面的限制，主观判断的偏颇，人情世故的影响；科技评价应该上一个新台阶：靠客观数据积累，在合理分类评价的基础上，逐步实行公开评价，让学界和产业界广泛参与。

ESI 是2010年前后出现的评价指标，如今又过了接近十年了，有望出现更公正合理的评价指标。

曙光早在去年就出现了。习近平总书记在2018年5月的两院院士大会上指出，改革科技评价制度，正确评价科技创新成果的科学价值、技术价值、经济价值、社会价值、文化价值，把人的创造性活动从不合理的经费管理、人才评价等体制中解放出来…… 要通过改革，改变片面将论文、专利、资金数量作为人才评价标准的做法，不能让繁文缛节把科学家的手脚捆死了，不能让无穷的报表和审批把科学家的精力耽误了。

可以看出中央打造学术、科技风清正气良好氛围的决心，也可以看做是吹响了对于盘踞在学术界、科技界多年陈规陋习的宣战号角。

2018年10月，科技部、教育部、人力资源和社会保障部、中科院、中国工程院等五部门发出通知，联手开展清理饱受诟病但又难以革除的“唯论文、唯职称、唯学历、唯奖项”（简称“四唯”）的专项行动；11月，教育部办公厅印发《关于开展清理“唯论文、唯帽子、唯职称、唯学历、唯奖项”专项行动的通知》，决定在各有关高校开展“唯论文、唯帽子、唯职称、唯学历、唯奖项”（简称“五唯”）清理行动。

破除四唯（五唯）的行动对于中国的学术、科技评价体系无疑是一个破而后立，建立中国特色新型评价体系的重要契机。事实上，学科评价、学术评价完全不能仅凭单个论文度进行简单评价，而是需要科学的多维评价，在这方面，已经进行了四轮的学科评估可以给我们提供某种借鉴。

学科评估是教育部学位与研究生教育发展中心（简称学位中心）按照国务院学位委员会和教育部颁布的《学位授予与人才培养学科目录》（简称学科目录），对除军事学门类外的全国具有博士或硕士学位授予权的一级学科开展整体水平评估。从2002年开展首次学科评估，平均四年开展一次。

它采用“客观评价与主观评价相结合”的指标体系。一是客观指标，经数据全面核查和修订后，按照“线性规划法”计算得到各末级指标得分。对于专任教师数、授予学位数等规模指标设置上限，达到上限值则得分相同；对于省级奖励，将不同省市的设奖总数与研究生培养规模进行标准化处理。

二是主观指标，分别邀请同行专家与行业专家、在校学生、用人单位对不同指标分别进行评价，得到各末级指标得分。然后再根据指标权重加权得出二级指标、一级指标和整体水平得分。

虽然还不能预测下一步新的学术、科技评价体系具体是什么模样，但可以预测在新的评价体系中，互联网必将发挥更为基础性的作用，利用互联网发展出新的学术评价机制将是大势所趋（比如评估在线关注度的 Altmetrics），靠客观的大数据积累，在合理分类评价的基础上，逐步实行公开评价，让学界和产业界广泛参与。

学术、科技评价的领域和学科会更加细分，要针对不同的科研活动和评价对象，制定有针对性的评价标准，避免过分强调短期量化考核指标的简单做法。要加强引导性评价，发挥评价的激励作用。要建立合作成果的公正评价机制，促进科学家之间研究工作的交流协作。要防止与评价结果相关的激励措施诱导科研人员和科研机构急功近利的行为。

基础研究以同行评价为主，重点评价科研诚信与学风、创新质量和学术贡献，非保密项目要大力加强国际同行评价。

应用研究和产业化开发应建立主要由市场决定技术创新项目和经费分配、成果评价的机制，强调科研成果转化应用、技术转移推广、科学普及等科技产出在评价中的作用，由用户、市场和专家等相关第三方参与评价。

充分利用信息化手段，提高科技评价工作效率和开放程度。要充分利用互联网等公开数据，引入公开数据占一定比例的权重评价方法。开放学术界公开参与评价办法，实行网络投票等占比例评价等。

学术、科技评价体系事关改革创新大局，国家兴衰，虽前路漫漫，任重而道远，但只要我们立足中国国情，尊重科技和人才发展规律，勇于破旧立新，自我变革，必然能够趟出一条中国特色评价体系的康庄大道。

▼▼▼点击“阅读原文”，与知识分子一起悦读2019。

话题：