财新传媒 财新传媒

阅读:0
听报道

撰文|刘少山

 ●                  ●                   ● 

过去一年里,我被问得最多的问题之一是:未来的机器人是否一定会走向人形?这一问题在科技界引发了大量讨论,其背后其实对应着两种截然不同的技术哲学,“创世论”与“进化论”。所谓“创世论”,是指只要把某一种机器人形态做到足够强大、足够全面,它最终就能解决所有类型的问题。在这种理念中,人形机器人被视为最接近“通用形态”的存在,因此许多公司试图通过不断增强一款人形机器人,让它承担从搬运、清洁到陪伴、护理的各种任务,仿佛在“创造”一个万能的技术生命体。 

与之相对的“进化论”则认为,机器人应像自然界的生命一样,根据场景需求不断分化和演化为不同形态,没有任何一种形态是预设的终极答案,而是依靠大规模应用带来的数据、成本、效率和场景适配度来决定成败。从扫地机器人到仓储机械臂,从室内移动底盘到外骨骼,每一种形态都在市场竞争和现实约束中经历“物竞天择”:适应场景和经济性的形态得以规模化,不具备场景价值或成本优势的形态则自然会被淘汰。在具身智能逐步走向大规模应用的过程中,我个人更相信“进化论”的道路,它更符合商业规律、技术演化的真实路径,也更符合这个复杂世界的真实结构。

01

观点一:让一个机器人适应所有场景是线性进化,而多种形态并行演化才是指数级效率 

如果从工程和商业的角度冷静审视,试图让单一机器人形态适应所有场景,几乎注定是一条线性且低效的演进路径。假设我们希望一台人形机器人同时胜任清洁、烹饪、护理、递物、整理等完全不同的任务,那么每新增一个场景,都意味着要额外构建一整套动作库、采集对应的数据、开发新的感知与决策模型,并通过大量安全与可靠性验证。这类能力扩展本质上是“串行累积”:每跨入一个新领域,都需要投入巨量工程资源,而且不同场景之间的技能迁移度有限,很难通过某一次突破带来整体能力的指数级跃迁。现实中,人形机器人在高自由度控制、精细力控和复杂视觉理解等方面仍存在大量技术难题,而在许多具体任务场景里,人形的结构优势并不明显,甚至不如专用机器人高效。这使得“让一台人形机器人包打天下”在实践中往往陷入缓慢的线性演进:可以做的事越来越多,但每迈出一步都成本高昂、周期漫长。

反观现实世界,许多机器人形态已经在各自垂直场景中实现了大规模应用,并沿着自己的赛道高速进化。以扫地机器人为例,经过十多年的发展,全球清洁机器人市场已经形成“数亿台级别”的保有量,仅头部厂商就累计出货数千万台。在这样的大规模基础上,导航、路径规划、避障、地面建模、缠绕处理等能力得到了持续优化,背后依托的是每天在真实家庭环境中产生的海量运行数据,而不是在实验室中“设计出完美通用形态”。外卖配送和园区/校园配送机器人在中国等地已较为常见,它们在复杂道路结构和高频任务调度中,快速积累了导航策略、传感器融合和异常场景处理的丰富经验。仓储物流中的机械臂与 AGV 系统,每天在电商和制造企业的仓库里执行上亿次抓取与搬运操作,形成了极其庞大的动作样本和失败样本,使得抓取策略、路径规划和系统鲁棒性在几年内实现了跨越式迭代。 

从这个角度看,多种机器人形态在各自高频场景中并行演化,形成的是一种“生态式”的指数级能力增长。每一种形态都在自己最擅长、最高频的场景里快速迭代,通过真实世界持续反馈推动算法和系统不断优化,而并不需要等到某个“终极形态”完善之后再统一赋能。这种结构性的差异意味着,多形态并行演化比单形态通吃式通用化,更符合技术发展规律和商业规模化逻辑。即便未来不同形态之间会逐渐沉淀出一组“共性能力”,甚至在某些场景中自然收敛为类似人形的结构,那也应被视为规模化进化后的结果,而不是一开始就被写死在技术蓝图上的答案。具身智能真正的效率和活力,来自一个多物种、多路径的生态,而不是来自某个单一形态的极限强化。

02

观点二:具备基础出货量的机器人形态,更有演化潜力与成本优势

如果多形态并行演化是更高效的道路,那么一个自然的问题是:哪些形态更有资格在这条路上跑得更快?答案往往是那些已经在市场上拥有大规模装机量和稳定需求的机器人形态。扫地机器人、各类服务机器人和移动底盘之所以发展迅速,并不是因为它们在结构上多么“接近人形”,而是因为它们已经拥有数百万乃至数千万级别的年度出货规模,在这一基础上形成了坚实的供应链体系和成本结构。核心元件如电机、轮组、减速器、激光雷达、摄像头、IMU、电池和主控芯片等,在大批量采购和持续优化的过程中不断降本增效。同时,这些设备长期运行在真实家庭、餐厅、酒店、园区和仓库环境中,产生了远超实验室的感知数据、故障样本和边缘场景案例,使得算法、结构设计与系统稳定性都在“用中学、学中迭代”。 

当一种形态已经具备如此庞大的存量和增量基础时,在其上做轻量级功能扩展,就能以非常高的性价比快速拓展应用边界。例如,在成熟的扫地机器人平台上加装一个轻量机械臂,可以让其从单一清扫任务扩展到拾取地面小物件、放回指定区域、做简单的分类和归位,甚至与家庭成员产生低风险的互动。这类“从地面到手部”的升级,由于底盘、导航、供电和控制等基础设施已经高度成熟,其边际成本远小于从零打造一套全新形态。类似的思路同样适用于配送机器人、餐饮机器人、巡检机器人等,通过在现有平台上添加适当的执行机构、传感器或软件功能,就能显著提升任务价值密度,进入更多高价值场景 

在这种模式下,销量越大,算法迭代越充分、故障场景覆盖越全面、供应链成本越低,进而又提升了产品的性价比和可用性,吸引更多用户和应用场景加入,形成正向反馈。这才是真正意义上的商业闭环:技术能力和市场规模互相促进,而不是靠单次融资或概念驱动“硬拽”出来的应用。从进化的角度看,具身智能的演化并不是从零开始设计某种“理想躯体”,而是在已有的高频形态中不断叠加能力,逐步向更多场景和更复杂生态扩散。就像智能手机的形态是在几十亿用户的长期使用中演化出来,而不是在第一天就被完美设计好一样,那些已经在市场中证明自己、具备稳定需求和规模基础的机器人形态,更有可能成为具身智能演化的主干;而那些缺乏规模基础、难以形成成本优势或缺乏真实场景支撑的形态,则很可能在商业竞争中逐渐被淘汰。

03

观点三:如果用人形机器人做所有事情,成本结构会成为最大阻力

在讨论人形机器人时,最大的现实掣肘往往不是“能不能做”,而是“值不值得做”,也就是成本结构是否与任务价值匹配。当前一代人形机器人普遍采用高度复杂的机械和控制系统:几十个自由度的关节驱动器、价格不菲的精密减速器和高性能电机、多模态传感器(包括多摄像头、激光雷达、力矩传感器、IMU 等)、大容量电池组以及高算力的计算平台。这类系统即便在未来实现量产,单机成本短期内仍大概率处于数万美元甚至更高的区间。与之对比,清洁机器人、餐饮服务机器人、AGV、协作机械臂等成熟形态,其单机价格已经压缩到消费者可以接受、企业可以规模采购的水平。 

问题在于,当一台造价极高、结构极其复杂的人形机器人被用来执行“擦桌子、端水、叠衣服”这类中低复杂度任务时,其大部分硬件能力、冗余自由度和传感配置在日常工作中很可能并未被真正用到,从而形成典型的“用火箭送快递”的成本错配。这并不是否认技术上的可行性,而是质疑这种形态在当下大部分场景中的经济意义。相比之下,那些已经大规模应用的专用或半通用机器人形态,在成本与能力之间往往达成了相对合理的平衡:扫地机器人以百美元级的价格完成了绝大多数家庭难以坚持的日常清洁工作;商用服务机器人在几万元人民币的价格带上,支撑了餐厅、酒店和医院等高频场景中的稳定运行;仓储里的 AGV 和机械臂则通过针对性结构设计,实现了在固定场景中的高效作业,很少为了“可能有一天会需要”而预留大量闲置的自由度和传感器。 

从商业逻辑上看,如果一种机器人形态的总拥有成本明显高于它所解决问题的经济价值,那么无论技术多么炫目,都难以实现真正的大规模部署。人形机器人如果被设想为“做所有事的唯一入口”,在绝大多数中低复杂度任务场景中,都会面临严重的性价比压力。而那些柔性机器人、模块化移动平台、低自由度轻量机械臂之所以成长迅速,正是因为它们围绕特定任务做了结构约束和成本约束,在安全性、可靠性与成本之间达成了工程上的平衡。换句话说,成本结构本身就是具身智能生态中的一种“自然选择机制”:那些在给定场景下用更低成本提供足够价值的形态,更容易被市场选中并获得规模化生存空间;而那些过度设计、难以匹配主流需求价格带的形态,即便短期因概念极具话题性,也往往难以跨过长期商业化的门槛。最终,哪些机器人形态会真正“活下来”,不是由某个技术路线拍板决定的,而是由成本、需求与规模效应共同完成的长期筛选。

04

观点四:规模化演化后,最终会出现“共性功能”,其中一部分可能会自然汇聚成类似人形的形态 

当成本结构完成第一轮“自然筛选”之后,幸存下来的多种机器人形态,并不会彼此完全割裂,而是在长期规模部署中逐渐显露出一组被反复重用的“共性功能”。无论是清洁机器人、仓储机械臂、配送机器人,还是未来的护理机器人,它们在抓取、移动、视觉感知、姿态控制、环境建模等核心能力上,都会随着数据和算法的沉淀而不断趋同。现实中,物流仓库里的机械臂和家庭中的扫地机器人虽然外形和工作条件完全不同,但在路径规划、障碍避让、状态估计这些底层算法上具有高度相似性;自动驾驶车辆与室内移动机器人在 SLAM、目标检测和轨迹优化方面也共享了大量技术组件。随着更多机器人进入真实环境,这种“技术内核重叠”的现象只会愈发明显,只是被封装在不同的外形、任务接口与软件栈之中。

在这一过程中,人形结构有可能在某些特定场景中成为这些共性功能的“汇聚载体”,原因并不是人形在抽象意义上更高级,而是因为人类的物理世界在很大程度上是按人形设计的:楼梯高度、门把位置、工具形状、操作台和橱柜的尺寸,都围绕着一个双足、双臂、眼睛高度在一米五到一米八之间的生物来布局。在需要大规模使用现有工具、频繁开门上下楼梯、搬箱子、穿行于狭窄通道和人类工作空间的场景中,具备与人类相近的身体比例、手部形态和视角高度,确实在适配性上具有明显优势。许多面向工业共融和服务协作的人形机器人项目,都强调无需改造现有工厂和楼宇环境、可以直接使用人类工具、在“为人类设计的空间”中与人并肩工作,这从侧面印证了人形在“复用既有物理基础设施”方面的天然长处。 

即便如此,这种向人形方向的潜在收敛,依然更像是一种“演化的结果”,而不是一开始就写死在技术路线图上的必然终点。从当前现实出发,在工业场景中真正规模落地的是固定基座机械臂和各类轮式移动平台,而不是双足人形;在家庭场景中真正进入千家万户的,是扫地机器人、擦窗机器人以及若干简单的服务机器人,而不是能够独立完成全部家务的全能人形。市场已经通过“用脚投票”的方式,选择了在成本、可靠性和场景适配度之间平衡得更好的形态。未来如果有一天,人形或半人形形态在某些领域自然成为主流,更大概率是因为抓取、导航、平衡控制、视觉理解、双手协作等底层共性能力已经在其他形态上充分成熟,最后在少数需要高度兼容人类工具与空间的高价值场景中,被“打包”进一个更接近人形的结构中。 

从这个意义上讲,与其一开始就把人形当作唯一目标,不如让不同形态在各自场景中充分竞争、充分演化,由市场和真实环境去筛选哪些共性能力是刚需,哪些身体结构真正能提供净收益。当这些共性能力不断沉淀、在不同形态间反复重用时,人形有可能在部分关键领域里,作为一种高通用性的“汇集形态”自然出现,但那是一种顺应进化、顺应成本和场景约束的结果,而不是先验的信仰。具身智能领域真正值得追问的问题,已经不再是“要不要人形”,而是“在哪些具体场景中,经过充分演化之后,人形恰好是性价比最高、适配度最好的那个答案”。而这一答案,不会写在某位工程师的白板上,而是会在成千上万台机器人与真实世界的长期互动之中,被缓慢而坚定地“选”出来。

05

结    语 

如个人认为,真正决定具身智能未来形态的,从来不是谁画出一个“终极人形”,而是无数机器人在真实世界里的长期博弈与优胜劣汰。与其执着于造一个万能的技术“神”,不如拥抱多形态并行演化的生态,让成本、场景和规模去筛选最合适的答案。也许有一天,人形会在某些关键领域自然成为收敛形态,但那是进化的结果。我们要做的,不是替未来下结论,而是把更多机器人尽快送进真实世界,让时间和市场完成最后的选择。 

刘少山,深圳人工智能与机器人研究院(AIRS)具身智能中心主任, 国际计算机学会(ACM)技术政策委员会成员。

话题:



0

推荐

知识分子

知识分子

4133篇文章 2分钟前更新

由饶毅、鲁白、谢宇三位学者创办的移动新媒体平台,现任主编为周忠和、毛淑德、夏志宏。知识分子致力于关注科学、人文、思想。我们将兼容并包,时刻为渴望知识、独立思考的人努力,共享人类知识、共析现代思想、共建智趣中国。

文章