具身智能落地产业化 AI超级入口催生“新BAT”格局

来源 | 《财经》新媒体   

2026年01月09日 21:49  

本文1946字,约3分钟

2026年,人工智能领域将迎来一场重大变革。1月8日,北京智源人工智能研究院发布《2026十大AI技术趋势》报告显示,行业重心正从语言模型转向能模拟和理解真实世界物理规律的“世界模型”。此外,曾经局限于实验室的“具身智能”技术也开始走向产业端,进入真实场景的筛选与落地阶段。在消费端,AI超级应用入口成为巨头角逐的新战场,蚂蚁、字节、阿里等企业纷纷加码布局,一个以AI为驱动力的“新BAT”生态格局正在加速形成。

智源研究院院长王仲远指出,这意味着AI的“思维方式”正在经历一场结构性升级,其核心任务从“预测文本中的下一个词”跃升为“推演现实世界的下一个状态”,从而推动人工智能从数字空间的信息感知,迈向对物理世界的深度理解与行动规划。编辑一下上述内容,使之更加连贯

这一变革背后,是AI“认知方式”的根本性升级。AI不再局限于识图识话,而是需要理解物体的运动规律与行为演化,从而为自动驾驶仿真、机器人学习等任务提供“预判力”。与此同时,AI的“形态”也随之转变,从代码进化为能走能动的机器人,从单打独斗的智能体发展为可协作的“AI团队”。通用人形机器人逐步进入真实工业场景,多智能体间的标准化通信协议也逐渐成型,使得AI能够以团队形式完成科研与工业中的复杂任务。

消费端,“All in One”的超级应用入口正在成为科技公司角逐的新战场。2025年以来,蚂蚁、阿里、字节等大厂布局AI应用的动作频频。蚂蚁集团推出的全模态AI助手“灵光”与AI健康应用“蚂蚁阿福”,分别切入超级应用与垂直健康赛道。

“灵光”聚焦于解决AI应用“重聊天、轻行动”的痛点,其“闪应用”功能允许用户通过自然语言快速生成可交互的轻应用,大幅降低开发门槛;“蚂蚁阿福”则定位为“AI健康伙伴”,目前其App月活用户已达3000万,单日提问量已超1000万。

蚂蚁集团百灵大语言模型负责人张志强指出,用户体验不仅取决于功能,更关乎响应速度。“若在手机上生成‘闪应用’需10至20分钟,用户很难接受。”因此,团队将“30秒内生成”设为硬性指标。为实现这一目标,蚂蚁从模型底层架构入手,通过提升模型稀疏度,在同等算力下优化效果并降低推理成本。

然而,在长上下文生成场景中,注意力机制的计算成为新瓶颈。为此,蚂蚁团队改造了原有分组查询注意力机制,设计出混合学习黑板架构,以提升长文本下的推理效率。张志强强调,推理效率仍是AI规模化应用的核心瓶颈,也是实现AI普惠的关键。

在模型布局上,蚂蚁百灵大模型体系已覆盖语言、思考与多模态三大方向。其语言模型采用高稀疏MoE架构,基于超二十万亿Token语料训练,并推出包括万亿参数模型Ling-1T与Ring-1T在内的产品矩阵。

值得注意的是,AI技术的快速发展在带来便利的同时也带来了挑战,深度学习模型复杂性的增加让AI的安全性和治理问题变得愈发重要。大模型的风险主要包括生成幻觉、隐私敏感数据泄露、价值观导向问题、专业度缺失、伦理问题等。此外,作为信息系统,大模型还面临传统安全问题,如漏洞导致的模型丢失、数据泄露、可用性问题等。长远来看,大模型的不可控性或对社会造成损害,存在被恶意应用和失控的风险。

报告显示,截至2025年12月初,全球AI安全风险事件已达330起,远超2024年全年总量。产业侧对安全防御能力的要求已近乎“一票否决”,系统化的安全评估与实时防御体系正成为AI应用的标配。

过去一年,国内外在AI模型治理方面做了大量工作。其中,蚂蚁集团已构建“对齐-扫描-防御”全流程防护体系,旗下安全解决方案“蚁天鉴”已升级为适应智能体时代的一体化系统。针对AI眼镜等新型终端,蚂蚁还推出了可信连接技术框架gPass,确保设备与智能体之间的通信安全。

在智源研究院理事长、北京大学教授黄铁军看来,当前人工智能正在从“功能模仿”转向“理解物理世界规律”,这一根本性的转变意味着AI正褪去早期狂热,发展路径日益清晰,即真正融入实体世界,解决系统性挑战。

(《财经》新媒体综编)