具身智能落地产业化 AI超级入口催生“新BAT”格局

2026年，人工智能领域将迎来一场重大变革。1月8日，北京智源人工智能研究院发布《2026十大AI技术趋势》报告显示，行业重心正从语言模型转向能模拟和理解真实世界物理规律的“世界模型”。此外，曾经局限于实验室的“具身智能”技术也开始走向产业端，进入真实场景的筛选与落地阶段。在消费端，AI超级应用入口成为巨头角逐的新战场，蚂蚁、字节、阿里等企业纷纷加码布局，一个以AI为驱动力的“新BAT”生态格局正在加速形成。

智源研究院院长王仲远指出，这意味着AI的“思维方式”正在经历一场结构性升级，其核心任务从“预测文本中的下一个词”跃升为“推演现实世界的下一个状态”，从而推动人工智能从数字空间的信息感知，迈向对物理世界的深度理解与行动规划。编辑一下上述内容，使之更加连贯

这一变革背后，是AI“认知方式”的根本性升级。AI不再局限于识图识话，而是需要理解物体的运动规律与行为演化，从而为自动驾驶仿真、机器人学习等任务提供“预判力”。与此同时，AI的“形态”也随之转变，从代码进化为能走能动的机器人，从单打独斗的智能体发展为可协作的“AI团队”。通用人形机器人逐步进入真实工业场景，多智能体间的标准化通信协议也逐渐成型，使得AI能够以团队形式完成科研与工业中的复杂任务。

消费端，“All in One”的超级应用入口正在成为科技公司角逐的新战场。2025年以来，蚂蚁、阿里、字节等大厂布局AI应用的动作频频。蚂蚁集团推出的全模态AI助手“灵光”与AI健康应用“蚂蚁阿福”，分别切入超级应用与垂直健康赛道。

“灵光”聚焦于解决AI应用“重聊天、轻行动”的痛点，其“闪应用”功能允许用户通过自然语言快速生成可交互的轻应用，大幅降低开发门槛；“蚂蚁阿福”则定位为“AI健康伙伴”，目前其App月活用户已达3000万，单日提问量已超1000万。

蚂蚁集团百灵大语言模型负责人张志强指出，用户体验不仅取决于功能，更关乎响应速度。“若在手机上生成‘闪应用’需10至20分钟，用户很难接受。”因此，团队将“30秒内生成”设为硬性指标。为实现这一目标，蚂蚁从模型底层架构入手，通过提升模型稀疏度，在同等算力下优化效果并降低推理成本。

然而，在长上下文生成场景中，注意力机制的计算成为新瓶颈。为此，蚂蚁团队改造了原有分组查询注意力机制，设计出混合学习黑板架构，以提升长文本下的推理效率。张志强强调，推理效率仍是AI规模化应用的核心瓶颈，也是实现AI普惠的关键。

在模型布局上，蚂蚁百灵大模型体系已覆盖语言、思考与多模态三大方向。其语言模型采用高稀疏MoE架构，基于超二十万亿Token语料训练，并推出包括万亿参数模型Ling-1T与Ring-1T在内的产品矩阵。

值得注意的是，AI技术的快速发展在带来便利的同时也带来了挑战，深度学习模型复杂性的增加让AI的安全性和治理问题变得愈发重要。大模型的风险主要包括生成幻觉、隐私敏感数据泄露、价值观导向问题、专业度缺失、伦理问题等。此外，作为信息系统，大模型还面临传统安全问题，如漏洞导致的模型丢失、数据泄露、可用性问题等。长远来看，大模型的不可控性或对社会造成损害，存在被恶意应用和失控的风险。

报告显示，截至2025年12月初，全球AI安全风险事件已达330起，远超2024年全年总量。产业侧对安全防御能力的要求已近乎“一票否决”，系统化的安全评估与实时防御体系正成为AI应用的标配。

过去一年，国内外在AI模型治理方面做了大量工作。其中，蚂蚁集团已构建“对齐-扫描-防御”全流程防护体系，旗下安全解决方案“蚁天鉴”已升级为适应智能体时代的一体化系统。针对AI眼镜等新型终端，蚂蚁还推出了可信连接技术框架gPass，确保设备与智能体之间的通信安全。

在智源研究院理事长、北京大学教授黄铁军看来，当前人工智能正在从“功能模仿”转向“理解物理世界规律”，这一根本性的转变意味着AI正褪去早期狂热，发展路径日益清晰，即真正融入实体世界，解决系统性挑战。

（《财经》新媒体综编）

216.73.216.13

具身智能落地产业化 AI超级入口催生“新BAT”格局

来源 | 《财经》新媒体

2026年01月09日 21:49

本文1946字，约3分钟