关于Token出海,三个事实和三个误解

来源 | 《财经》杂志 文|《财经》研究员 吴俊宇 编辑 | 谢丽容  

2026年03月31日 16:08  

本文6075字,约9分钟

几家公司在全球模型市场的影响力确实有很大提升。Token调用量的暴增也确实为商业模式验证带来了新变量,但将单一平台的Token消耗量增长直接等同于商业化进展,或直接等同于全球市场地位,稍显简单粗暴

一批中国的基础模型,正在全球开发者中变得更流行。

OpenRouter的数据能看到这个变化。OpenRouter总部位于美国,是一家面向全球市场的模型聚合平台,集成了国际上300多个主流模型,每月Token(词元,模型调用的基础单位)消耗量超过30万亿,占全球可统计Token消耗量约3%。它反映了前沿开发者和创业企业的偏好。

OpenRouter今年3月Token消耗量位居全球前十的模型,有五款来自中国。OpenRouter截至3月30日数据显示,最近一个月,MiniMax M2.5、小米的MiMo-V2-Pro、阶跃星辰的Step 3.5 Flash free(免费版)、DeepSeek V3.2、Kimi K2.5全球Token调用量分别全球第一、第二、第三、第四和第八。

全球开发者可以通过OpenRouter,自由选择不同的模型,以及背后的算力服务商。当一名美国、欧洲或新加坡的开发者通过OpenRouter调用MiniMax、Kimi、DeepSeek等中国模型时,他的请求会经由OpenRouter,穿越太平洋海底光缆,可能会使用部署在中国的数据中心进行推理计算。

这种模型服务形式,在当下被称为“Token出海”。

中国市场的Token消耗量也在指数级增长。国家数据局3月24日显示,截至2026年3月,中国日均Token调用量已超过140万亿,相比2024年初的1000亿增长了1000多倍。相比2025年底的100万亿,三个月时间增长了40%多。

在这个背景下,“Token出海”被热议。“中国绿电变成世界Token”这种叙事逻辑被广泛传播。关于“Token出海”,有哪些事实和误解?要如何客观看待中国基础模型的业务进展?

三个事实

事实一,中国的基础模型在全球前沿开发者中,正变得更受欢迎。

2026年之前,OpenRouter上的前三名通常是OpenAI、Anthropic、谷歌、xAI等美国基础模型公司。2026年之后,MiniMax、月之暗面、智谱、阶跃星辰、DeepSeek、小米等中国公司的基础模型Token调用量轮番冲进全球前三。

这个趋势是2026年初开始出现的。中国基础模型(包括MiniMax、月之暗面、智谱、阶跃星辰、DeepSeek、小米、阿里千问)的Token调用量都在大幅增长。

这使得一批模型公司的收入大幅增长。今年2月末,一位月之暗面人士向《财经》证实,月之暗面在2月的20天内,收入就超过了2025年。3月30日,界面新闻报道称,月之暗面的ARR(年度经常性收入,当月收入×12)超过了1亿美元。

一位中国大模型创业公司人士甚至乐观预测,如果后续基础模型能够维持行业领先,智谱、MiniMax、月之暗面这几家大模型创业公司2026年营收将有望超过10亿元。

一位中国云厂商架构师对《财经》表示,OpenClaw“龙虾”等Agent(智能体)工具是拉动几家国产模型Token消耗量迅速增长的重要因素。国产模型被开发者大量采用,核心原因是,它们的Token价格远低于OpenAI和Anthropic的旗舰模型,但性能差距不算大。因此,在需要长时间运行Agent任务时,越来越多开发者愿意选择这些成本更低的模型。

事实二,国产旗舰模型的Token定价只有OpenAI、Anthropic旗舰模型的10%-30%,且性能差距不大。

国际市场调研机构Artificial Analysis长期追踪全球主流模型的价格。在中等难度的任务常用的模型中,以MiniMax-M2.7和Kimi K2.5为例,它们的定价只有GPT-5.4、Claude Sonnet 4.6的10%-30%。

重要的是,国产基础模型任务表现已经接近GPT-5.4、Claude Sonnet 4.6。一位资深算法工程师对《财经》表示,GPT-5.4、Claude Sonnet 4.6等基础模型能够在长达半小时甚至一小时的时间内连续完成复杂任务,中途几乎不需要人工干预。MiniMax-M2.5、智谱GLM-5、月之暗面的Kimi K2.5面对中等复杂的任务时,可靠性和OpenAI-5.3-codex接近。

这在今天的Agent环境中,价格优势很大。因为Agent执行任务时,会不断调用模型生成代码、规划任务并调用工具,每一个步骤都会消耗Token。一次Agent任务往往需要消耗远高于普通对话的Token数量。一次复杂任务,可能会消耗数万,甚至数十万Token。

性能差距不大,价格差距不小。中国模型的低价优势,在这个过程中被显著放大了。

事实三,OpenRouter上的国产模型Token消耗增长,更多集中在开发者群体,而非企业级大规模部署。

目前,国产模型的Token增长,更多是前沿开发者在PoC(可行性验证)场景测试中使用,或者是创业公司的小规模部署。

OpenRouter模型分发平台的核心机制是,通过一个API(应用接口)接入全球几百个模型,开发者可以随时切换。它更像是一个开发者的实验场,开发者会在不同模型之间频繁切换,根据成本和性能不断试错与优化。这些Token消耗,往往来自开发、测试和Agent任务,而非稳定的企业级生产系统。

OpenRouter同时会实时记录平台上Token消耗量位居全球前十的应用。这十款应用,更多是OpenClaw“龙虾”为代表的自动执行类Agent、Claude Code为代表的个人开发者使用的代码生成工具,以及Janitor AI等AI角色扮演聊天平台。

它们的特点是,小额、碎片化、不稳定,这和企业核心系统巨额、高频、稳定的Token消耗方式截然不同。

OpenRouter统计的应用Token消耗,更不包括ChatGPT(全球最大的AI对话工具)、Gemini(谷歌旗下AI对话工具)、豆包(字节跳动旗下AI对话工具)、Cursor(全球最大的独立AI代码生成平台)等全球个人/企业用户使用最多的工具。

也就是说,OpenRouter代表的整体Token消耗量目前是有限的。它更多代表了个人开发者和创业团队的用户习惯,而非企业级大规模部署。但在现实商业环境中,企业级大规模部署才是Token长期消耗的真正大头。这里的商业价值才是最高的。

OpenRouter的用户以个人开发者和中小创业团队为主,这恰恰是中国模型高性价比策略最易撬动的群体。但全球范围内,大型企业等高价值客户的生产系统中,OpenAI、Anthropic、谷歌的基础模型仍然占据绝对主导地位。

根据上述事实来看,“Token出海”“中国的廉价绿电变成世界的Token”广泛流传,这些说法是准确的。

一方面,中国在绿电供给、数据中心建设以及算力基础设施方面,已经形成了较为明显的优势。这为基础模型训练和推理提供了重要支撑。另一方面,一批中国基础模型在成本和性能之间形成了新的平衡,这是它们受到欢迎的前提条件。

三个误解

误解一,MiniMax、月之暗面、智谱、小米等中国公司的模型Token消耗量已经超越全球最大的三家模型(OpenAI的GPT、Anthropic的Claude、谷歌的Gemini)。

事实上,这是目前最为广泛传播的一个误解。因为OpenRouter能统计到Token消耗只占全球约3%,它无法统计到OpenAI、Anthropic、谷歌面向个人用户的App和面向企业级工具的Token消耗量。

谷歌在2025年三季度财报电话会(2025年10月29日)曾披露过月均Token消耗量——1300万亿Token/月。谷歌在2025年四季度财报电话会(2026年2月4日)进一步披露,当前旗舰模型Gemini 3 Pro日均Token消耗量是上一代模型Gemini 2.5 Pro的三倍。也就是说,谷歌2026年初的月均Token消耗量在1300万亿的基础上还有大幅增长。

相比之下,MiniMax、月之暗面、小米等中国模型公司2026年3月在OpenRouter的Token消耗量在2.6万亿-6.2万亿Token之间。

这虽然不能代表它们全部的Token消耗量,但如果仅根据OpenRouter的数据,就推断中国模型公司的Token消耗量已经全面超越OpenAI、Anthropic、谷歌,这会造成战略误判。

误解二,中国开发者只在用国产模型,没有使用OpenAI、Anthropic、谷歌的模型。

技术在全球开发者群体中没有国界。开发者为追求更高的技术指标,愿意不断尝试使用好模型。海外开发者在使用中国的好模型,中国开发者也在使用全球领先的模型。

虽然OpenAI的GPT、Anthropic的Claude、谷歌的Gemini理论上并不直接对中国大陆地区提供服务,但大量中国科技公司和开发者仍在通过其他方式(如一些第三方的模型聚合平台)使用这三家公司的基础模型。

《财经》了解到,包括阿里、腾讯、字节跳动、百度等中国大型科技公司的内部AI代码开发工具、员工办公类Agent平台中,均集成了自研模型、国产模型,以及GPT、Claude、Gemini等全球主流模型。大部分企业用户和个人用户,使用模型时,并非“非此即彼”的关系,而是多模型共存,根据模型的特长使用不同模型。

一位头部科技公司的模型训练工程师对《财经》表示,他在基础模型训练过程中,会使用内部开发工具搭载Anthropic的Claude系列模型。主要使用场景是,对部分训练数据进行清洗和筛选,以提高数据质量。

误解三,海外开发者使用中国模型的时候,一定在用中国的算力和绿电。

“中国廉价的绿电变成全球的Token”,这个叙事的部分事实是成立的。

廉价绿电正在成为中国算力的比较优势。电力在以AI芯片为主的数据中心中,综合成本约占10%。它是影响数据中心的选址因素之一。

中国的“东数西算”工程规划了“八大枢纽十大集群”,且大型科技公司的算力中心都在朝“八大枢纽十大集群”集中。中国西部地区,有大量风电光伏基地。内蒙古乌兰察布等西部枢纽节点城市的绿电价格普遍低于0.4元/千瓦时。这些城市被大型科技公司用于建设十万卡以上的超大型算力中心,并提供训练、推理服务。

按照相关部门的政策引导,2025年末枢纽集群新建数据中心的绿电使用占比要超过80%。相当一部分中国模型跑在枢纽集群的数据中心上,它们每吐出一个Token,都是在消耗绿电。廉价绿电,的确是中国未来不断降低单位Token成本的一个重要因素。

一位大模型创业公司人士对《财经》表示,的确存在硅谷开发者在调用中国模型时,Token跑在中国数据中心的情况。不过,海外开发者使用中国模型时,考虑到网络延迟和数据安全问题,一般会选择本地云服务和数据中心。

因此,在一些情况下,海外开发者使用中国模型的时候,背后的确在用中国的绿电。

但是,模型并不绑定一个国家的算力或者电力。OpenRouter的技术文档和隐私政策显示,全球开发者在使用300多款模型的时候,开发者可以自由选择路由到全球60多家大大小小的服务商的平台上。也就是说,它背后的算力供应是多元的。

Token的生产、调度与消费是全球化的过程,背后的算力、电力都是跨越全球协作网络的。不能狭隘、简化地理解成,中国的电力、算力变成Token输出到全球且无可替代。

更重要的是,现实中的算力出海是多元且复杂的。

一位政策研究部门人士3月末对《财经》表示,这可以分成四种形式。一是,海外用户通过中国境内数据中心使用Token等算力。二是,中国企业在海外租赁或建设数据中心,提供Token等算力。三是,海外企业把非敏感数据放在中国境内渲染、清洗。四是,中国开源模型被海外的国家、企业进行二次训练精调并在当地数据中心使用。

也就是说,仍然有相当一部分Token跑在海外的云服务和数据中心上,消耗着海外的算力、电力。

比如,全球最大云计算厂商亚马逊AWS的模型平台Bedrock上架了包括MiniMax、月之暗面、DeepSeek、阿里Qwen等中国模型。这些模型和OpenAI的GPT、Anthropic的Claude、谷歌的Gemini等模型并列展示,同时面向全球数百万开发者。在一些国家和区域,亚马逊AWS部署在当地的算力、电力,支撑着中国模型向全球开发者提供服务。

如何看待这些阶段性进展?

要如何准确看待中国基础模型公司这一年多的阶段性业务进展?

中国基础模型公司普遍还在早期成长阶段。将单一平台的Token消耗量增长直接等同于商业化进展,容易产生系统性误判。

2026年以来,月之暗面、智谱、MiniMax等公司带来了惊艳的模型和商业化表现,2025年营收普遍在1亿-7亿元之间。2026年一些公司营收甚至可能超过10亿元,其中很大一部分收入来自中小开发者。

这些增量收入很重要,驱动了这几家公司2026年的爆发式增长。但来自中小开发者和创业公司的API调用收入的忠诚度、稳定性不足。未来每次3个-6个月的模型迭代周期持续保持领先才能获得稳定的收入,否则模型一旦落后,收入就会断崖式下滑。

2026年初,OpenAI年化收入超过250亿美元,Anthropic年化收入超过200亿美元。OpenAI 75%以上的收入来自消费者、企业用户的长期订阅,Anthropic 80%以上的收入来自消费者、企业用户的长期订阅。这类收入长期、稳定、可持续。

月之暗面、智谱、MiniMax仍在商业化早期。智谱2025年上半年营业亏损超23.6亿元,MiniMax 2025年经调整净亏损2.5亿美元,月之暗面也在亏损状态。这些公司正在经历从技术领先到商业可持续的关键阶段。《财经》了解到,月之暗面正在尝试突破海外大客户群体,且已经取得了Cursor等关键客户。

另一位模型创业公司人士对《财经》表示,他所在的公司今年3月API调用业务实现单季盈亏平衡,但这并不能确保所有业务全年盈利,它们仍在战略投入期。

几家中国公司在全球模型市场的影响力确实有很大提升。Token调用量的暴增也确实为商业模式验证带来了新变量,但将单一平台的Token消耗量增长直接等同于商业化进展,或直接等同于全球市场地位,稍显简单粗暴。

少数中国模型公司在OpenRouter的Token调用量增长,是低价甚至免费策略带来的。其API服务毛利率甚至可能为负,也就是说每处理一次开发者请求,公司都在亏钱。这种烧钱换增长的模式在互联网时代屡见不鲜,但在AI竞争能否跑通尚未可知。

模型创业公司长期存活的商业能力往往需要数年时间才能被验证。比起单一指标的快速增长,更重要的是建立稳定的客户关系、持续的收入能力,以及长期的产品与服务壁垒——这才是中国模型公司真正的考验。

216.73.216.183