
Token出海不是低价竞争,而是基于智能水平的“高质优价”输出。
当全球开发者在全球大模型聚合路由平台OpenRouter平台上惯性地选择DeepSeek、MiniMax、GLM等中国模型处理代码、生成文本时,他们或许暂未意识到,自己正参与一场AI产业的全球变革——以Token(词元)为载体,中国大模型正大幅迈向国际舞台。
虽然OpenRouter在全球大模型总调用量中的占比不高,但更具意义的是,持续超过一个月的调用量增长证明了中国模型正被世界看到。而在中国市场,Token经济同样愈发重要。
4月2日,火山引擎总裁谭待披露,豆包大模型日均Token使用量突破120万亿,三个月时间内翻了一倍,相较两年前的数据实现了1000倍的高速增长,代表了整个AI行业的加速发展。目前,在火山引擎上累计Token使用量超过一万亿的企业已从去年底的100家增长到140家。
国家数据局局长刘烈宏表示:Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。
中国模型Token走向海外
近一个月时间,据OpenRouter,国产大模型调用量连续一个月超过海外模型。截至4月2日,本周仍旧是国产模型调用量超越海外模型的走势。
但需注意的是,OpenRouter的调用量占全球总调用量的比例约在1.5%到3%之间。截至2026年3月底,OpenRouter平台周调用量约22.7万亿Token,约合日均3.24万亿Token。而据行业分析机构估算,2026年,包含闭源模型API如OpenAI、Azure、Google Vertex及各类私有化部署的全球大模型日均调用量在百万亿规模。
一位不愿具名的大模型行业人士对记者表示,中国模型正在加速追赶OpenAI与Anthropic等海外头部模型,中国模型性价比优势显著,未来可期。目前的Token成本里,大部分仍是 AI 芯片成本,其他成本如电力等只占小部分。实现Token出海大部分收益都留在国内,实现“国模国芯”整体方案的Token出海,是更具意义的事情。
虽然调用量占比低,但OpenRouter数据仍对行业仍有参考价值。上述人士表示,OpenRouter主要代表海外用户对中国模型的调用,这方面OpenRouter最流行也最有代表性。用户结构上,OpenRouter中国开发者仅 6.01%,调用量由开发者群体用脚投票;作为 Agent 与新应用先行场,能够领先反映行业下一阶段需求。
在智谱CEO张鹏看来,随着OpenClaw等应用驱动的Token消耗进入指数级轨道,一场智能输出革命正在发生,首先是推理再中心化:凭借超大规模集群的规模经济与极致的推理优化,云端大参数基模的效率将进一步提高。其次高质量 Token 出海:依托中国在能源、芯片适配及IDC运维上的全产业链优势,中国厂商正在实现从“中国制造”向“中国智能”的跨越。Token 出海不是低价竞争,而是基于智能水平的“高质优价”输出。
优刻得副总裁刘杰认为,“Token出海”并不等同于简单的“算力出海”或“数据中心出海”,而是模型能力、推理服务、开发者生态的全球化延展。中国大模型的优势在于其训练成本比较低,这背后有工程能力、算法优化等多方面因素,如果再把模型部署在国内的数据中心,结合相对较低的电价,综合下来成本大幅降低。
“我们看到的趋势是,AI产业分工越来越细,模型层由国内头部AI企业主导,基础设施层由具备全球资源的云厂商支撑,来共同服务海外开发者与企业客户。”
刘杰认为,这一过程中的机遇在于,云厂商和模型厂商的合作从“租算力”升级到“深度绑定”,进一步还可能催生出新的商业模式,例如模型API聚合、区域化推理优化等。优刻得观察到,新兴市场(东南亚、中东、拉美)对中国云服务的接受度正在提升。
Token经济推动算力需求激增
相较海外市场,中国Token经济也在如火如荼地进行。
谭待指出,Token使用量是衡量AI发展速度的核心指标,近期豆包大模型使用量高速增长,核心驱动因素是AI视频创作的爆发与AI智能体的加速普及。
过去相当长一段时间内,云计算市场主要通过性价比优势打市场,而此次受益于OpenClaw对开发者群体的带动,算力市场迈入明显的供不应求阶段。一位字节跳动内部人士对记者表示,视频大模型Seedance 2.0推迟一个月上线,也有算力不够用的因素影响。
在这样的背景下,多家模型厂商与云计算厂商宣布提价。市场端,年初以来,AWS、谷歌云、阿里云、腾讯云等全球多家厂商宣布涨价,火山引擎Coding Plan对部分优惠活动进行阶段性调整,暂停首购特惠福利。表现在组织端,阿里巴巴成立Alibaba Token Hub (ATH) 事业群,属于集团一级事业群,由CEO吴泳铭直接挂帅。据记者了解,阿里正在发力追赶MaaS赛道,给到销售商更低的折扣。
对于整个Token市场的价格变动,谭待对记者表示,抛开模型能力谈价格变动没有意义。火山引擎不看单一Token价格,而是关注端到端解决成本——通过压缩无效Token、分层优化、软硬件协同,实际单位价值成本在持续下降,暂无变动价格的计划。
多位行业人士也认可未来Token的分层趋势。智谱董事长刘德兵表示,未来简单对话与轻量任务的低阶Token将走向低价、免费的广告模式,高复杂度、高可靠性、具备生产力能力的高阶Token将具备持续定价权。
火山引擎在两年前激进投入的MaaS(模型即服务)战略在今年成为多家企业的重点方向,对于目前行业的竞争态势,谭待对记者表示,模型体验、算力调度效率、安全体系是长期壁垒。企业客户关注的是“模型能否创造价值”,而非单纯折扣。火山引擎已将过去的千亿商业化目标上调,盈利预期也会更快,但暂无三年盈利规划。

