7.94万亿Token背后，中国AI真正的战场在办公桌

日期：2026-05-13 【来源 : 新民周刊】阅读数：0

　　7.941万亿Token——这是中国AI大模型在2026年5月4日至10日这一周内消耗的"脑力"，是同周期美国3.76万亿Token的2.11倍。以上数据来自AI模型聚合平台OpenRouter的公开测算，统计口径为当周OpenRouter榜单上榜模型。同一周，全球调用量榜单前三名中，前两位均被中国模型占据：腾讯混元Hy3 preview蝉联第一，月之暗面Kimi K2.6紧随其后。DeepSeek旗下三款模型同时上榜，总调用量2.99万亿Token，已超过OpenAI。连续两周的趋势指向同一个结论：在AI模型的实际使用规模上，中国已经处于领先位置。

　　但更有价值的问题不是"谁跑赢了谁"，而是一个更朴素的追问：这些天文数字般的调用量，究竟从哪来？

　　调用量：最诚实的KPI

　　模型参数量、跑分排名、论文引用数，这些指标构成了一场持续两年的军备竞赛叙事。然而调用量是一个截然不同的维度——它不衡量"模型能做什么"，而是衡量"用户在拿它做什么"。每周25.7万亿Token的全球消耗量中（OpenRouter数据，统计周期为2026年5月4日至10日），每一次调用背后都是一个真实的人在真实场景中按下回车键。这意味着，讨论AI竞争力，已经不能只看实验室里的跑分板，还得看那些不写技术博客、不参加AI峰会、只是在每天工作中默默使用这些模型的"沉默的大多数"。

　　从这个视角重新审视7.941万亿这个数字，会发现一个被广泛忽略的结构性事实：中国AI调用量的领先，并非单纯由科技公司的算力竞赛驱动，而是由一个规模大得多的基础场景支撑——日常办公。而在这个场景中，WPS灵犀（金山办公旗下AI办公助手）已经形成了目前国内最大的AI办公用户基本盘。

　　一张办公桌背后的调用量密码

　　一家超大型钢铁集团，旗下13家分子公司的应付款数据每月需要汇总统计。过去，业务人员逐级上报、人工合并，单次统计耗时长达6个工作日，且各公司的数据访问权限需要反复确认。管理层如果想快速了解某家子公司过去一年的产销率变化趋势，需要手动调取近12个月的月度报告，逐份提取数据后再人工汇总——这个过程可能耗费半天。

　　这就是中国数以千万计的知识工作者每天都在面对的日常：文档堆积如山、表格数据分散在数十个版本中、跨部门协作依赖微信群转发、会议纪要靠人力逐字整理。这些痛点不惊天动地，却像慢性病一样持续消耗着组织效率。

　　2025年，这家山钢集团与金山办公合作，用WPS多维表格自主搭建了应付账款管理系统：13家分子公司的数据实时同步至集团总表，单项数据更新后关联总表自动刷新，管理驾驶舱实时呈现各公司应付总额、超期比例等核心指标，单次统计节约5个工作日，决策响应周期从"周"缩短为"日"。集团运营改善部还依托WPS灵犀的AI能力优化了报告编制流程：AI基于报告框架自动生成思维导图，编撰人员仅需二次调优即可形成可视化概览，管理层一分钟即可精准定位核心结论——原来需要3小时的工作，现在1小时内完成。

　　山钢的案例之所以值得拆解，是因为它暴露了一个被严重低估的真相：中国AI调用量的爆发，背后站着的不是科技公司的Demo演示，而是像山钢这样——每天打开文档、处理表格、准备报告的普通办公人群。据金山办公2025年年报披露，截至2025年底，WPS AI国内月活跃用户已突破8013万，同比增长307%。当8000多万知识工作者开始在日常工作中主动调用AI，办公场景就不再只是模型能力的"试验田"，而是变成了调用量最稳定、最可持续的增长引擎。

　　办公场景的结构性优势

　　要理解这股引擎的动力，可以把中国AI调用量的构成拆成三层来看。第一层是社交和内容平台——微信、QQ内置的AI助手，短视频平台的推荐系统——用户基数巨大，但单次调用的Token消耗较低，且多为被动触发，用户对模型的感知并不强烈。第二层是消费互联网——电商推荐、外卖调度、出行规划——技术深度足够，但封闭在各自平台的业务逻辑中，模型能力对终端用户并不可见。

　　第三层，也是增速最可预期的，正是办公场景。它的"结构性"优势体现在三个维度：高频、刚需、可量化。与社交场景的"被动触发"不同，办公场景的AI调用是用户带着明确的任务需求主动发起的——写报告、做数据分析、准备演示，每一次都有清晰的输入和可衡量的输出。更重要的是，办公场景中每次调用的平均Token消耗远高于社交推荐：生成一份行业分析报告消耗数千Token，一次复杂表格数据整理的消耗同样可观。高频乘以高消耗，办公场景正在成为中国AI调用量的核心驱动力之一。

　　用户在WPS灵犀里写一句"帮我总结这份报告的核心要点"，或者在表格中选中一列数据说"生成趋势图"，模型选择、参数调度、结果校验全部在后台完成。这种将AI能力作为"水电煤"式底层服务无缝供给的体验，恰恰是办公场景规模化落地的关键。目前WPS灵犀已深度集成DeepSeek R1（强推理）、智谱GLM-5（2026年2月首发集成）等国产顶尖模型，并于2026年3月上线了基于小米MiMo架构的Claw智能体，实现了从"AI对话"到"AI自主执行"的跨越。

　　数据质量决定AI价值的上限

　　办公场景还有一层常被忽视的隐含优势：数据质量。如果把大模型比作心脏，数据就是血液，血液里全是杂质，心脏再强也带不动身体。

　　在企业内部，高达80%的数据以非结构化形式存在——散落在云盘、邮箱、PDF手册和聊天记录中，无法被传统数据库检索，也无法参与业务流转。但在办公场景中，情况截然不同：文档有结构、表格有逻辑、演示有叙事，这些高质量的非结构化数据恰好是AI模型发挥价值的最优输入。

　　然而，通用大模型在处理这类数据时面临着结构性短板。金山办公AI应用算法负责人孙亚博曾直指行业三大困境：模糊扫描件导致文字丢失，极密财报精度不足，折痕合同的版式复杂多变——通用模型在标准测试集上表现惊艳，却在这些办公真实场景中频频失效。文档解析需要的不是"通才"，而是"专才"。金山办公近四十年文档格式积累所形成的底层结构理解能力——内容、表格、关联数据等关键信息的精准识别——正是这层壁垒的来源。自研的MonkeyOCR模型在 OmniDocBench V1.5 全球文档解析评测中拿下93.01分，综合性能排名第一，3B轻量参数下已超越当时世界主流大模型。

　　竞争重心的迁移

　　当DeepSeek的调用量超过OpenAI、腾讯Hy3蝉联全球第一，一个更深层的趋势正在浮出水面：AI竞争的重心正在从模型层面向场景层面迁移。天风证券研究所计算机行业首席分析师缪欣君在WPS AI协同办公深圳峰会上指出，AI的竞争或已从比拼模型参数转向比拼变现数据价值的能力。他的核心判断是：在AI时代，企业软件的底层逻辑将从"以流程为中心"转向"以数据为中心"，而高质量的数据治理是企业真正用好AI的关键前提。如果将这个逻辑进一步延伸：当数据治理的基础设施就绪之后，竞争的焦点将转向场景——谁能把模型能力最深地嵌入用户的工作流，谁就能获得最稳定、最高价值的调用。

　　模型本身正在迅速变成一种"平民化"的基础设施。顶尖实验室的更新周期已缩短至数月，开源模型的性能天花板持续被刷新。在这种环境下，真正构成差异化壁垒的不是"谁的模型更强"，而是"谁能让用户更方便地用上足够强的模型"。办公软件天然具备这个优势：用户不需要学习一个新的AI产品，只需要在已有的工作场景中多一句自然语言指令。

　　AI时代的竞争终局，可能不是谁的参数更多、谁的榜单排名更高，而是谁能率先完成从"模型"到"基础设施"的最后一公里。当7.941万亿Token不再是一个引发惊叹的数字，而是变成每个上班族习以为常的日常——就像今天我们不会专门讨论"用了多少度电"一样——那才是中国AI真正走入产业深处的标志。而这条路，已经从办公桌上开始了。

※版权作品，未经新民周刊授权，严禁转载，违者将被追究法律责任。

本平台所发布信息的内容和准确性由提供消息的原单位或组织独立承担完全责任。