国家数据局官宣:探索词元(Token)交易
国家数据局的重磅发文,又一次选在晚上。
昨晚,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,迅速点燃业内讨论热情,群聊消息迅速999+,足以说明文件的重要性。
文件第十八条提出,“探索词元交易等新型交易模式,构建以词元为基础,可量化、可定价的数据集价值体系”。

这一新颖表述,让各方对词元(Token)的发展走向充满期待。
小科普:什么是词元(Token)?
词元,是AI大模型处理信息的最小计算单元,相当于AI的“算力计价标尺”,类比电力按“度”、流量按“GB”结算,大模型的文本理解、图像识别、内容生成等所有操作,均以词元为单位核算消耗,每一次AI交互,本质都是词元的调用与算力成本的兑现。
截至2026年3月,我国日均词元调用量已突破140万亿,连续数周稳居全球首位。
从2024年初的1000亿到如今的140万亿,两年间调用量暴涨1400倍,这一爆发式增长背后,是AI应用在教育、农业、工业、服务业等全场景的深度渗透,全民级的使用需求,不仅撑起了全球最大的
如今国家数据局文件中正式提出推进词元交易布局,势必将进一步促进行业发展与资本需求共振,这也不难理解大晚上各大群聊999+的现象了。
据悉,国产词元定价仅为海外同类产品的1/6至1/20,价格优势明显,同等预算下,国内企业可获得6-20倍的词元调用额度。
这得益于我国完善的算力基础设施、丰富的本土数据资源与快速迭代的算法技术共同作用的结果,也为词元从单纯的计量工具,转向可交易、可增值的资本标的,奠定了坚实的市场基础。

发文之前,市场上已出现多款词元(Token)整合售卖平台,行业已形成成熟的落地雏形,其交易模式贴合市场实际需求。
我们调查发现,最主流的是按量计费模式,也是当前大模型服务商通用的结算方式,主要逻辑是企业与开发者采购
除基础的按量计费外,行业已形成三类常见的交易模式。
第一种是按量计费模式
目前较为主流,直接按照实际业务量计费,多退少补,较为灵活。
第二种是包年包月套餐
适配AI调用需求稳定的企业,如电商智能客服、内容批量生产等场景,固定额度套餐可显著降低长期使用成本,也让服务商形成稳定现金流,这也是资本评估相关企业估值的重要参考。
第三种是批发集采模式
面向大型企业、科研机构等大规模算力需求方,直接向算力厂商采购大额词元额度可获得额外优惠,这一模式未来将成为词元市场的核心交易形态,也是头部资本布局算力赛道的重要切入点。
本次文件明确提出,鼓励高质量数据集在数据交易所挂牌流通,发展订阅、定制化服务,同时构建以词元为基础,可量化、可定价的数据集价值体系。
这是否意味着,后续高质量数据集将以词元作为统一结算单位?值得探讨。
从市场来看,
当前全球AI产业竞争日趋激烈,词元已成为AI行业的核心流通载体,其交易规则、定价体系的话语权,直接决定一国在全球AI赛道的竞争地位。
我国若率先由国家层面引导词元交易规范化,正是依托全球第一的词元市场规模与显著成本优势,构建符合本土产业发展的规则体系,降低海外算力依赖,这也让国产词元及上下游赛道,将成为资本布局的重点方向。
数据要素市场化的核心阻碍的是缺乏统一的价值衡量标准,我们是否可以发散思维讨论,词元将数据价值拆解为可量化的标准单元,数据采集、加工标注、模型应用全链条参与方,均可通过词元获得公平的市场化回报?

此前,大量中小AI企业受制于高昂的算力成本,难以落地商业化项目,也难以获得资本青睐,而国产词元的低成本优势,搭配灵活的交易模式,让中小企业只需极低成本即可采购词元、调用AI能力,完成生产优化、智能服务等场景落地,这也让天使轮、种子轮资本,看到了中小AI赛道的投资潜力。
词元交易的核心是数据与算力的市场化流通,数据的隐私安全、合规使用直接关系到交易的可持续性,数据泄露、恶意滥用、市场垄断等风险,均需要全新的监管框架应对。
我们在调研中,多家创业公司反馈,当前不同大模型厂商的分词算法存在差异,中文词元对应汉字数量不统一,多模态数据的词元计量规则更是缺乏统一标准,极易出现跨平台价值不对等、交易结算纠纷等问题。尽管政策已明确推进标准体系建设,但落地仍需行业协同,短期内难以完全解决。
国家数据局的官方表态,并非行业远景规划,而是明确的市场化推进信号,未来AI产业的核心竞争,不再是单一模型的性能比拼,而是词元、数据、算力、算法的全链条综合竞争,这一赛道的商业化潜力,已成为资本共识。
结合行业发展规律,我们判断词元交易大概率将采用“试点先行、逐步推广”的模式,优先在工业制造、医疗卫生、金融服务等重点领域落地试点,完善标准、积累经验后再全面铺开。
对市场甚至资本而言,试点阶段正是布局的窗口期,尤其是算力基础设施、数据标注、数据集运营等上下游环节,有望率先迎来资本加注。未来词元成熟后,将如同水电、网络一样,成为数字经济时代的基础生产资料,其商业价值将持续释放。

调研的一家创业公司在杭州滨江区,AI产品经理每天上班的第一件事,就是查看后台词元调用量与成本数据。
这家成立不足两年的创业公司,正在开发面向中小商户的智能体工具,“我们现在日均消耗数万词元,总成本仅数十元,就能支撑上千次用户智能交互,这在两年前是不可想象的。”该AI产品经理此前表示,不知在此次提出“Token交易”后,他们会有什么意见反馈?
本次国家数据局征求意见稿的截止时间为4月22日,行业各界建议仍在持续汇聚,我们无比期待~



















评论 0