国家数据局定调词元交易,数据流通定价有了计量标准
国家数据局印发的《关于推进行业高质量数据集建设行动的实施方案》,首次将“词元交易”写入国家级政策文件,明确提出探索词元交易等新型交易模式,构建以词元为基础的可量化、可定价数据价值体系。
此前词元仅作为大模型领域的技术术语与服务计费单位应用于产业端,此次被纳入数据要素市场化建设框架,有望缓解行业长期存在的定价难题。

我国数据要素市场化推进多年,定价机制始终是核心制约。
传统数据交易以完整数据包为标的,采用一次性售卖模式。数据价值高度依赖应用场景与买方的技术转化能力,同一数据集在不同主体手中价值差异显著,供需双方难以形成统一价值共识,交易多为一事一议,难以规模化推广。同时,API按次计费模式仅优化了交付形式,仍未建立客观的价值计量标准,单次调用对应的数据贡献、算力成本均不透明,产业链各环节的收益分配依赖合同约定,缺乏统一核算依据。
词元是大模型处理文本信息的最小单位,当前国内主流大模型厂商均已采用词元作为服务计费单位。
数据显示,过去两年国内大模型日均词元调用量从1000亿次增长至140万亿次,增幅超千倍,词元作为AI服务结算单位的市场共识已经形成。词元交易的核心逻辑,是将AI服务端的成熟计量单位向上延伸至数据供给端,建立全产业链统一的价值标尺。
数据价值不再以条数、存储容量等物理属性衡量,转而以其投入模型训练与推理后产出的有效词元规模、对模型效果的提升幅度为评估依据。高质量垂直领域数据对应更高的词元价值,低质量泛化数据对应更低的定价,市场机制可自动实现数据价值分级。
有观点将词元类比为“数据货币”,其本质并非一般等价物,而是与电力行业的“千瓦时”类似,是统一的价值计量单位。依托该单位,产业链各环节的贡献可实现标准化核算,原始数据供给、数据标注、算力投入、模型应用等各环节,均可按实际消耗与贡献比例结算收益,替代传统主观议价模式,为优质数据付费机制提供落地基础。
从计量维度看,这是信息价值计量方式的重要调整。互联网时代,比特、字节是通用计量单位,用于衡量信息的存储、传输等物理属性,无法评估信息的应用价值。词元则面向智能生产环节,计量数据经算力加工后产生的认知产出价值,实现了从“信息体量”到“智能价值”的计量维度升级。
对AI产业而言,词元交易将推动商业模式从订阅制为主向按量计费深化。订阅制下用户成本与使用量脱钩,按量计费可实现成本与收益的精准匹配,降低中小主体的使用门槛,同时为高价值AI服务提供溢价空间,推动行业计费颗粒度精细化。
对数据交易市场而言,统一计量标准可有效降低交易成本。当前国内多地数据交易所存在非标品占比高、定价难度大、交易活跃度不足的问题。词元计价支持数据产品拆分交易,买方可按需采购、按量结算,降低了交易门槛,有助于提升数据要素的流通效率与市场规模。
对数据供给端而言,收益模式的转变将优化供给结构。传统数据售卖为一次性交易,供给方收益与数据后续使用频次脱钩,且难以防控盗版风险。词元交易模式下,数据供给方可按数据的实际调用量持续获得收益,数据质量越高、应用范围越广,收益规模越大,将引导行业从数据数量扩张转向质量提升。
目前词元交易仍处于政策探索阶段,落地仍面临多项待解问题,包括不同类型数据的词元价值分级标准、数据在模型训练与推理中的贡献度追踪机制、数据供给方持续收益权的保障路径等。当前数据要素市场化的基础制度建设持续推进,数据确权、数据资产入表、交易场所布局等工作已取得阶段性进展,价值锚点成为下一步的核心突破方向。
词元是现阶段具备市场基础的价值计量方案,政策发布后,头部数据企业与大模型厂商已启动模式研讨,部分地方数据集团也已开展词元交易规则的前期研究。




















评论 0