中国创业公司，拿到国际机构数据授权

数据交易网

发布于 2026-01-20

数据集团数据资产化数据开放

东壁数据拿到国际机构数据授权，并非简单的“引进来”，更是中国科技标准“走出去”的开始。

1月16日，一则合作公告引发数据圈热议。

我国东壁科技数据有限责任公司与拥有220年历史的国际顶级学术出版集团泰勒-弗朗西斯正式签署协议，后者首次向东壁数据开放核心学术期刊元数据授权，并联合拓展科技文献数据、科技图书出版等多个方面合作。

为何开放给国内初创公司？东壁数据的底气，源于其独特的“国家队”基因与技术硬实力。

这家2024年1月由中国科学院原青年科学家团队创办的企业，核心成员均长期深耕科技大数据领域，创始人吴登生是深圳大学特聘教授，在学术评价与数据治理领域拥有十余年积累。

2026年初，公司刚完成近亿元Pre-A轮融资，投资方包括中科创星、北京高精尖基金等专注硬科技的顶级资本，资金将主要用于技术研发、团队建设和市场拓展。

这一融资节奏，在国内数据领域实属罕见，背后是资本对其“中国视角科技评价体系”商业化潜力的认可。

支撑东壁数据站上国际合作舞台的核心，是其自主研发的“东壁指数”。

在此之前，全球科技界依赖的评价标准，仍是美国情报学家尤金・加菲尔德1955年提出的“影响因子”，这套体系因单纯依赖论文引用数量，长期存在易被人为操纵、科研资源错配等弊端，甚至导致部分期刊为冲高影响因子，刻意规避冷门但有重大创新价值的研究。

东壁指数则跳出这一框架，采用“种子期刊引文追溯+引文网络层级结构分级”的原创方法，首次为学术期刊增加“质量分级”维度，通过追溯领域内公认的“种子期刊”（即学科奠基性期刊）引文关系，再按引文网络的层级判断研究的原创性与影响力，最终筛选出的文献，更能反映学术界真实的权威认知。

据介绍，东壁指数的数据基础包括其自主采集和整理的超过1亿条全球自然科学领域主要学术期刊的元数据。

2025年1月东壁指数发布后，迅速获得国际学术界关注。

同年3月，中国科协在官方平台发表评论员文章，将其称为“中国争取学术话语权的标志性事件”，认为这套体系打破了欧美在学术评价领域的单一标准垄断。

当前，东壁指数并非“闭门造车”，其覆盖全球全学科的顶级期刊列表，已被全球多个国家的科研机构参考，部分欧洲高校甚至将其作为博士论文发表的重要依据，这为后续国际合作埋下了伏笔。

有了自主评价标准，东壁数据进一步搭建起 “全球科技文献数据平台”。2025年7月，在2025全球数字经济大会上，该平台由东壁数据与联合国工业发展组织联合发布，一上线便引发关注，平台收录全球近1亿条高质量科技文献元数据，涵盖从17世纪科学革命时期到2025年的核心研究成果，且所有基础功能对全球用户免费开放，包括文献检索、引文分析、学者成果追踪等。

更具突破性的是，平台还嵌入“学者成果解读”、“综述自动生成”两大AI能力，能为科研人员自动梳理某一领域的研究脉络，将原本需要数月的综述撰写时间缩短至数小时。

数据显示，上线三个月，该平台便吸引全球超百万次访问，其中不仅有中国科学院、清华大学等国内机构，还包括麻省理工学院、剑桥大学等国际顶尖高校的科研团队。

这背后的逻辑很清晰，相比传统西方数据库动辄数万美元的年度订阅费，东壁平台的免费基础服务降低了全球科研的门槛。而基于东壁指数筛选的高质量文献，又避免了用户在海量低质数据中“淘金”的成本。平台的数据采集、加工、存储均由东壁数据自主完成，完全摆脱对西方数据库的依赖，这在国际科技竞争日益激烈的背景下，为中国科研数据安全筑起了“防火墙”。

此次与泰勒-弗朗西斯的合作，进一步补齐东壁数据的“短板”。

作为国际学术出版领域的巨头，泰勒-弗朗西斯拥有2700余种学术期刊、累计近20万种图书，覆盖理工农医、人文社科全学科，其核心优势在于英文科技文献的深度与广度，尤其是在材料科学、生物医药等前沿领域，该集团旗下期刊发表的研究成果占全球相关领域的35%以上。

根据协议，东壁数据不仅能使用其期刊元数据（包括论文标题、作者、摘要、引文网络等核心信息），还将联合拓展科技与医学期刊全文数据库的企业访问渠道，甚至共同推进“JAB 科技图书出版”业务。这意味着，中国科研人员未来可通过东壁数据，直接获取泰勒-弗朗西斯旗下期刊的全文，而东壁指数也将纳入该集团的优质期刊，形成双向赋能。

这场合作的深层意义，或许要放在中文与英文科技语料库的长期失衡中审视。

数据显示，互联网上的中英文语料占比存在明显差异，英文内容占比高达59.8%，而中文仅占1.3%。长期以来，国内AI大模型研发面临两大语料痛点：一是中文科技语料碎片化，高校、科研院所的数据库各自为战，缺乏统一的质量标准，导致AI模型难以获取连贯的研究脉络；二是高质量英文科技语料严重依赖进口，此前国内企业若想获取泰勒-弗朗西斯、爱思唯尔等集团的核心数据，不仅需支付高额费用，还可能面临“数据使用范围限制”。

这种依赖直接导致国内大模型在垂直科技领域“先天不足”。东壁数据的出现，此次引入泰勒-弗朗西斯的英文数据后，东壁数据将形成“中文+英文”的全球均衡语料结构，覆盖从基础科学到应用技术的全链条。更关键的是，这些数据均获得合法的AI训练授权，彻底解决了国内企业“想用不敢用”的合规痛点。

AI大模型的性能，本质上取决于“语料质量×数据量”，低质量语料即便规模庞大，也只会增加模型幻觉，而高质量语料能让模型在更小的数据量下实现更高的准确性。

2025年，东壁科技与中科微光合作，利用其科技文献语料训练出中国首款心血管AI-OCT大模型“麒光”，该模型能在秒级内完成心脏介入手术影像的判读，帮助医生精准拟定治疗方案。

同年12月，广东省人民医院团队借助“麒光”，成功攻克慢性完全闭塞病变（CTO），患者远期临床预后良好。

而随着泰勒-弗朗西斯英文语料的加入，类似的垂直领域大模型，未来可快速拓展至肿瘤治疗、新能源材料等更多领域，推动国内AI从“通用型”向“高精尖”转型。

我们认为，此次东壁数据拿到国际机构数据授权，并非简单的“引进来”，更是中国科技标准“走出去”的开始。

泰勒-弗朗西斯之所以选择东壁，不仅看中其平台的全球影响力，更认可东壁指数的学术价值，双方合作的JAB科技图书出版业务，将首次采用东壁指数筛选优质学术成果，这意味着中国自主的学术评价标准，将通过国际出版渠道影响全球科研方向。

对于中国科创企业而言，东壁数据的路径更具借鉴意义，在科技竞争日益聚焦“数据与标准”的当下，单纯的技术追赶已不够，必须构建自主标准、核心数据以及生态合作的完整体系。东壁数据从研发东壁指数，到搭建自主数据平台，再到吸引国际出版集团合作，每一步都围绕“掌握话语权”展开，最终实现质的突破。

我们期待国内更多企业加入科技数据生态建设。当我国自主的学术标准与全球顶尖的文献数据深度融合，不仅能为国内科技创新注入新动能，更能推动全球科技资源的均衡分配，这或许就是东壁数据此次国际合作，留给市场最深刻的思考。

中国创业公司，拿到国际机构数据授权

为您推荐

评论 0