中国创业公司,拿到国际机构数据授权
1月16日,一则合作公告引发数据圈热议。
我国东壁科技数据有限责任公司与拥有220年历史的国际顶级学术出版集团泰勒-弗朗西斯正式签署协议,后者首次向东壁数据开放核心学术期刊元数据授权,并联合拓展科技文献数据、科技图书出版等多个方面合作。

为何开放给国内初创公司?东壁数据的底气,源于其独特的“国家队”基因与技术硬实力。
这家2024年1月由中国科学院原青年科学家团队创办的企业,核心成员均长期深耕科技大数据领域,创始人吴登生是深圳大学特聘教授,在学术评价与数据治理领域拥有十余年积累。
2026年初,公司刚完成近亿元Pre-A轮融资,投资方包括中科创星、北京高精尖基金等专注硬科技的顶级资本,资金将主要用于技术研发、团队建设和市场拓展。
这一融资节奏,在国内数据领域实属罕见,背后是资本对其“中国
支撑东壁数据站上国际合作舞台的核心,是其自主研发的“东壁指数”。
在此之前,全球科技界依赖的评价标准,仍是美国情报学家尤金・加菲尔德1955年提出的“影响因子”,这套体系因单纯依赖论文引用数量,长期存在易被人为操纵、科研资源错配等弊端,甚至导致部分期刊为冲高影响因子,刻意规避冷门但有重大创新价值的研究。
东壁指数则跳出这一框架,采用“种子期刊引文追溯+引文网络层级结构分级”的原创方法,首次为学术期刊增加“质量分级”维度,通过追溯领域内公认的“种子期刊”(即学科奠基性期刊)引文关系,再按引文网络的层级判断研究的原创性与影响力,最终筛选出的文献,更能反映学术界真实的权威认知。
据介绍,东壁指数的数据基础包括其自主采集和整理的超过1亿条全球自然科学领域主要学术期刊的元数据。

2025年1月东壁指数发布后,迅速获得国际学术界关注。
同年3月,中国科协在官方平台发表评论员文章,将其称为“中国争取学术话语权的标志性事件”,认为这套体系打破了欧美在学术评价领域的单一标准垄断。
当前,东壁指数并非“闭门造车”,其覆盖全球全学科的顶级期刊列表,已被全球多个国家的科研机构参考,部分欧洲高校甚至将其作为博士论文发表的重要依据,这为后续国际合作埋下了伏笔。
有了自主评价标准,东壁数据进一步搭建起 “全球科技文献数据平台”。2025年7月,在2025全球数字经济大会上,该平台由东壁数据与联合国工业发展组织联合发布,一上线便引发关注,平台收录全球近1亿条高质量科技文献元数据,涵盖从17世纪科学革命时期到2025年的核心研究成果,且所有基础功能对全球用户免费开放,包括文献检索、引文分析、学者成果追踪等。
更具突破性的是,平台还嵌入“学者成果解读”、“综述自动生成”两大AI能力,能为科研人员自动梳理某一领域的研究脉络,将原本需要数月的综述撰写时间缩短至数小时。
数据显示,上线三个月,该平台便吸引全球超百万次访问,其中不仅有中国科学院、清华大学等国内机构,还包括麻省理工学院、剑桥大学等国际顶尖高校的科研团队。

这背后的逻辑很清晰,相比传统西方数据库动辄数万美元的年度订阅费,东壁平台的免费基础服务降低了全球科研的门槛。而基于东壁指数筛选的高质量文献,又避免了用户在海量低质数据中“淘金”的成本。平台的数据采集、加工、存储均由东壁数据自主完成,完全摆脱对西方数据库的依赖,这在国际科技竞争日益激烈的背景下,为中国科研数据安全筑起了“防火墙”。
此次与泰勒-弗朗西斯的合作,进一步补齐东壁数据的“短板”。
作为国际学术出版领域的巨头,泰勒-弗朗西斯拥有2700余种学术期刊、累计近20万种图书,覆盖理工农医、人文社科全学科,其核心优势在于英文科技文献的深度与广度,尤其是在材料科学、生物医药等前沿领域,该集团旗下期刊发表的研究成果占全球相关领域的35%以上。
根据协议,东壁数据不仅能使用其期刊元数据(包括论文标题、作者、摘要、引文网络等核心信息),还将联合拓展科技与医学期刊全文数据库的企业访问渠道,甚至共同推进“JAB 科技图书出版”业务。这意味着,中国科研人员未来可通过东壁数据,直接获取泰勒-弗朗西斯旗下期刊的全文,而东壁指数也将纳入该集团的优质期刊,形成双向赋能。
这场合作的深层意义,或许要放在中文与英文科技语料库的长期失衡中审视。
数据显示,互联网上的中英文语料占比存在明显差异,英文内容占比高达59.8%,而中文仅占1.3%。长期以来,国内AI大模型研发面临两大语料痛点:一是中文科技语料碎片化,高校、科研院所的数据库各自为战,缺乏统一的质量标准,导致AI模型难以获取连贯的研究脉络;二是高质量英文科技语料严重依赖进口,此前国内企业若想获取泰勒-弗朗西斯、爱思唯尔等集团的核心数据,不仅需支付高额费用,还可能面临“数据使用范围限制”。
这种依赖直接导致国内大模型在垂直科技领域“先天不足”。东壁数据的出现,此次引入泰勒-弗朗西斯的英文数据后,东壁数据将形成“中文+英文”的全球均衡语料结构,覆盖从基础科学到应用技术的全链条。更关键的是,这些数据均获得合法的AI训练授权,彻底解决了国内企业“想用不敢用”的合规痛点。
AI大模型的性能,本质上取决于“语料质量×数据量”,低质量语料即便规模庞大,也只会增加模型幻觉,而高质量语料能让模型在更小的数据量下实现更高的准确性。
2025年,东壁科技与中科微光合作,利用其科技文献语料训练出中国首款心血管AI-OCT大模型“麒光”,该模型能在秒级内完成心脏介入手术影像的判读,帮助医生精准拟定治疗方案。
同年12月,广东省人民医院团队借助“麒光”,成功攻克慢性完全闭塞病变(CTO),患者远期临床预后良好。

而随着泰勒-弗朗西斯英文语料的加入,类似的垂直领域大模型,未来可快速拓展至肿瘤治疗、新能源材料等更多领域,推动国内AI从“通用型”向“高精尖”转型。
我们认为,此次东壁数据拿到国际机构数据授权,并非简单的“引进来”,更是中国科技标准“走出去”的开始。
泰勒-弗朗西斯之所以选择东壁,不仅看中其平台的全球影响力,更认可东壁指数的学术价值,双方合作的JAB科技图书出版业务,将首次采用东壁指数筛选优质学术成果,这意味着中国自主的学术评价标准,将通过国际出版渠道影响全球科研方向。
对于中国科创企业而言,东壁数据的路径更具借鉴意义,在科技竞争日益聚焦“数据与标准”的当下,单纯的技术追赶已不够,必须构建自主标准、核心数据以及生态合作的完整体系。东壁数据从研发东壁指数,到搭建自主数据平台,再到吸引国际出版集团合作,每一步都围绕“掌握话语权”展开,最终实现质的突破。
我们期待国内更多企业加入科技数据生态建设。当我国自主的学术标准与全球顶尖的文献数据深度融合,不仅能为国内科技创新注入新动能,更能推动全球科技资源的均衡分配,这或许就是东壁数据此次国际合作,留给市场最深刻的思考。




















评论 0