近日,国家数据集管理服务平台正式发布并启动试运行,标志着我国高质量数据集建设工作迈入集约化管理新阶段。


国家数据集管理服务平台由国家数据局指导、国家数据发展研究院建设和运营,以数据集目录汇聚为基础,构建“物理分散、逻辑集中”的数据集管理体系,提供覆盖数据集全生命周期的公共服务能力,支持供需对接发布、全域精准检索、合规凭证申领等多元功能,着力打通高质量数据供给链路,激活数据要素流通、繁荣数据产业生态。截至当前,平台已上线发布数据集1150个,认证合规供需主体356家。

1. 供需对接全流程管理:为数据集供给方提供合规权威的发布渠道,为需求方提供统一规范的获取路径,打通了不同主体间数据集合规流通、复用的对接链路
2. 统一目录汇聚管理:以数据集目录汇聚为基础,构建了“物理分散、逻辑集中”的创新管理体系,整合分散在各领域、各机构的存量数据集资源,形成全国统一的数据集资源索引,支持多源数据集的统一检索、分类导航。
3. 全生命周期公共服务:覆盖数据集从注册汇交、审核标定、发布共享、迭代更新到长期归档、引用溯源的全流程,可为公共部门、科研机构、市场主体提供标准化的数据集管理支撑。

1. 数据集“信息孤岛”:过去我国数据集资源分散存储在各机构、各区域,没有统一的资源索引,需求方找数成本高,平台通过逻辑集中的目录体系打造了全国数据集“一本账”,大幅降低了数据发现的门槛。
2. 数据集管理不规范:以往大量数据集缺乏标准化管理,普遍存在质量参差不齐、元数据不规范等问题,平台的全生命周期服务统一了管理规范,从源头助力提升数据集质量。
3. 高质量数据集供给不足:此前优质数据集缺乏权威公共的流通渠道,供需对接不畅,导致沉淀数据无法发挥价值、市场的高质量数据需求得不到满足等问题,平台作为公共枢纽打通了供需链路,推动扩大高质量数据集有效供给,培育繁荣数据产业生态。