信息通信技术与政策

信息通信技术与政策

信息通信技术与政策 ›› 2026, Vol. 52 ›› Issue (5): 10-15.doi: 10.12267/j.issn.2096-5931.2026.05.002

专题:高质量数据集 上一篇    下一篇

企业高质量数据集建设运营路径研究

Research on the construction and operation path of enterprise-level high-quality datasets

白玉真, 杨靖世, 袁博, 王思佳, 贾轩, 王思源   

  1. 中国信息通信研究院人工智能研究所, 北京 100191
  • 收稿日期:2026-04-07 出版日期:2026-05-25 发布日期:2026-05-28
  • 作者简介:
    白玉真,中国信息通信研究院人工智能研究所高级工程师,主要从事数据流通、高质量数据集方面的研究工作
    杨靖世,中国信息通信研究院人工智能研究所工程师,主要从事可信数据空间、高质量数据集方面的研究工作
    袁博,中国信息通信研究院人工智能研究所大数据与智能化部副主任,高级工程师,主要从事数字经济、大数据、数据流通、数据基础设施方面的研究工作
    王思佳,中国信息通信研究院人工智能研究所工程师,主要从事人工智能、高质量数据集、数据要素、数据应用方面的研究工作
    贾轩,中国信息通信研究院人工智能研究所高级工程师,主要从事数据基础设施、数据流通方面的研究工作
    王思源,中国信息通信研究院人工智能研究所工程师,主要从事隐私计算、数据基础设施方面的研究工作

BAI Yuzhen, YANG Jingshi, YUAN Bo, WANG Sijia, JIA Xuan, WANG Siyuan   

  1. Artificial Intelligence Institute, China Academy of Information and Communications Technology, Beijing 100191, China
  • Received:2026-04-07 Online:2026-05-25 Published:2026-05-28

摘要:

高质量数据集已成为支撑人工智能发展和行业智能化转型的关键基础。基于此,首先分析了高质量数据集的概念与发展现状;其次针对不同类型的数据集剖析了其建设需求与核心问题;再次对企业高质量数据建设过程的关键环节和建设路径展开了研究,并针对医疗、能源、工业行业的高质量数据集建设路径进行了分析;最后探讨了高质量数据集的未来发展趋势。

关键词: 高质量数据集, 人工智能, 数据工程

Abstract:

High-quality datasets have become a critical foundation for supporting the development of artificial intelligence and the intelligent transformation of industries. Based on this, the study first analyzes the concept and current development status of high-quality datasets. Secondly, it examines the construction requirements and core issues of different types of datasets. Thirdly, it investigates key stages and pathways in the process of building enterprise-level high-quality datasets, analyzing the construction approaches for high-quality datasets in the healthcare, energy, and industrial sectors. Finally, it explores future development trends of high-quality datasets.

Key words: high-quality datasets, AI, data engineering

中图分类号: