信息通信技术与政策

信息通信技术与政策

信息通信技术与政策 ›› 2026, Vol. 52 ›› Issue (5): 58-68.doi: 10.12267/j.issn.2096-5931.2026.05.008

专题:高质量数据集 上一篇    下一篇

大语言模型伦理评估中文数据集研究综述*

A review of research on Chinese datasets for ethical evaluation of large language models

田小雨1, 李文宇2, 毕春丽2, 付娜2, 张蕾蕾2   

  1. 1 电信科学技术研究院, 北京 100191
    2 中国信息通信研究院知识产权与创新发展中心, 北京 100191
  • 收稿日期:2026-01-25 出版日期:2026-05-25 发布日期:2026-05-28
  • 作者简介:
    田小雨,电信科学技术研究院硕士研究生在读,主要研究方向为人工智能伦理、大语言模型伦理评估等
    李文宇,中国信息通信研究院知识产权与创新发展中心主任,正高级工程师,工学博士,主要研究方向为未来产业与新兴产业关键技术与发展路径、知识产权、政策法律、信息通信核心技术和标准、产业创新与企业合规治理等
    毕春丽,中国信息通信研究院知识产权与创新发展中心副主任,主要研究方向为知识产权战略、标准必要专利、企业知识产权管理等
    付娜,中国信息通信研究院知识产权与创新发展中心高级经济师,主要研究方向为信息通信领域知识产权管理、开源知识产权风险防控等
    张蕾蕾,中国信息通信研究院知识产权与创新发展中心工程师,法学博士,主要研究方向为人工智能伦理、知识产权、标准必要专利、数据等
  • 基金资助:
    * 2025年湖南省重大科技攻关项目(2025QK2009)

TIAN Xiaoyu1, LI Wenyu2, BI Chunli2, FU Na2, ZHANG Leilei2   

  1. 1 China Academy of Telecommunication Technology, Beijing 100191, China
    2 Intellectual Property and Innovation Development Center, China Academy of Information and Communications Technology, Beijing 100191, China
  • Received:2026-01-25 Online:2026-05-25 Published:2026-05-28

摘要:

大语言模型作为人工智能领域的前沿成果,其相关伦理问题备受学界与业界重视,中文语境下的大语言模型伦理评估数据集也随之逐步增多,具备深入研究价值。然而,当前缺乏对这类数据集的系统性梳理与分析,导致研究人员难以精准筛选适配数据集,也无法有效识别现有资源的短板。以2021年8月至2025年3月期间发布的50个中文大语言模型伦理评估数据集为研究对象,从数据集发布时间、创建信息、内容信息、开源情况、涉及领域、伦理场景等方面开展全面对比分析,为后续数据集优化与构建提供方向。

关键词: 大语言模型, 伦理评估, 中文数据集

Abstract:

As cutting-edge achievements in the field of artificial intelligence, large language models have drawn significant attention from both academia and industry regarding their associated ethical issues. Consequently, the number of ethical evaluation datasets for large language models in the Chinese context has gradually increased, presenting substantial value for in-depth research. However, the current lack of systematic review and analysis of such datasets makes it difficult for researchers to accurately select suitable datasets and effectively identify shortcomings in existing resources. This paper examines 50 Chinese ethical evaluation datasets for large language models released between August 2021 and March 2025. It conducts a comprehensive comparative analysis covering release dates, creation details, content information, open-source situation, domains covered, and ethical scenarios. This study aims to provide direction for optimizing and constructing future datasets.

Key words: large language models, ethical evaluation, Chinese datasets

中图分类号: