基于标准数据集的深度学习目标检测算法溯源技术研究*

doi:10.12267/j.issn.2096-5931.2026.05.007

信息通信技术与政策 ›› 2026, Vol. 52 ›› Issue (5): 50-57.doi: 10.12267/j.issn.2096-5931.2026.05.007

基于标准数据集的深度学习目标检测算法溯源技术研究^*

Research on traceability techniques for deep learning algorithms based on standard datasets

胡天洋, 孙小强, 陈龙泉, 张大元

中国信息通信研究院泰尔系统实验室, 北京 100191

收稿日期:2026-03-31 出版日期:2026-05-25 发布日期:2026-05-28
通讯作者: 孙小强
作者简介:
胡天洋，中国信息通信研究院泰尔系统实验室助理工程师,主要从事人工智能计量、具身智能、脑机接口等方面的研究工作
陈龙泉，中国信息通信研究院泰尔系统实验室高级工程师,主要从事人工智能与通信计量测试等方面的研究工作
张大元，中国信息通信研究院泰尔系统实验室正高级工程师,主要从事通信计量测试和测量仪器开发等方面的研究工作
基金资助:
* 国家重点研发计划项目(2022YFFO605903)

HU Tianyang, SUN Xiaoqiang, CHEN Longquan, ZHANG Dayuan

CTTL System Laboratory, China Academy of Information and Communications Technology, Beijing 100191, China

Received:2026-03-31 Online:2026-05-25 Published:2026-05-28
Contact: SUN Xiaoqiang

摘要/Abstract

摘要：

针对深度学习目标检测算法可解释性不足导致的输出量值缺乏有效计量评价方法的难题,从计量学视角构建算法溯源技术体系。以合成孔径雷达(Synthetic Aperture Radar,SAR)图像舰船检测为典型应用场景,明确算法溯源的定义与不确定度来源,提出基于标准数据集的溯源技术路径及连续比较链;面向算法溯源的计量要求,建立标准数据集的质量评估指标体系与标准化测试方法。研究实现了SAR图像舰船检测算法输出的定量评价与量值溯源,可为人工智能算法可信评测提供基准支撑,对推动标准化评测体系建设具有重要意义。

关键词: 算法溯源, 标准数据集, 深度学习, 质量评估

Abstract:

To address the challenge of lacking effective metrological evaluation methods for the output values of deep learning object detection algorithms due to their lack of interpretability, this study constructs a technical framework for algorithm traceability from a metrological perspective. Using ship detection in Synthetic Aperture Radar (SAR) images as a typical application scenario, the definition and uncertainty sources of algorithm traceability are clarified, and a traceability technical path based on standard datasets together with a continuous comparison chain is proposed. To meet the metrological requirements of algorithm traceability, a quality evaluation indicator system and standardized testing methods for standard datasets are established. This study has achieved quantitative evaluation and traceability of the performance metrics generated by SAR image-based ship detection algorithms. It provides a benchmark for the reliable evaluation of artificial intelligence algorithms and is of great significance for advancing the development of a standardized evaluation system.

Key words: algorithm traceability, standard datasets, deep learning, quality assessment

中图分类号:

TP301.6

胡天洋, 孙小强, 陈龙泉, 张大元. 基于标准数据集的深度学习目标检测算法溯源技术研究^*[J]. 信息通信技术与政策, 2026, 52(5): 50-57.

HU Tianyang, SUN Xiaoqiang, CHEN Longquan, ZHANG Dayuan. Research on traceability techniques for deep learning algorithms based on standard datasets[J]. Information and Communications Technology and Policy, 2026, 52(5): 50-57.

导出引用管理器 EndNote|Ris|BibTeX

链接本文:

http://ictp.caict.ac.cn/CN/10.12267/j.issn.2096-5931.2026.05.007

http://ictp.caict.ac.cn/CN/Y2026/V52/I5/50

图/表 3

参考文献 13

[1]	崔伟群. 计量器具软件测评体系研究[J]. 中国计量, 2010, 174(5):68-69.
[2]	窦晨, 周自力. 数字世界计量的重要性及计量的发展方向探析[J]. 计量科学与技术, 2022, 66(9):70-73.
[3]	THIEL F. Digital transformation of legal metrology-the European metrology cloud[J]. OIML Bulletin, 2018, 59(1):10-21.
[4]	黄琼男, 朱卫纲, 李永刚. SAR图像舰船目标检测数据集构建研究综述[J]. 电讯技术, 2021, 61(11):1451-1458.
[5]	王亭亭, 崔伟群. 算法溯源简述[J]. 计量科学与技术, 2023, 67(5):23-30.
[6]	田锋, 智峰, 赵若凡. 社会公用计量标准数据集[J]. 中国科学数据(中英文网络版), 2022, 7(1):70-73.
[7]	李东升, 郭天太. 量值传递与溯源[M]. 杭州: 浙江大学出版社, 2009.
[8]	REN S, HE K, GIRSHICK R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6):1137-1149. doi: 10.1109/TPAMI.2016.2577031 pmid: 27295650
[9]	REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[J]. arXiv Preprint, arXiv: 1506.02640, 2016.
[10]	ZHANG T, ZHANG X, LI J, et al. SAR Ship Detection Dataset (SSDD): official release and comprehensive data analysis[J]. Remote Sensing, 2021, 13(18):3690. doi: 10.3390/rs13183690 URL
[11]	上海工程技术大学. 一种基于工业智能模型的质量溯源系统及方法:CN202410130156.5[P]. 2024-04-26.
[12]	魏晨曦. 基于深度学习的SAR图像舰船目标检测方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2023.
[13]	匡纲要, 高贵, 咏梅. 合成孔径雷达目标检测理论、算法及应用[M]. 长沙: 国防科技大学出版社, 2007.

核心维度	一级指标	二级指标	指标定义	计算方法	优质阈值
数据基础质量	完整性	场景覆盖完整率	数据集覆盖的算法实际应用场景数与目标场景数的比值	覆盖场景数÷目标场景数×100%	≥95%
	完整性	样本属性完整率	样本计量相关属性完整数与总属性数的比值	完整属性数÷总属性数×100%	≥99%
	有效性	有效数据率	剔除异常值、无效数据后的有效样本数与总样本数的比值	有效样本数÷总样本数×100%	≥98%
	有效性	噪声去除率	去噪后数据噪声强度的降低比例	(去噪前噪声强度-去噪后噪声强度)÷去噪前噪声强度×100%	≥90%
	规范性	格式统一率	符合行业计量与数据标准的样本数与总样本数的比值	标准化样本数÷总样本数×100%	100%
标注质量	准确性	标注准确率	标注正确的样本数与总标注样本数的比值	正确标注数÷总标注数×100%	≥99%
	准确性	边界框IoU 均值	标注边界框与标准参考边界框的交并比算术平均值	所有样本IoU值之和÷样本总数	≥0.95
	一致性	标注者 Kappa系数	多标注者对同一批样本的标注一致性量化指标	基于多标注者判定结果按Kappa 公式计算	≥0.90
	完整性	标注覆盖率	完成标注的样本数与应标注样本数的比值	已标注数÷应标注数×100%	100%
不确定度管控质量	量化率	数据不确定度量化率	完成数据不确定性量化的样本数与总样本数的比值	量化样本数÷总样本数×100%	100%
	量化率	标注不确定度量化率	完成标注不确定性量化的样本数与总样本数的比值	量化样本数÷总样本数×100%	100%
	传递性	不确定度传递率	数据集不确定性向算法输出传递的比例	算法输出不确定度中数据集贡献的比例	≤30%

核心维度	一级指标	二级指标	指标定义	计算方法	优质阈值
数据基础质量	完整性	场景覆盖完整率	数据集覆盖的算法实际应用场景数与目标场景数的比值	覆盖场景数÷目标场景数×100%	≥95%
	完整性	样本属性完整率	样本计量相关属性完整数与总属性数的比值	完整属性数÷总属性数×100%	≥99%
	有效性	有效数据率	剔除异常值、无效数据后的有效样本数与总样本数的比值	有效样本数÷总样本数×100%	≥98%
	有效性	噪声去除率	去噪后数据噪声强度的降低比例	(去噪前噪声强度-去噪后噪声强度)÷去噪前噪声强度×100%	≥90%
	规范性	格式统一率	符合行业计量与数据标准的样本数与总样本数的比值	标准化样本数÷总样本数×100%	100%
标注质量	准确性	标注准确率	标注正确的样本数与总标注样本数的比值	正确标注数÷总标注数×100%	≥99%
	准确性	边界框IoU 均值	标注边界框与标准参考边界框的交并比算术平均值	所有样本IoU值之和÷样本总数	≥0.95
	一致性	标注者 Kappa系数	多标注者对同一批样本的标注一致性量化指标	基于多标注者判定结果按Kappa 公式计算	≥0.90
	完整性	标注覆盖率	完成标注的样本数与应标注样本数的比值	已标注数÷应标注数×100%	100%
不确定度管控质量	量化率	数据不确定度量化率	完成数据不确定性量化的样本数与总样本数的比值	量化样本数÷总样本数×100%	100%
	量化率	标注不确定度量化率	完成标注不确定性量化的样本数与总样本数的比值	量化样本数÷总样本数×100%	100%
	传递性	不确定度传递率	数据集不确定性向算法输出传递的比例	算法输出不确定度中数据集贡献的比例	≤30%

基于标准数据集的深度学习目标检测算法溯源技术研究^*

Research on traceability techniques for deep learning algorithms based on standard datasets

RichHTML

PDF

可视化

摘要/Abstract

引用本文

使用本文

图/表 3

参考文献 13

相关文章 13

编辑推荐

Metrics

本文评价

[1]	王天舟, 张华, 刘奇申, 黄超. 深度学习与大模型技术在北京中轴线实景重建中的应用[J]. 信息通信技术与政策, 2024, 50(12): 82-88.
[2]	王强, 李家红. 进化深度学习在工业园区能源管理中的应用场景创新研究[J]. 信息通信技术与政策, 2024, 50(10): 91-96.
[3]	李静雯, 王令珑, 赵阳光, 崔伟男. 机器学习在眼科疾病辅助诊疗中的应用及监管^*[J]. 信息通信技术与政策, 2023, 49(9): 87-91.
[4]	曾汉, 徐晓青, 钱刘熠辉, 武娟. 深度学习在IP网络优化中的应用[J]. 信息通信技术与政策, 2023, 49(7): 89-96.
[5]	李硕, 刘天源, 黄锋, 解鑫, 张金义. 工业互联网中数字孪生系统的机理+数据融合建模方法[J]. 信息通信技术与政策, 2022, 48(10): 52-61.
[6]	陈磊, 李雅静. 人工智能系统安全综述*[J]. 信息通信技术与政策, 2021, 47(8): 56-63.
[7]	李晓民. 基于5G 边缘计算的深度学习架构与应用[J]. 信息通信技术与政策, 2021, 47(4): 93-96.
[8]	胡家熙. 基于深度学习辅助波束管理与5G 网络容量优化[J]. 信息通信技术与政策, 2020, 46(9): 91-96.
[9]	黄盼, 王琼. 移动终端人工智能发展现状与趋势研究[J]. 信息通信技术与政策, 2019, 45(9): 53-56.
[10]	刘姿杉. 深度学习在物理层信号处理中的应用研究[J]. 信息通信技术与政策, 2019, 45(7): 57-61.
[11]	许慕鸿. 安防人脸识别技术及测试方法研究[J]. 信息通信技术与政策, 2019, 45(5): 75-82.
[12]	高原原, 马超, 潘博文. 视觉物联网中图像去雾方法研究综述与展望*[J]. 信息通信技术与政策, 2019, 45(4): 6-11.
[13]	黄伟. 计算机视觉技术及产业化应用态势分析[J]. 信息通信技术与政策, 2018, 44(9): 59-62.