摘要: 基于“教师-学生”模型,提出了一种数据集半自动标注方法,解决了监督学习中数据集人工标注工作量大,数据质量不一和专业门槛高的问题。在云端试验中,利用该标注方法,一方面实现了对时钟同步模式分类数据的半自动标注,一方面实现了对数据集的难易程度的自动评估,可用于指导机器学习模型的优化与测评。
吕博. 一种机器学习数据集半自动标注方法研究*[J]. 信息通信技术与政策, 2019, 45(7): 44-50.
LYU Bo. Research on a semi-automatic labeling method for machine learning data sets[J]. Information and Communications Technology and Policy, 2019, 45(7): 44-50.