信息通信技术与政策

信息通信技术与政策

信息通信技术与政策 ›› 2025, Vol. 51 ›› Issue (10): 7-13.doi: 10.12267/j.issn.2096-5931.2025.10.002

专题:先进计算创新应用与生态建设 上一篇    下一篇

基于本地算力基座的RAG-大模型融合物料主数据治理研究

Research on material master data governance based on the integration of large language models and RAG technology with local computing infrastructure

苏成金1, 黄伟2, 王骏成2, 傅韵2, 杨东旭3   

  1. 1 国家能源集团物资有限公司, 北京 102200
    2 中国信息通信研究院信息化与工业化融合研究所, 北京 100191
    3 信通院(青岛)科技创新中心有限公司, 青岛 266100
  • 收稿日期:2025-09-15 出版日期:2025-10-25 发布日期:2025-11-06
  • 作者简介:
    苏成金, 国家能源集团物资有限公司业务管理部主任、数据科技董事长,主要从事能源行业物资采购的数字化转型与电子商务平台研究管理工作
    黄伟, 中国信息通信研究院信息化与工业化融合研究所副所长,高级工程师,全国智能计算标准化工作组委员、全国网络文化标准化技术委员会委员,主要从事先进计算、集成电路、ICT产业链等领域的研究工作
    王骏成, 中国信通院信息化与工业化融合研究所先进计算研究部主任,高级工程师,中国人工智能产业发展联盟芯片工作组组长,长期从事先进计算、集成电路、人工智能芯片等领域的研究工作
    傅韵, 中国信息通信研究院信息化与工业化融合研究所工程师,主要从事人工智能应用领域的研究工作
    杨东旭, 信通院(青岛)科技创新中心有限公司工程师,主要从事人工智能应用领域的研究工作

SU Chengjin1, HUANG Wei2, WANG Juncheng2, FU Yun2, YANG Dongxu3   

  1. 1 National Energy Group Materials Co., Ltd., Beijing 102200, China
    2 Informatization and Industrialization Integration Research Institute, China Academy of Information and Communications Technology, Beijing 100191, China
    3 Information and Communication Institute (Qingdao) Technology Innovation Center Co., Ltd., Qingdao 266100, China
  • Received:2025-09-15 Online:2025-10-25 Published:2025-11-06

摘要:

物料主数据作为企业数字化转型的核心基础数据,其治理质量直接影响企业运营效率和决策准确性。传统物料主数据治理方法在面对海量、多源的物料数据时,普遍存在自动化程度低、处理效率不高、治理成本高等问题。为解决上述问题,结合国家能源集团物资公司的业务实际,提出了一种基于大模型与检索增强生成技术的物料主数据治理方案。该方案以本地算力架构为基础,设计了清晰的技术实施路径,并构建了包含算力基座层、模型层、数据层和应用能力中枢层的四层技术架构,实现了存量物料重复数据识别、智能分类推荐和特征参数校验三大核心功能。在具体数据治理场景下,该方案显著提升了数据治理的准确率与处理效率,同时有效控制了治理成本,为企业数字化转型提供了坚实的技术支撑,并推动主数据管理向着智能化、自动化的未来趋势迈进。

关键词: 物料主数据, 大模型, 增强检索生成, 智能分类, 数据治理

Abstract:

As the cornerstone of enterprise digital transformation, the governance quality of Material Master Data (MMD) directly impacts an enterprise’s operational efficiency and decision-making accuracy. When dealing with massive and heterogeneous datasets, traditional MMD governance methods generally face challenges like low automation, inefficiency, and high governance costs. To address these problems, this paper proposes an innovative framework integrating large language models and retrieval-augmented generation technology, conjunction with the actual business context of National Energy Group Materials Co., Ltd... Built on a local computing architecture, the framework designs a clear technical implementation path and establishes a four-tier technical architecture, including computing infrastructure layer, model layer, data layer, and application capability hub layer. It achieves three core functions: duplicate detection for legacy materials, intelligent classification with context-aware recommendations, and automated parameter validation. In specific data governance scenarios, the solution significantly improves the accuracy rate and processing efficiency of data governance while effectively controlling governance costs. It provides solid technical support for the enterprise’s digital transformation and aligns with the future trend of MMD management towards intelligence and automation.

Key words: material master data, large language model, retrieval-augmented generation, data governance, intelligent classification

中图分类号: