信息通信技术与政策

信息通信技术与政策

信息通信技术与政策 ›› 2026, Vol. 52 ›› Issue (2): 44-52.doi: 10.12267/j.issn.2096-5931.2026.02.007

专题:算力互联网技术发展与产业应用 上一篇    下一篇

基于分布式算力互联的大模型后训练成本优化技术综述

A review of post-training cost optimization technology for large language models based on distributed computing optimization

宁柯宇1, 马飞2, 李哲2, 董晓慧2   

  1. 1.电信科学技术研究院,北京 100191
    2.中国信息通信研究院云计算与数字化研究所,北京 100191
  • 收稿日期:2026-01-13 出版日期:2026-02-25 发布日期:2026-03-06
  • 通讯作者: 马飞 中国信息通信研究院云计算与数字化研究所云计算部主任、高级工程师,主要从事云计算领域的政府支撑、行业研究、标准制定、测试评估等工作
  • 作者简介:
    宁柯宇, 电信科学技术研究院硕士研究生在读,主要从事大语言模型、智能体互联等方面研究工作
    李哲, 中国信息通信研究院云计算与数字化研究所云计算部副主任、高级工程师,主要从事云计算、AI云大模型工程化、行业云平台等方面研究工作
    董晓慧, 中国信息通信研究院云计算与数字化研究所云计算部工程师,主要从事云计算、AI云大模型工程化、云成本优化等方面研究工作

NING Keyu1, MA Fei2, LI Zhe2, DONG Xiaohui2   

  1. 1. Telecommunications Science and Technology Research Institute,Beijing 100191,China
    2. Cloud Computing and Digitalization Research Institute,China Academy of Information and Communications Technology,Beijing 100191,China
  • Received:2026-01-13 Online:2026-02-25 Published:2026-03-06

摘要:

在算力互联网加速发展的背景下,大语言模型后训练阶段的算力成本持续攀升,已成为制约技术普惠化的关键瓶颈。首先,通过系统性梳理后训练成本优化技术体系,结合算力互联网的跨域协同特性构建降低算力、存储与数据开销的综合框架;其次,对现有主流技术的局限性进行分析,并总结该领域的演进趋势,探讨分布式算力互联环境下大模型后训练成本优化技术的新方向。

关键词: 算力互联网, 大语言模型, 后训练, 成本优化

Abstract:

Amidst the rapid development of the Internet of computing,escalating computational costs during the post-training phase of large language models (LLMs) have become a critical bottleneck hindering widespread technology adoption. First,by systematically organizing and training cost optimization technology system,a comprehensive framework is constructed to reduce computational,storage,and data overheads,leveraging the cross-domain collaboration characteristics of the computing power internet. Second,the limitations of existing mainstream techniques are analyzed,and the evolution trends in this field are summarized to explore new directions for post-training cost optimization techniques of large models in distributed computing power interconnection environments.

Key words: internet of computing, large language models, post-training, cost optimization.

中图分类号: