信息通信技术与政策

信息通信技术与政策

信息通信技术与政策 ›› 2026, Vol. 52 ›› Issue (2): 36-43.doi: 10.12267/j.issn.2096-5931.2026.02.006

专题:算力互联网技术发展与产业应用 上一篇    下一篇

基于动态时延感知的广域分布式算力调度技术研究

Research on dynamic latency-aware scheduling for wide-area distributed computing

林观康1, 邓伟正1, 沈增涛1, 杨任1, 桑柳2, 赵伟博2   

  1. 1.联通数字科技有限公司云计算事业部,北京 100080
    2.中国信息通信研究院云计算与数字化研究所,北京 100191
  • 收稿日期:2026-01-05 出版日期:2026-02-25 发布日期:2026-03-06
  • 作者简介:
    林观康, 中国联通数字科技有限公司智算产品研发团队P3总监,主要从事智算、分布式产品、技术等方面的研发管理工作
    邓伟正, 中国联通数字科技有限公司智算产品研发工程师,主要从事智算、分布式产品、技术等方面研发工作
    沈增涛, 中国联通数字科技有限公司智算产品研发工程师,主要从事智算、分布式产品、技术等方面研发工作
    杨任, 中国联通数字科技有限公司智算产品研发工程师,主要从事智算、分布式产品、技术等方面研发工作
    桑柳, 中国信息通信研究院云计算与数字化研究所工程师,主要从事云计算、网络等方面研究工作
    赵伟博, 中国信息通信研究院云计算与数字化研究所工程师,主要从事云计算、网络等方面研究工作

LIN Guankang1, DENG Weizheng1, SHEN Zengtao1, YANG Ren1, SANG Liu2, ZHAO Weibo2   

  1. 1. Cloud Computing Division,China Unicom Digital Technology Co.,Ltd.,Beijing 100080,China
    2. Cloud Computing and Digitalization Research Institute,China Academy of Information and Communications Technology,Beijing 100191,China
  • Received:2026-01-05 Online:2026-02-25 Published:2026-03-06

摘要:

针对现有广域分布式算力调度忽视骨干网动态时延和故障影响的问题,提出基于动态时延感知调度(Dynamic Latency-Aware Scheduling,DLAS)的技术。该技术通过30 s周期探测骨干网时延,结合智能故障检测与自适应迁移策略,可实现更优的路由决策和高可用保障。建立时延优化数学模型,理论证明可降低平均时延35%~50%,缩短故障恢复时间至分钟级。试验表明,DLAS的算力服务响应时延相比传统轮询调度降低42.3%,相比静态地理调度降低28.7%,服务可靠性提升至99.95%以上,可为构建高效可靠的分布式算力网络提供理论与实践指导。

关键词: 分布式算力网络, 算力调度, 时延感知, 故障检测, 自适应迁移

Abstract:

To address the problem that existing wide-area distributed computing power scheduling,a technology based on dynamic latency-aware scheduling (DLAS) is proposed. This technology detects backbone network latency through a 30 second cycle,combined with intelligent fault detection and adaptive migration strategies,to achieve better routing decisions and high availability guarantees. Establish a delay optimization mathematical model,which has been theoretically proven to reduce the average delay by 35% to 50% and shorten the fault recovery time to the minute level. Experiments have shown that the dynamic latency aware scheduling of DLAS reduces the response latency of computing power services by 42.3% compared to traditional polling scheduling,28.7% compared to static geographic scheduling,and improves service reliability to over 99.95%. This can provide theoretical and practical guidance for constructing efficient and dependable distributed computing power networks.

Key words: distributed computing power network, computing power scheduling, time delay perception, fault detection, adaptive migration

中图分类号: