信息通信技术与政策

信息通信技术与政策

信息通信技术与政策 ›› 2024, Vol. 50 ›› Issue (2): 26-32.doi: 10.12267/j.issn.2096-5931.2024.02.005

专题:综合算力 上一篇    下一篇

运营商大模型硬件基础设施创新及RDMA流量控制技术研究

Research on hardware infrastructure innovation for large language model of telecom operators and RDMA traffic control technology

车碧瑶1, 张永航2, 廖怡2, 唐剑2, 樊小平2, 赵继壮1, 陆钢1   

  1. 1.中国电信股份有限公司研究院,北京 102209
    2.中国电信天翼云科技有限公司,北京 100007
  • 收稿日期:2023-12-26 出版日期:2024-02-25 发布日期:2024-03-12
  • 作者简介:
    车碧瑶, 中国电信股份有限公司研究院云网运营技术研究所助理工程师,主要从事RDMA高性能网络方向的研究工作
    张永航, 中国电信天翼云科技有限公司研发专家,长期从事RDMA高性能网络的设计和研究工作
    廖怡, 中国电信天翼云科技有限公司研发专家,主要从事RDMA网络架构、协议、拥塞控制算法、智能网卡和DPU相关的研究工作
    唐剑, 中国电信天翼云科技有限公司研发工程师,主要从事高性能网络方向的研发工作
    樊小平, 中国电信天翼云科技有限公司资深专家,主要从事高性能网络方向的研究工作
    赵继壮, 中国电信股份有限公司研究院云网运营技术研究所云计算研究中心总监,高级工程师,主要从事云计算和高性能计算的软硬件优化等方面的研究工作
    陆钢, 中国电信股份有限公司研究院云网运营技术研究所副所长,教授级高级工程师,长期从事云计算技术研发与应用方面的研究工作

CHE Biyao1, ZHANG Yonghang2, LIAO Yi2, TANG Jian2, FAN Xiaoping2, ZHAO Jizhuang1, LU Gang1   

  1. 1. China Telecom Corporation Limited Research Institute, Beijing 102209, China
    2. China Telecom Cloud Technology Co., Ltd., Beijing 100007, China
  • Received:2023-12-26 Online:2024-02-25 Published:2024-03-12

摘要:

从业界大模型硬件基础设施创新的主要模式出发,论述了电信运营商在该领域自主创新的路线选择考虑。基于实际组网环境和业务场景提出需求,设计了一种支持NO-PFC、交换机免配置的拥塞控制算法,使用RTT作为拥塞感知信号,控制交换机队列长度,实现低延迟。

关键词: RDMA拥塞控制, 大模型基础设施创新, 运营商数据中心网络

Abstract:

Based on the main modes of hardware infrastructure innovation for large language model in the industry, this paper explores the considerations for route selection by telecom operators in this field. This paper presents a congestion control algorithm that supports NO-PFC and does not require the configuration of switches. The algorithm is designed with considerations for the actual networking environment and service scenario. To achieve low latency, the Round-Trip Time (RTT) is employed as the congestion sensing signal, enabling effective regulation of the switch queue length.

Key words: RDMA congestion control, hardware infrastructure innovation for large language model, telecom operator data center network

中图分类号: