信息通信技术与政策

信息通信技术与政策

信息通信技术与政策 ›› 2020, Vol. 46 ›› Issue (9): 42-47.

上一篇    下一篇

深度学习推理侧模型优化架构探索

Exploration of model optimization architecture on the inference side of deep learning

  

  • 出版日期:2020-09-15 发布日期:2020-11-05
  • 作者简介:
    孟伟:中兴通讯标准规划总工程师、开源总监,ITUFG-ML5G WG3 主席,Linux AI 基金会董事 会董事,中国人工智能产业发展联盟总体组副组长,主要从事IP 网络、人工智能、5G 网络自动化/ 智能化技术方面的研究工作,累计获得相关领域专利授权20 余件 袁丽雅:中兴通讯标准工程师、Linux 基金会Adlik 项目TSC 主席,主要从事人工智能模型训练、算法框架、开源生态等方面的研究工作 韩炳涛:中兴通讯AI 技术委员会主席、人工智能平台总工程师,主要从事AI 系统架构、模型训练、推理加速及网络智能化应用方面的研究工作 刘涛:中兴通讯人工智能平台系统工程师,主要从事人工智能开源平台、算法、模型训练等方向的技术研究工作

  1. 1. Nanjing R&D Center of ZTE Corporation, Nanjing 210012, China
    2. Tianjin R&D Center of ZTE Corporation, Tianjin 300308, China
  • Online:2020-09-15 Published:2020-11-05

摘要: 论述了深度学习推理侧模型优化的历史起源,阐述了模型优化加速的整体架构和创新应用,提出了推理侧模型优化业务的发展建议。

关键词: 模型优化, 人工智能, 模型加速

Abstract: This paper discusses the origin of model optimization on the inference side, describes the overall architecture and innovative applications of model optimization acceleration, and puts forward the suggestions for the model optimization on the inference side.

Key words: model optimization, artificial intelligence, model acceleration