摘要:
随着大模型能力的持续升级和推理应用的不断深化,数据处理规模急剧扩大,数据处理需求也日益多元化,这对存储与算力的交互能力提出了更高要求。针对当前大模型推理场景下更多数据、更大规模以及更长上下文窗口对存储系统形成的新要求,深度分析以算代存、以存替算两种模式下的实现机制、重点技术和应用实践;进而结合当前技术产业基础和应用场景需求,指出根据访问延迟和带宽需求构建的分层、体系化协同存储模式对后续算存协同发展的重要意义。旨在探索算存协同的具体实现机制及演进路径,为推动提升智算集群利用效率、更好支撑大模型推理发展提供有益参考。
中图分类号:
周兰, 陈磊. 大模型推理驱动下的算存协同发展研究[J]. 信息通信技术与政策, 2025, 51(10): 2-6.
ZHOU Lan, CHEN Lei. Research on the development of compute-storage collaboration driven by large model inference[J]. Information and Communications Technology and Policy, 2025, 51(10): 2-6.