云天励飞千卡AI推理集群落地湛江 打造“国模国芯”生态样板
来源:证券时报网作者:康殷2026-03-12 11:25

3月12日,云天励飞(688343)中标湛江市AI渗透支撑新质生产力基础设施建设项目,中标金额4.2亿元。项目将基于云天励飞自研的国产AI推理加速卡,建设国产AI推理千卡集群。该集群将搭载DeepSeek等国产大模型,为政务、产业及各类应用场景提供更加便捷、低成本的AI能力,探索打造“国模国芯”的AI生态样板。

AI算力从“训练优先”走向“推理优先”

智算集群是人工智能时代的基础设施。过去,国内许多智算中心普遍采用“训推一体”的建设模式。而此次在湛江建设的集群,则定位为专注推理任务的AI推理集群,主要面向各类行业应用场景,为传统产业的AI化提供直接支撑。

据了解,湛江是国产大模型DeepSeek创始人梁文峰的家乡。近年来,当地在“DeepSeek+”应用探索方面动作频频。2025年初,DeepSeek-R1发布后,湛江即完成本地部署,基于国产技术栈的DeepSeek-R1大模型率先在湛江政务云上线。该模型在处理通用政务事务的同时,还能够持续学习本地产业知识与方言表达,逐渐形成具有地方特色的“湛江智慧”。

此次云天励飞建设的AI推理集群,也将与DeepSeek等国产模型进行深度适配,为更多行业应用提供算力支撑。

在大模型应用场景中,推理系统通常需要同时满足高并发、高吞吐与低延迟三项要求。为提升整体效率,当前业界普遍采用“Prefill–Decode分离”的推理架构,通过对不同阶段进行资源优化,实现系统性能的整体提升。在这一背景下,算力、存储与网络之间的协同设计,正逐渐成为AI基础设施的重要竞争力。

此次在湛江落地的千卡推理集群,正是围绕这一思路进行构建。该集群采用云天励飞自主研发的AI推理芯片,并在系统架构上确立了“优先优化Prefill、兼顾Decode”的技术路线。通过在芯片设计中对计算资源与存储带宽进行针对性配置,使系统在长上下文推理场景下依然能够保持较高的吞吐效率。

在网络互联方面,系统采用统一高速互联架构,通过400G光网络构建集群物理层网络,实现节点之间的高带宽、低延迟通信。与传统在节点内和节点间分别采用不同协议构建网络的方式相比,这种同构互联架构减少了协议转换带来的额外开销,也简化了系统部署。

在部署能力上,该架构既可以支持单节点数十卡规模扩展,也能够平滑扩展至千卡级集群规模,从而适配不同规模的AI应用需求。

此外,针对大模型推理中KV Cache访问带来的压力,系统在计算互联与存储互联层面进行了协同优化。通过计算网络与存储网络的联合调度,可以显著提升数据读取效率,使模型在长上下文推理场景下依然保持稳定性能。通过芯片架构、网络互联以及系统调度等多层优化,这一推理集群在整体效率与成本控制方面形成了明显优势,为AI规模化应用提供了更加经济的算力方案。

自研芯片构建低成本推理能力

据悉,本次AI推理集群将分三期建设,并全部采用云天励飞自研的国产AI推理加速卡。

其中,一期项目将部署云天励飞X6000推理加速卡;二、三期建设将率先搭载公司最新一代芯片产品。

根据规划,未来三年云天励飞将推出三代AI推理芯片产品。第一阶段,将推出面向长上下文场景优化的Prefill芯片,通过提升计算效率与内存访问能力,为OpenClaw、各类AI Agent提供基础算力支撑。第二阶段,将研发专注于Decode阶段低延迟优化的芯片产品,进一步提升实时推理能力。第三阶段,则通过系统级协同优化,实现Prefill与Decode性能的整体提升,向毫秒级推理时延目标迈进。

其中,首款Prefill芯片DeepVerse100预计将在年内完成流片,并计划在湛江集群中率先部署。在更长期的规划中,云天励飞提出“1001计划”,即以“百亿Token一分钱”为长期目标,通过芯片与系统协同优化持续降低大模型推理成本。

在业内看来,推理算力将成为决定AI应用规模化落地的关键基础设施。谁能够以更高效率、更低成本提供稳定的大规模推理能力,谁就有机会在新一轮人工智能产业竞争中占据先机。此次湛江AI推理千卡集群的建设,不仅为当地产业数字化转型提供了重要算力底座,也为国产模型与国产芯片协同发展提供了实践场景。在“国模”与“国芯”的深度协同下,AI基础设施正逐步从技术探索走向规模化应用,为人工智能产业的下一阶段发展打开新的空间。

责任编辑: 叶玲珍
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换