每日经济新闻
宋钦章
2025-09-12 09:25
人民财讯9月12日电,9月12日,阿里发布了下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。相比于Qwen3的MoE结构,Qwen3-Next架构进行了一系列核心改进,具有更高效的特点。Qwen3-Next-80B-A3B-Base模型拥有800亿参数,激活参数仅30亿,实现了与Qwen3-32B dense模型相近甚至略好的性能,而训练成本仅为十分之一不到,实现了极致的训练和推理性价比。