千问推出最强模型,平头哥单飞,阿里AI超级入口大迂回、大包抄
来源:21世纪经济报道作者:孔海丽2026-01-27 16:51

大厂AI之战,激烈度陡然升级。

马化腾在腾讯年会上罕见地公开反思,直言“AI速度慢了”,还点评了“千问全面接入阿里生态”,称腾讯会一体化考虑大模型和AI产品,试图以“元宝派”打开新空间;百度智能云将“2026年AI相关收入增速”上调到200%,全力冲刺AI云市场第一;字节跳动更是激进,豆包手机试图直接抢占硬件终端,二代豆包AI手机正在紧锣密鼓准备中。

就在所有人都以为战局会在春节后进入高潮时,1月26日深夜,甚至没有一场发布会,阿里放出了最强模型。

千问旗舰推理模型Qwen3-Max-Thinking正式发布。

根据披露的数据,Qwen3-Max-Thinking是目前阿里规模最大、能力最强的推理模型,其性能指标媲美GPT-5.2和Gemini 3 Pro,在19个公认的大模型基准测试中,刷新了数项最佳表现(SOTA)纪录。千问PC和网页端随即丝滑接入,支持深度逻辑推演与自我校验。

还有一则有意思的动态。

1月26日,国星宇航披露成功把千问3(Qwen3)大模型部署到了“星算”计划01组太空计算中心,这是全球首次将通用大模型从地面上注至在轨运行的卫星,并执行端到端推理任务。网友调侃,千问这回真“上天”了。

开年以来,在关乎未来输赢的“超级入口”之争上,阿里全面进击,从千问接入阿里生态,到阿里旗下芯片子公司平头哥计划单独上市,再到Qwen模型发布最强版本,芯片层、模型层、应用层动作接连不断。

AI进入下半场,各家策略各异。“谁都知道以后AI重要,不管起步早晚,大厂都在做AI生态了,但现在方向都没定,阿里做生态、腾讯做社交、百度押注云、字节做硬件,还不到分野的时候。”一位AI产业资深观察人士表示。

千问推理再进化

Qwen3-Max-Thinking模型被官方称为“迄今为止最接近国际顶尖模型的国内最强AI大模型”。它的目标非常明确,在推理技术上进行系列创新,最终完成模型性能的大幅飞跃。

根据阿里发布的详细资料,该模型总参数超过万亿,在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19项权威基准测试中刷新了全球纪录。

在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时更经济。

业界推理时计算,通常是简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下。千问采用的测试时扩展新机制,可以对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。

简单理解,就是类似于让AI在解题时不再“一张草稿纸算到底”,而是能像人类一样,对前面的思考步骤进行回顾、提炼“经验”,并在后续步骤中更聪明地调用这些经验,从而实现更高效、更准确的复杂推理。

基于这一推理技术创新,千问推理性能和推理效率有明显提升,比如在被称为“人类最后的测试”HLE测试中,千问得分58.3,超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。

面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。具体而言,在完成初步的工具使用微调后,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。

这种自适应的工具调用能力可以在QwenChat上完整体验,模型自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能,提供专业人士一样水平的回答。同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

为什么业界如此看重推理和智能体能力?因为这直接关系到AI能否从“聊天玩具”进化为真正的“生产力工具”乃至“个人助理”。一个能进行深度推理、自主调用工具的AI才有能力处理复杂任务,比如规划旅行、编写专业报告、分析数据等。

或许阿里的这个“旗舰推理模型”,目的就是走出“仅对话”阶段,开始为物理AI的“超级入口”做准备。

平头哥独立,千问融入生态

同期,阿里还在做两个看似相反的动作,让芯片独立出去,把千问无缝整合到阿里生态。

平头哥的单飞,是观察中国互联网巨头AI战略纵深的一个切片。作为源自阿里达摩院的芯片公司,平头哥最早是为阿里云及内部生态提供自主算力的,其推出的含光、倚天等系列AI芯片,已经成了阿里云算力基础的一部分。

市场解读阿里推动平头哥独立运营并寻求上市,是希望把芯片从成本中心转化为收入中心。

其实不只阿里,百度也在推动昆仑芯独立上市,这也是一种行业必然。

大模型参数规模进入万亿时代,训练与推理的成本指数级上升,算力成了AI时代的“水电煤”。对于互联网大厂内部来说,自研芯片不仅能优化性能、降低对英伟达等国际巨头的依赖,还能在架构层面与自家的AI框架、模型进行深度协同,形成从底层硬件到上层应用的垂直优化闭环。

而让芯片公司独立出来,则是出于营收的考量。既能通过外部压力倒逼技术迭代,也能通过资本市场为长期的芯片研发“输血”。一方面支撑自家云业务,另一方面向外输出、形成行业标准的基础设施,顺便把外部的资金赚回来,支撑研发。

在算力层、模型层都有积淀之后,阿里最终的目的开始变得清晰,把千问融入庞大的商业生态里,抢夺AI的“超级入口”。

近段时间以来,阿里进行了一系列紧凑的生态调整。2025年12月,集团整合资源,成立了千问C端事业群,直接面向消费者打造AI产品体验。2026年1月15日,千问APP推出重大版本更新,正式宣布从“聊天工具”升级迈入“办事时代”,深度接入淘宝、支付宝、淘宝闪购、高德、飞猪等阿里生态核心业务,实现了点外卖、购物、订机票酒店等AI全流程办事服务,一次性上线超400项AI办事功能,串起了需求表达、任务执行到支付履约的闭环。

比如,用户对千问说“周末我想去郊外露营,预算人均500元”。千问在理解这个模糊意图后,其背后的“智能体”能力可以同时调动多个插件,通过高德查询合适的露营地与实时路况,通过飞猪或本地生活板块预订营地,通过淘宝推荐并比价帐篷、睡袋等装备,再通过支付宝整合优惠套餐并完成支付。用户不需要在多个APP之间频繁操作,通过自然对话可以完成从想法到消费的全流程。

未来千问还将继续接入优酷、大麦、菜鸟驿站、阿里健康、1688、盒马等其他阿里旗下核心业务条线,进一步提升生态协同和场景覆盖度。

也就是说,以千问作为入口,能够无缝串联起“电商交易”、“本地生活”、“文娱内容”、“支付金融”等场景,千问本身可以成为覆盖用户生活的“AI管家”。

国海证券在研报中指出,千问的生态整合模式重新定义了“入口”价值逻辑,促使行业竞争从单一模型能力,转向“模型+生态+场景”全维度比较。

大厂路径各异

同期,其他互联网巨头也在加码进攻。

腾讯,正如马化腾所言,在通用大模型的激进发布上显得谨慎。但其优势在于社交产品矩阵和深厚的产业互联网基础。腾讯的AI战略更倾向于“渗透”与“结合”,把AI能力深度融入微信、QQ、企业微信等国民级应用以及游戏、金融科技等优势业务中。腾讯更喜欢用不打扰用户的方式,做“润物细无声”的生态融合。

百度开年第一个发声是“AI云”,文心大模型是底层模型能力,商业化在于提供AI解决方案,并且业务增速和招投标数据表现很不错。百度的“入口”思维更偏向于B端,成为企业和机构智能化转型的首选合作伙伴。

字节跳动以敏捷和务实著称。豆包在字节内部应用非常广泛,包括抖音的内容推荐、创作工具,飞书的办公协同等等。推出“豆包AI手机”、研发“豆包AI耳机”,显示字节开始触碰硬件层。字节潜在的AI超级入口可能是抖音,可能是豆包,也可能是尚未完全成型的新硬件。

相比之下,阿里从平头哥的底层芯片,到千问的模型层,再到千问APP上层应用、夸克AI眼镜硬件,试图搭建起一个完整闭环。这种模式的优点是自主可控、协同潜力大,但是战线长,每一环都需要巨大的投入,对公司的资源整合与战略定力要求非常高。

尤其在千问宣布全面接入阿里生态之后,外界也有质疑声音,不少用户表示:“我不想被限定在阿里的圈子里,就想有更多选择权。”这对于阿里能否把千问做成“超级入口”是有挑战的,用户意愿和用户习惯往往最难左右。

(21世纪经济报道记者陶力对本文亦有贡献)

责任编辑: 邓卫平
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换