走进智能体时代之前:一个变革、多种路线和三条安全带
来源:21世纪经济报道作者:肖潇2026-03-11 14:59

过去一年,大模型最大的变化是从“会说话”走向“会干活”。

过去,大模型主要生活在网页聊天框里,用户提问、模型回答,AI更像一个问答客服。现在一批新的智能体被塞进手机、电脑、眼镜甚至戒指等终端设备,调用系统能力、跨应用完成任务。

如果这一浪潮继续,智能体很可能不只是一个应用,而会变成新的交互系统和操作基础设施。这也是为什么越来越多从业者,把端侧智能体视为AI产业的下一个关键跃迁点。

泡沫当然也在同步出现——譬如:Token成本很少被提及、许多需求仍然停留在“拿着锤子找钉子”的阶段。但即便如此,行业仍然认为,运行在个人设备上的智能体,确实有机会在跨场景任务和自动化执行上释放新的效率空间。

理解技术趋势、落地路线是一方面,另一面,也要看到它在改写数字时代的安全边界。多位受访者同时给出了一份进入市场之前的安全清单,拿着这份清单,端侧智能体才能更好上路。

一种变革

在智能体风靡之前,能动手的AI代理浏览器已经为其铺路。典型产品如Perplexity浏览器,或是Chrome最近更新的Gemini自动购物功能,都在探索让AI自动完成具体任务。

类似能力向手机端复制,几乎是顺势而为。3月6日,小米宣布推出 Xiaomi Miclaw;此前谷歌宣布,要在三星新机中深度内嵌Gemini智能体;更早之前,国内亦早有类似的豆包手机助手和智谱AutoGLM。各家厂商都在尝试把智能体嵌入终端设备,谷歌安卓系统的负责人把这一变化称为“移动智能新时代的开端”。

在不少研究者看来,今年端侧智能体的爆发是一个必然趋势。

中国科学院软件研究所研究员张立波提到,过去的大语言模型或多模态模型,在实际应用中往往只能完成单一任务,但现实生活里的需求往往是一整条复杂的任务链。端侧智能体的价值就在于,可以在本地设备上处理那些需要跨应用、跨场景的复杂任务。

从更宏观的产业视角看,这也被视为AI规模化落地的下一次跃迁。复旦大学中国研究院副研究员刘典认为,智能体的发展,本质上是在推动AI这一新生产要素与各个行业深度融合,成为重构生产关系的重要技术载体。

信号明确开始展现在政策层面。今年的全国两会上,政府工作报告首次提出“智能体”概念,明确要“培育智能经济新形态”。工信部部长李乐成在“部长通道”采访中也表示,将推动人工智能与制造业“双向奔赴”,加快发展AI电脑、AI手机和智能家居等终端产品。

刘典认为,从全球技术竞争与产业落地的视角看,移动端智能体已经成为AI与终端融合的核心赛道。以谷歌Gemini与三星手机的深度整合为例,大模型、操作系统与硬件终端正在形成一体化协同,通过跨应用任务执行和场景化服务,逐渐构建起“模型—终端—生态”的闭环。

“这意味着下一代移动生态的竞争,不再是单一硬软件的比拼,而是系统级智能、全链路服务、普惠化应用的综合较量。”刘典说。

多条实现路线

要让智能体运行在终端设备,行业目前形成了多条落地路线。

第一条是标准接口适配的方案。智能体通过 API、A2A 或 MCP 等标准协议,直接调用其他应用已经封装好的功能,相当于提前约定好了脚本。

第二条GUI路线,即“视觉路线”。大模型接受用户指令,理解用户指令,再像人一样观察App界面上的按钮、文本和菜单,最后模拟点击完成操作。这也是目前多数手机智能体采用的方式。

两种技术选择都已经出现在真实产品里。2月底,在三星新机发布会上,Galaxy S26 系列一项核心更新就是让智能体直接操作手机。这项能力Gemini 提供,也是作为安卓系统主导者的谷歌,首次公开展示自动操作第三方App的能力。此前在国内明确展示过类似能力的还有智谱 AutoGLM 和字节的豆包手机助手。

张立波看来,接口调用路线最大的优势在于标准化程度高、效率也更高。如果应用本身就提供了标准接口,智能体只需要调用就可以完成任务,对平台和开发者来说都是最节约资源的方式。

但问题也同样明显:接口是否开放,往往取决于平台的商业策略。如果厂商不愿意开放,智能体就无法调用这些应用。“技术上很理想,现实中会受到平台生态和商业策略的影响。”张立波说。

相比之下,通过读屏和模拟点击来操作App,几乎不需要额外适配——理论上,只要界面能被识别,任何软件都可以被调用。这也是视觉路线在当前阶段最大的优势,它能快速落地,并迅速验证各种应用场景。不过由于需要解析屏幕内容,也应关注安全问题。

毕竟手机屏幕是一个高度密集的个人信息入口”香港科技大学副教授王帅坦言,视觉路线需要关注的核心风险不来自GUI技术本身,而是数据如何被处理和限制。

在王帅看来,把接口路线与GUI路线简单对立,意义不大。两者解决的是不同阶段和不同场景的痛点:标准协议路线效率高、结构化好,但高度依赖平台开放生态;GUI路线门槛更低,可以快速打破App之间的“生态孤岛”,让大量长尾应用也能被智能体调用,因此是一条更务实的起步路径。

“长期来看,这两者必然是走向融合的——极大概率是混合架构。行业与其陷入路线之争,不如把精力集中在怎么把这两条路的安全水位线都提上来。”王帅说。

三个安全铁律

北京航空航天大学人工智能学院教授沙磊告诉我们,端侧智能体带来的核心挑战,是自主性与控制权的关系被重新定义。智能体的安全风险更复杂,特别是在执行任务时,可能超越用户意图或滥用权限,导致隐私泄露、数据丢失甚至系统失控。

如果要为端侧智能体建立一份最基本的安全清单,多位受访者给出了相似的三条原则。

第一是控制权前置。智能体始终只是助手,而不是替用户做决定的主体。在涉及支付、账号授权、隐私访问等关键操作时,系统必须把最终控制权交还给用户。

第二是数据最小化。智能体只获取完成当前任务所必需的数据,不多拿一步、不多看一眼。它的权限范围应严格限定在用户明确授权的任务之内,避免在执行过程中自行扩展任务范围或处理未授权的信息。

第三,透明度和可回溯。“用户应该能清楚知道智能体是如何做出某个决定的。这个过程不仅限于展示模型的推理步骤,还需要解释自己的行为目的,用户才能对智能体的决策有足够的信任。”沙磊说。

张立波也强调,透明度不仅关乎控制和信任,更关系到责任划分。“很多时候结果对了,大家不会太在意过程,但一旦出错,可解释性就变得非常关键。”

张立波举了一个简单的例子:如果让智能体帮忙买一杯奶茶,最终确实买到了,但没有使用优惠券,那问题究竟出在哪个环节?是任务理解偏差,还是模型记忆出了问题?如果系统能够通过日志或流程记录,把整个决策链条呈现出来,责任归属才有可能被厘清。

四类长期问题

端侧智能体仍处在非常早期的阶段。抛开短期的泡沫、争议和混乱,有几类问题值得更长期的观察和研究。

首先是可解释性研究。

张立波提到,深度学习刚兴起时,也被认为“不可解释”,但后来围绕模型决策路径的研究逐渐形成独立领域,很多模型的判断过程已经可以被拆解和分析。

如果把智能体放在这个框架里理解,其实是一种“人的逻辑 + 多个模型逻辑”的组合系统:既包含模型之间的串联调用,也包含大量人为编写的规则。从这个角度来说,张立波认为它的可解释性其实是比较强的。

目前的难题在于,当前智能体的任务链条很长,但完整的回溯机制还没有建立。一旦执行出现偏差,很难判断是模型能力不足、规则设计问题,还是系统工程环节出错。

张立波认为,解决这个问题的前提是让智能体在真实场景中运行,只有不断落地执行,才能逐渐补齐工程逻辑。理想状态是,最终每一个任务步骤都可以被记录和回溯。

第二是端侧算力问题。当下终端设备的算力仍有限,完全依赖本地计算,智能体只能处理较简单任务;复杂推理仍然需要云端参与。这也是“端云协同”引发争议的无奈之处。

王帅解释,这个问题之所以重要,因为“端侧优先”本身就是降低数据风险的重要手段。他的建议是,把界面识别、屏幕解析等基础处理尽量放在本地完成,并在设备端先进行脱敏处理,再把必要信息发送到云端推理。云端侧的数据则必须做到“用完即删”,避免沉淀和二次利用。

端侧算力问题,考验软硬件能力,更考验的是生态定力。“过去行业比较依赖数据沉淀来反哺和打磨服务,假设现在要全面转向隐私优先,则需要厂商在模型迭代需求和数据最小化之间找到新的平衡点。这不仅是技术的升级,更是整个生态理念转型和磨合的过程。”王帅说。

第三是治理方式。

王帅指出,智能体最大的技术挑战其实是开放环境下的可靠性。在实验室里跑基准测试相对简单,但在真实设备中,智能体要面对复杂的App界面、系统弹窗以及模糊指令。如何避免模型幻觉或错误操作,仍然是一个系统工程问题。

未来两三年,行业的突破重点很可能不只是模型能力,而是外围治理结构的完善。就像交通安全依赖的是规则体系,不仅仅是司机的判断能力。

最后,则是软件商业生态的变化。

当智能体成为设备的主要入口,人和系统的交互方式也会发生变化。过去用户需要打开不同的App,通过图形界面逐步完成操作;而在智能体模式下,大量步骤可以被自动化完成,用户更多只是提出目标和指令。

智能体作为用户意志的延伸,意味着软件的开发方式和产品形态也会随之改变:部分应用可能不再需要复杂的前端界面,而是由智能体统一调度。未来用户面对的可能只是一个“管家式入口”,而不是几十个分散的App。

复旦大学中国研究院副研究员刘典因此认为,面对这种变化潜力,行业需要保持多路径探索。无论是API接口路线还是GUI视觉路线,都应该在市场竞争和技术迭代中逐渐验证优劣,而不是过早锁定单一方向。

在他看来,AI助手本质上是一种具有明显社会价值的效率工具。对于仍处在早期阶段的技术,监管和产业政策既需要控制风险,也需要为创新留出空间,从而推动整个生态健康发展。

责任编辑: 邓卫平
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换