声网新版对话式AI引擎亮相WAIC 解锁声纹识别、数字人与视觉理解
来源:证券时报网作者:聂英好2025-07-28 10:02

7月26日—28日,2025世界人工智能大会(WAIC)在上海举办,声网在本届WAIC上正式发布新版对话式AI引擎,该版本新增声纹识别、数字人与视觉理解三项功能,实现对话式AI音视频交互体验的全新升级。同时,口袋AI毛绒宠物——芙崽Fuzozo、家庭陪伴机器人——赋之EBO Air2 Plus等一系列搭载对话式AI引擎的人气AI硬件也亮相声网展台。

对话式AI正从基础的互动问答向深度理解、情感共鸣和情境感知演进,新版声网对话式AI集成了声纹识别、数字人交互和视觉理解功能。

具体来看,声纹识别功能可以选择性注意力锁定新增声纹识别功能,该功能使AI具备精准识别用户声纹特征的能力,有效区分不同说话者,也适用于多人与AI对话的场景。

数字人交互功能支持商汤等市场主流的数字人方案,通过集成高度拟真、表情动作自然的数字人,用户可与屏幕中的高度拟人化的数字形象进行实时、生动的对话互动,增强交互的临场感与情感连接,且有多个数字人形象供选择,适用于虚拟客服、教育陪伴、娱乐社交等多种场景。

视觉理解功能是新增的视觉理解能力,为AI加上“眼睛”,一方面支持实时视频,能够解析摄像头捕捉的画面信息,结合语音指令,AI能“看懂”用户手势、环境物体或特定视觉线索,实现“所见即所言”的智能反馈。

此次WAIC期间,声网展台设置了多个对话式AI的体验展区,其中人气最高的为AI硬件展区,多款搭载对话式AI功能的AI硬件集中亮相,包括:对话式AI开发套件以及搭载了开发套件的卡皮巴拉AI玩偶与数字人全息仓;具备AI陪伴功能的AI毛绒宠物——芙崽、家庭陪伴机器人——赋之EBO Air2 Plus、将AI玩具与角色手办结合的赛博大舞台、具备翻译与识图功能的AI眼镜等,让现场的观众体验到既会说话,又能共情的各类AI硬件。

声网表示,未来将持续完善对话式AI引擎与开发套件,通过多元化的功能、极致的对话体验,加速智能对话在各类终端和场景中的普及与深化,推动更加自然、智能、安全的人机共生时代加速到来。

责任编辑: 孙宪超
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换