从去年ChatGPT发布以来,大模型的火热持续至今,并加速走向应用,赋能千行百业。从金融、交通,到教育、医疗,一段时间以来,各个行业大模型如雨后春笋般出现在世人面前,展现了“AI赋能千行百业”的能力。
交通行业是最早拥抱大模型的行业之一。在大模型“智能涌现”的加持下,从乘客服务到智能运维,再到应急管理,城市出行正发生着深刻变化。大模型如何重塑轨道交通?给我们每个人的出行带来了哪些变化?当前的主要技术挑战是什么?日前,佳都科技副总裁兼中央研究院执行院长周志文、佳都科技首席人工智能科学家王凯走进证券时报·时报会客厅,探讨大模型如何让城市更“知行”。
点击图片查看直播回放↑↑↑
大模型全面赋能客服、运维与应急管理
证券时报记者:与过去传统的AI技术相比,大模型给交通行业带来了哪些变革?
周志文:在过去的大半年里,佳都科技投入了大量资源,构建我们的“知行”交通大模型,也看到了大模型对交通行业带来的多重变革。
一方面,对于交通运输的管理者和组织者而言,交通态势感知的能力得到大幅度提升。通过与海量的前端业务数据对接,掌握气候变化、交通流量等情况,感知交通实时态势。我们也正在研发时空决策大模型,让交通管理部门能够实时监测和分析车辆道路、信号灯等变化,减少交通拥堵,降低安全隐患,服务于交通综合治理。以广东为例,非机动车的治理一直是令管理部门头疼的问题,视觉大模型就可以发挥到很大作用,可以实时感知和识别非机动车引发的交通事故,甚至在某些场景下进行事故预测研判。
另一方面,从普通市民出发,大模型应用于智能客服,能提供实时的交通咨询、问题解答,有助于提升出行体验。另外,大模型可以用自然语言的方式实现人机交互、人机协同,为市民提供个性化出行推荐、路径规划。总而言之,大模型对交通行业的影响是深刻而长远的。
证券时报记者:如果以一名乘客的视角,从进入地铁站到买票,再到出站这个完整的行程当中,我们都有哪些时刻与大模型进行了“亲密接触”?
周志文:亲密接触的时刻有很多。第一是进出站场景,通过大模型深度智能化的技术,可以实现掌静脉、指静脉等身体特征的识别进出站,身体特征的应用在大模型加持下会加速应用到轨道交通当中。第二是智能客服,以前的智能客服只能回答简单问题,现在可以回答所有与地铁出行相关的问题,比如票价、换乘方案等。第三是安检场景,轨道交通高峰时期,安检点容易拥堵,大模型可以对安检设备进行全面升级,通过图形化识别技术,快速识别可疑物品,甚至未来可能做到人包同行,提升安检效率。第四是等待和乘坐地铁时,地铁广播视频播报信息将更加个性化,车厢的温度、速度、路面的天气、公交情况都可以实时播报。最后是在大型交通枢纽中,可以运用智能识别算法,及时发现整个车站的异常事件和行为,提早预警,使整体相出行效率和安全指数更高。
证券时报记者:与传统的智能客服相比,大模型加持下的智能客服为何能“更聪明”“更懂乘客”?
周志文:过去的智能客服是通过捕捉乘客的语音,识别成文本,再通过文本识别出其中的关键词,通过关键词在知识图谱里去找一对一的答案,所以只能回答简单问题。大模型时代,智能客服可以实现语义理解,深刻理解客户意图与动机。对于描述模糊的语言,它识别出来以后能多轮追问,提供更精准的答案。例如,乘客和智能客服说“我要去白云机场”,但白云机场有两个航站楼,智能客服会追问“你要去哪个航站楼”“你希望什么时间到”等,交互性大大提升。再比如,在失物招领场景中,智能客服可以多轮提问,更精准地锁定失物丢失地点等,降低车站运营人员工作负担。
证券时报记者:大模型在帮助地铁工作人员提升工作效能方面,有哪些主要的应用?
王凯:交通大模型提供了一个更加智能、高效也更有预见性的运维环境。首先,它可以自动提报故障,智能填报故障对应的工单,并提供专家级别的处理建议,还可以事后复盘,自动生成故障处理报告,方便未来应对类似故障。例如,地铁的屏蔽门如果出现一个故障无法锁紧,以前需要人工提报工单描述问题,再根据工单内容人工派单,响应速度比较慢。大模型可以凭借工作人员发出的语音指令,例如“某某站某某方向站台门无法关闭,出现信号故障,请帮我生成工单”这一指令,迅速生成并下达工单,派发给对应的工作人员,实现了流程优化以及效率提升。
交通大模型还化身为一个全能的运维专家,为维修人员提供24小时在线的指导服务。随着轨道交通行业数字化转型的深入,系统变得越来越复杂,对运维的专业性、操作难度都有了更高的要求。一个员工,尤其是新员工遇到棘手的问题,往往会不知所措。有了交通大模型的帮助,员工对故障的处理将更有经验。当然,这些都只是其中的一些例子,大模型赋能智能运维还有很多场景,总体上都是重塑运维流程,使其更高效。
证券时报记者:在赋能应急管理方面,大模型是怎样发挥作用的?比如在公共交通出现突发大客流进行应急疏运,大模型提供的方案与传统方案相比有何提升?
周志文:大模型应急响应的效率和准确性更高,能更好地预测和管理复杂交通状况。首先它能够分析大量的实时数据,包括车辆的位置、车速、乘客流量等,预测短期的客流变化,这种能力使我们可以更快识别潜在的拥堵点、客流过载区域等,提前做好应急准备。其次,在动态应急方案制定方面,它也更有优势。传统应急疏导是提前制定预案,不一定适应突发的真实情况,但大模型具有动态生成的能力,可以基于实时数据和情况,结合历史特征和经验,动态生成适合当下的个性化的疏运方案,更加灵活和有效。
有望落地更多场景,但仍存多重技术挑战
证券时报记者:交通管理千城千面,不同城市有不同的特点,不同道路也有不同的行车模式和交通流量特征。交通行业大模型在不同的城市间是否有可迁移性?
王凯:传统的AI技术,或者说传统的强化学习技术,确实在应对这一问题上会有一定难度,因为它面对新场景、新数据、新问题都需要重新训练一个新的模型来解决对应的问题。而大模型最大的不同就是它拥有强大的泛化能力,因为它经过了千亿级甚至更大规模的参数训练,训练的token数对应的数据也是万亿级别的,这使得大模型具备了传统强化学习所不具备的泛化能力。所谓的泛化能力,就是指大模型处理没有见过的、不同于训练数据的情况时,仍能够做出比较准确、合理的预测或者决策。这一能力得益于大模型的“鲁棒性”(Robust的音译,指在某些参数略微改变或控制量稍微偏离最优值时,系统仍然保持稳定性和有效性),尽管不同城市数据多种多样,但大模型不会因为数据偏离之前训练数据的标准差、方差而导致不准确,有比较好的适应性。
其次,大模型有迁移学习的能力,基于历史学到的知识,在面对稍有不同的客流情况时也能够适用。再次,大模型还有抽象和推理的能力,因为其基于很多层不同的、复杂的神经网络,类似于人类大脑的神经网络,能够理解和处理更高层次的抽象概念,进行逻辑推理,解决相应的问题,所以即使是面对之前没有处理过的案例也可以进行解决。这些能力,使大模型能在不同城市交通间迁移。
证券时报记者:据了解,佳都科技的知行大模型有轨道交通大模型和城市交通大模型,二者有何区别?是否可能实现融合?
王凯:轨道交通大模型主要针对地面以下及一部分轻轨地铁,城市交通大模型则应用范围更广泛,包括高速公路、隧道、停车场等,都属于广泛的城市交通范畴。二者训练的语料和数据是有差异的,轨道交通大模型用的是地铁运行和运维数据,城市交通更多是用到了车辆的GPS数据、道路的信号机数据、视频监控数据等。应用场景也不一样,轨道交通大模型主要应用于乘客服务、地铁运维、行车调度等;城市交通大模型集中于交通流量管理,比如路况的监测、智能导航、应急调度等。
虽然有不同之处,但二者并不是孤立的两套系统,在很多层面上能够融合。首先在数据层面,数据的抽取、清洗、转换,我们都可以做到跨域的数据打通,形成高效的数据资产;其次在技术层面,这两个模型底座都是基于谷歌Transformer的深度学习底层框架构建的,即便具体的模型架构有一些微调,也可以通过技术手段进行嫁接集成,形成一个立体化交通管理的、更加丰满的大模型,为城市整体的交通规划和管理提供更加强力的支撑。
证券时报记者:大模型要真正实现对交通行业的全新塑造与全面赋能,当前还存在哪些主要挑战?
王凯:首先是数据的广泛收集和加工处理的挑战。以佳都为例,我们前几个版本的发布基本上将我们自己所掌握的、各种维度的数据都做了处理。然而,随着语言类行业语料逐渐耗尽,我们需要拓展新的语料,包括跟中国城市轨道交通协会合作,获取更加全面丰富的行业数据。除此以外,数据的治理、安全、合规等问题也都需要消耗大量的人力和成本。
其次是多模态数据的挑战。未来无论是聚生智能的机器人还是智能体,需要的不仅仅是语言文本的数据,还需要很多跨模态数据,例如图像、短视频、音频等。在复杂的交通场景下,多模态能力的要求是很高的,不仅数据维度多,数据还具有实时性,需要能够高效满足后续的训练对齐要求。
最后是模型的安全性和可解释性。对于行业大模型来说,预测结果会直接影响到决策制定。交通系统又是一个异常复杂的系统,一个小错误或异常情况就可能对整个模型产生巨大影响。因此,模型的可解释性非常重要,专业性、准确性、精确度等要求非常高,必须规避“幻觉”,防止大模型“一本正经地胡说八道”。
校对:王朝全