电厂|AI 有哪些新方向,英伟达已经给出了回答
来源:界面新闻作者:张勇毅2024-03-19 10:17

北京时间3月19日,英伟达GTC2024主题演讲如期开幕。

这不仅是英伟达GTC五年以来首次回归线下活动,也被外界普遍看作是2024年开年最重要的一场AI峰会。为期四天的会程中,云集了来自各行各业的高管与顶尖开发者,当然最受关注的,仍然是黄仁勋本人的主题演讲。

在国产大模型厂商普遍都还停留在卷模型性能榜单的时候,英伟达已经在继续狂奔,准备再一次靠着自己在硬件与生态中的号召力,推动生成式AI进一步卷入更多领域了。

当身着黑色皮衣的黄仁勋跑上台的那一刻,现场激动的氛围让人产生了一种仿佛在看演唱会的错觉:老黄自己也开起了「这不是演唱会,这是开发者大会现场」的玩笑:似乎英伟达又回到那个“领先对手的同时也一刻不停奔跑”的状态。

今年主题演讲中,除了最新的模型训练硬件外,面向企业用户的数字孪生软件服务也成为了重头戏:由于英伟达软件先行的合作策略,在英伟达展示的一系列场景中,包括比亚迪、日产、西门子等业内巨头都有深度参与,向外界展示了一个足够丰富的生成式AI应用前景。

但在这些真正实现之前,黄仁勋还是要先拿出最强的GPU来稳住所有人的期待。

“工业革命新引擎”Blackwell

这次英伟达发布了Blackwell平台架构推理卡:这一平台以“二十世纪最杰出数学家之一”的DavidBlackwell的名字命名。采用台积电4NP制程工艺,搭载了2080亿颗晶体管,同时也是英伟达首个采用多芯片封装技术的GPU。

这一技术能将两颗GPU通过另一颗GraceGPU、将两颗B200GPU高速串联,将其视为一颗GPU来分配处理计算任务,同时提供完整的缓存一致性,还具有192GB高带宽内存(HBM3E),速度为8Gbps,每个芯片的带宽为1.8TB/秒。

展示性能提升更直观的例子是:OpenAI最新的GPT-4-1.8T的参数规模,2000台Blackwell只需要90天就可以完成训练。同样的工作量放在HopperGPU上则需要8000张才能完成。无论是电力还是生成token成本都能被降低至原本的四分之一,能耗与训练效率更是提升了25倍。

2018年,同样是在GTC大会主题演讲期间,黄仁勋曾表示:为了满足深度学习的计算需求,GPU效能将会每两年提升一倍以上。

这一“黄氏定律”Huang'slaw随着英伟达的巨大成功而广为流传,但现实往往更加激进:实际上硬件性能翻一倍的周期往往只有六个月,就被后来的挑战者所反超——但这更像是属于英伟达的独角戏,每次有资格站在擂台上挑战英伟达的,往往都只有英伟达自己,这也是黄教主敢在演讲中将英伟达与台积电相提并论,称英伟达实际上是一家“人工智能晶圆厂”的底气所在。

在GB200之上,英伟达还提供了通过NVIDIAQuantumInfiniBand网络技术,将数万台GB200并联成为真正的超级计算机的解决方案,这套系统能将数以十万计的BlackwellGPU串联成为一个整体,用于训练地球上最顶级的生成式AI大模型。

黄仁勋还在演讲中回忆起了自己亲自送货上门的第一台DGX——彼时这台具有划时代意义的训练设备被送给了OpenAI,当时只有0.17Petaflops的算力,而如GB200的算力,相比八年前的“初号机”已经提升了八千倍。

这次GB200的首发,除了OpenAI,包括亚马逊、Google、微软一集以及甲骨文也都是GB200的首批用户;此外随着模型参数体积越来越小,而用于训练的英伟达GPU性能越来越强,或许每个人都能训练出自己的ChatGPT的时刻,已经用不了多长时间了。

除了硬件,英伟达也很早就意识到,想让自己的硬件更受用户欢迎,优秀的软件不可或缺,颠覆时代的潜力往往也最早出现在软件之中,因此早在三十年之前,英伟达就在卖硬件的同时重金投资软件生态。

如果说英伟达显卡技术的进步推动了游戏产业的发展,也完全可以说枝繁叶茂的CUDAComputeUnifiedDeviceArchitecture,统一计算架构)开发生态,或许也让人类迈入AI时代的脚步提前了几年。

这次在生成式AI的软件平台上,英伟达还展示了用于企业用户开发展示工业数字孪生的工具OmniverseCloud,同时还宣布了对VisionPro的支持。

数字孪生这一概念出自工业用需求:指的是首先以数字的形式建造出一座工厂,以现实存在的原理模拟一切情况,以便于在实体工厂破土动工之前快速完成工厂的迭代设计,在工厂建成后,也可以使用数字孪生工厂快速重新调整各种配置,通过传感器捕捉各种工厂数据来优化工作流,进而降低成本。

而英伟达实现这一设想的平台就是OmniverseCloud,英伟达还现场展示了一段宣传片,展示了CGI工作室Katana在Omniverse平台上开发的汽车内饰模拟应用程序。

在这个宣传片所展示的场景中,设计师甚至可以直接进入车辆-通过利用空间计算的能力,将3D逼真的环境与物理世界融合。可以将手指伸向汽车模型作出各种调整,这些都能通过英伟达的云端平台实现串流。

英伟达同时公布了名为NIM的软件服务:这可以被看作是大模型的订阅制,方便开发者将自己的模型打包放进去,提供给所有用户,其中面对不同硬件、不同配置设备的兼容性问题,就不用开发者自己担心了。

除了可以以每年4500美元的订阅费用,无限量使用的单颗BlackwellGPU用于模型训练之外,NIM服务还支持在本地的高性能笔记本电脑上运行开发者自己的模型,你甚至可以将已经上传至NIM的其他大模型下载到本地,在自己的设备上端侧运行。

人形机器人

主题演讲的最后,黄仁勋发布了用于开发工业用人形机器人的基础模型ProjectGROOT,这也是一个用于帮助其他AI厂商开发人形机器人的通用软件平台。

和其他同台发布的软硬件产品一样,老黄也在主题演讲中,直接将合作伙伴的一众机器人请到了台前:其中包括来自AgilityRobotics、Apptronik以及宇树科技的共计九款机器人产品。

黄仁勋还带来了一个小彩蛋:一个酷似迪士尼动画主角Wall-E的机器人。

这些机器人与我们此前见到过的人形机器人最大的不同之处在于,这些机器人在设计之初就将“模仿人类行为”作为非常高优先级的目标,因此它们可以从现实环境中快速学习并掌握协调性、灵活性以及与现实世界互动所必须的诸多技能。

借助生成式AI的多模态感知能力,在这种算力与训练模式下,或许在工业场景中,很快就能见到某些特定领域表现堪比甚至反超人类的工业人形机器人了。「人形机器人的ChatGPT时刻即将到来」黄仁勋表示。

最后,黄仁勋还提醒观众:这几年生成式AI的发展如同坐过山车一般刺激,过去英伟达吹过的牛,正在一点点变成现实。但仍然有很长一段路要走。过去英伟达吹过的牛正在一点点变成现实。

“这是一个全新的事物”黄仁勋说“它不同于人类之前做过的任何事情”。

但对很多生成式AI的应用场景来讲,也只是刚刚踏上改变之路的第一步。

责任编辑: 陈勇洲
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换