2023-08-09 10:53

黄仁勋的深夜秀带来超强生成式AI处理器,AIGC迎来iPhone时刻

美国西部时间8月8日早晨,北京时间8日晚间,NVIDIA(英伟达)创始人兼CEO,“皮衣教主”黄仁勋在加州洛杉矶举办的“2023年世界电脑图形会议”(SIGGRAPH 2023)上,穿着自己那标志性的皮衣,开场先回顾了英伟达历史上的高光时刻,“20年前我们推出了RTX显卡,5年前我们将图形计算与AI结合,推出了《星战》Demo。”

仅仅几分钟后,黄仁勋的演讲,就从3D图形过渡到AI上了。作为AI 2.0浪潮中极具存在感的人物,黄仁勋为普及生成式AI提供了一系列堪称“生猛”的硬件,以及非常智能的应用和平台。当天的表演现场,黄仁勋又带来了新货:用于生成式AI的GH200 Grace Hopper超级芯片、NVIDIA AI Workbench以及通过生成式AI和OpenUSD升级的NVIDIA Omniverse。同时,黄仁勋还宣布英伟达与世界顶级AI开源社区Hugging Face展开合作,将把生成式AI必备的超级计算能力交付给全球数百万开发者,为他们构建大模型和AI应用提供支持。

在演讲的同时,黄仁勋依然坚持自己金牌销售的本色:“还是那句话,买的越多,省的越多。”


一、最强AI超算更上一层楼,“核弹工厂”即将上线


发布会上,黄仁勋感慨“生成式AI时代的来临,就像十几年前的iPhone时刻一样。”在五年前的SIGGRAPH上,英伟达通过将AI和实时光线追踪技术引入GPU,重新定义了电脑图形学。五年后的黄仁勋表示:“当我们通过AI重新定义电脑图形学时,我们也在为AI重新定义GPU。”结果就是二者的“双向奔赴”催生了越来越强大的系统,例如NVIDIA HGX H100,利用八个GPU,总计一万亿个晶体管,提供的加速计算能力比基于CPU的系统更显著。

五年已经过去,为了继续推动AI的发展,英伟达这次带来了Grace Hopper超级芯片,即NVIDIA GH200,将72核的Grace CPU与Hopper GPU相结合,提供一亿次每秒浮点运算(FLOPS)的强大算力和最大144TB的高速存储,在全球最快内存HBM3e的辅助下,内存容量高达141GB,提供每秒5TB的带宽。其单个GPU的容量就已达到H100 GPU的1.7倍,带宽达到H100的1.55倍,并已于年五月全面投产。

如果你以为新款芯片仅仅是性能强大那显然是管中窥豹,以偏概全了。它真正值得称道的是可扩展性,用“夸张到疯狂”形容都不过分。GH200 Grace Hopper超级芯片作为平台,同时连接多个GPU,用于处理复杂的生成式工作负载,包括大模型、推荐系统和矢量数据库。据黄仁勋介绍,与前代相比,新产品双配置的内存容量是之前的3.5倍,带宽是之前的3倍,服务器配备144个Arm Neoverse核心和高达282GB的最新HBM3e内存技术,AI性能支持每秒进行八千万亿次的数学运算。同时黄仁勋也预计,明年第二季度将有客户基于该平台推出自己的系统。

GH200 Grace Hopper超级芯片的实体图,中间黑影即黄仁勋

黄仁勋在现场抛出一个问题:“花一亿美元能买什么?”随后他自问自答的表示,过去一亿美元能买8800块x86 CPU组成的数据中心,功耗大约是5MW。现在一亿美元能买2500块GH200组成的Iso-Budget数据中心,功耗大约是3MW,而AI推理性能达到之前系统的12倍,能效则是20倍。如果要与x86 CPU数据中心的AI推理性能看齐,Iso-Troughput数据中心只需用到210块GH200,功耗约0.26MW,成本约800万美元,还不到CPU数据中心的10%。

至此就可以明白了为什么黄仁勋一再强调“买的越多,省的越多”。


二、刀法精准,四款显卡齐上新


与GH200 Grace Hopper超级芯片同步上新的还有桌面AI工作站GPU系列,而且是一口气推出四款新品:RTX 4000、RTX 4500、RTX 5000和RTX 6000。与GH200那种展示英伟达GPU技术和性能天花板的产品不同,这四款就是针对桌面和数据中心推出的,特别是成本预算有限的客户。

毋庸置疑的,作为旗舰级专业卡,RTX 6000的性能参数是四款中的最强者。凭借着48GB的显存,18176个CUDA核心,568个Tensor核心,142个RT核心,和高达960GB/s的带宽,它的表现在四者里堪称一骑绝尘。以此为基准逐步降低的,RTX 5000配备了32GB显存,12800个CUDA核心,400个Tensor核心,100个RT核心。RTX 4500配备了24GB显存,7680个CUDA核心,240个Tensor核心,60个RT核心。RTX 4000配备了20GB显存,6144个CUDA核心,192个Tensor核心,48个RT核心。

所有四款新品均采用4nm定制工艺,支持错误代码纠正,适用于大型3D模型、渲染图像、模拟和AI数据集的无误差计算。同时还支持高分辨率AR和VR设备,以提供创造AR、VR和MR内容所需的高性能图形。

同时基于此四款新品,黄仁勋还针对企业级客户准备了一套一站式解决方案--RTX Workstation,支持最多4张RTX 6000 GPU并联,可以在15小时内完成8.6亿token的GPT3-40B的微调任务,还能让Stable Diffusion XL每分钟生成40张图片,比之前的RTX 4090快五倍。该工作站系统将于秋季开始提供。


三、携手Hugging Face,普惠AIGC与大模型


除了这些炸裂级硬件产品外,黄仁勋还公布了三则关于英伟达与优化生成式AI的消息,这些将有助于加速行业采用基于LLM的生成式AI:1.英伟达和全球最大AI开源社区Hugging Face建立合作;2.推出NVIDIA AI Enterprise 4.0系统,把DGX Cloud中的所有功能集成到英伟达AI Enterprise软件中;3.推出NVIDIA AI Workbench,将需要用于生成式AI工作的一切都打包在一起,只用点击一下就能将这个项目移动到任何设备终端或云端。下面分开来说。

1、与Hugging Face合作:将全球数百万开发人员连接到生成式AI超级计算平台上。黄仁勋宣布,英伟达和Hugging Face建立合作伙伴关系,将为构建大模型和其他AI应用程序的开发人员提供生成式AI所需的超级算力。开发者可以访问Hugging Face平台内的NVIDIA DGX Cloud AI超级计算平台,来训练和微调自己的大模型。DGX Cloud的每个实例有八个NVIDIA H100或A100 80GB Tensor Core GPU,每个节点的GPU内存总计640GB。作为合作的一部分,Hugging Face将推出一项名为“训练集群即服务”的业务支出,以简化企业创建新的和自定义生成式大模型的流程。该服务由NVIDIA DGX Cloud提供支持,将在未来几个月内推出。

2、NVIDIA AI Workbench:在笔记本电脑上也能轻松启动生成式AI项目。这是个统一、易用的工作空间,能让开发者随处构建或运行自己的大模型。开发者可以很方便地将所有必要的模型、框架、数据库和SDK等素材,从开源代码库和NVIDIA AI平台打包到这个统一的开发者工作空间中,然后只需点击鼠标,就能将自己的大模型从一个位置移动到另一个位置。这样就能在PC、笔记本或工作站上快速创建、测试和定制预训练的大模型,并在需要时将其扩展到数据中心、公有云或NVIDIA DGX Cloud。举个例子,你可以在NVIDIA AI Workbench页面上导入项目,比如导入SDXL-dev文生图模型,输入“黄仁勋在太空”,结果因为模型似乎不认识老黄,生成的图像跟老黄的形象不能说完全一致,起码也是离的挺远,皮衣倒是一脉相承。

3、NVIDIA AI enterprise 4.0:提供一系列生成式AI工具最新版的企业软件平台。AI enterprise 4.0可提供生产就绪型生成式AI工具,并保证可靠的生产部署所需的安全性和API稳定性。AI Enterprise 4.0支持的软件和工具有助于简化生成式AI部署,其中一大亮点是引入用于构建、定制和部署大模型的云原生框架NVIDIA NeMo。其他工具还包括NVIDIA Triton管理服务,通过模型编排实现可扩展AI高效运行;NVIDIA Base Command Manager Essentials集群管理软件,帮助企业在数据中心、多云和混合云环境中最大限度提高AI服务器性能和利用率等。AI Enterprise软件支持用户跨云、数据中心和边缘构建和运行支持NVIDIA AI的解决方案,经认证可在主流NVIDIA认证系统、NVIDIA DGX系统、所有主要云平台和新发布的NVIDIA RTX上运行工作站。最新版本的企业软件平台将集成到谷歌云、微软Azure、Oracle云基础设施等NVIDIA合作伙伴市场。

四、从OpenUSD到ChatUSD,以及通过对话生成3D内容

本周,英伟达与苹果、Adobe和Autodesk等企业联手成立OpenUSD联盟,正在努力将它推向更广阔的世界。OpenUSD(Universal Scene Description)提供了一个开源,通用的场景描述格式,使不同品牌与类型的3D设计软件可以无障碍的彼此协作。因为英伟达自家的Omnivers就是建立在USD体系之上的,这次Omniverse针对OpenUSD的升级,使Omniverse能为开发者与企业推出了更多的框架和资源服务。

而将OpenUSD、AI以及Omniverse结合,开发者将能通过ChatUSD这样的对话式界面,直接用自然语言修改和创建3D环境及物体,极大简化3D内容的制作流程。OpenUSD将推动标准化进程并逐步扩展,这是开源的通用场景描述框架,以及实现互操作性的3D应用程序和项目的基础,涵盖从视觉效果到工业数字孪生的各个领域,如连接电影和动画流程,创建真实精确的实时数字工厂、仓库、城市甚至是地球的数字副本。

通过OpenUSD,不同的工具可以同时使用同样的素材和场景

在强大AI的推动下,协作式3D和工业数字化的时代正在到来。黄仁勋还表示未来的工厂将是机器人工厂,“机器人协调一大堆机器人来制造本身就是机器人的汽车”,“我们希望AI能够进行自我编程”,“未来,整个工厂将由软件定义。”

在刚刚过去的昨天,英伟达再次用爆炸级的产品,惊人的技术实力,高瞻远瞩的目光,让全世界再次看到它将如何引领全球AI和图形计算的新浪潮。在再次重复经典名言“买的越多,省的越多”后,黄仁勋缓缓走下舞台,却把现场气氛推向了极致。

本文链接:https://www.aixinzhijie.com/media/6829086
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇