首页>>文章资讯>>主机推荐

亚马逊云科技将提供GB200Grace和B100CoreGPU平台

2024-03-24 00:22:39 167

3月20日消息,亚马逊云科技和英伟达宣布,英伟达在2024年GTC大会上推出的新一代 GPU平台即将登陆亚马逊云科技。亚马逊云科技将提供 GB200 Grace 和 B100 Core GPU。

英伟达在亚马逊云科技上的应用,使得该平台在应对资源密集型和数万亿参数语言模型等推理工作负载加速方面实现了巨大飞跃。

GB200 Grace 是英伟达刚刚在2024年GTC大会推出的最新GPU产品。

亚马逊云服务器_亚马逊云服务器多少钱一年_亚马逊云

新的 B200 GPU 由 2080 亿个晶体管组成,而 GB200 包含了两个 B200 GPU 和一个 Grace CPU。

亚马逊云服务器_亚马逊云_亚马逊云服务器多少钱一年

在单芯片训练方面的 FP8 性能是其上一代架构的 2.5 倍,在推理方面的 FP4 性能是其上一代架构的 5 倍。在具有 1750 亿个参数的 GPT-3 大语言模型基准测试中,GB200 性能是 H100 的 7 倍,训练速度是 H100 的 4 倍,成本和能耗上GB200 比 H100 降低了 25 倍。

据介绍,亚马逊云科技将提供配置GB200 NVL72的英伟达平台,它配备72颗 GPU和36颗Grace CPU,通过第五代 互连。当与亚马逊云科技的EFA网络、 Nitro高级虚拟化系统和 EC2 超大规模集群等技术结合时,客户能够轻松扩展至数千个GB200 。

亚马逊云服务器多少钱一年_亚马逊云服务器_亚马逊云

亚马逊云服务器_亚马逊云_亚马逊云服务器多少钱一年

GB200 NVL72 是一种多节点、液冷、机架级系统,利用 为万亿参数模型提供强力计算,在单个机架中可实现 720 的 AI 训练性能和1.4 的AI推理性能。

在安全性方面,亚马逊云科技的Nitro 系统、 KMS、EFA加密 和 加密的集成将为客户提供对其训练数据和模型权重的端到端控制,从而为客户在亚马逊云科技上的生成式AI应用程序提供更强的安全性。

也加入了双方合作的 Ceiba项目,该项目专为自身的AI研发工作设计,是一台亚马逊云科技上托管的采用DGX Cloud的AI超级计算机,它搭载了20,736颗GB200 芯片,并通过第四代EFA网络扩展,为每个提供高达800 Gbps的低延迟、高带宽网络吞吐量,能够提供414 的计算能力,与之前计划在架构上构建Ceiba相比,性能提升了6倍。

同时,亚马逊云科技与英伟达联手,通过 与 NIM推理微服务的整合,提供了高性能、低成本的生成式AI推理解决方案,该服务作为 AI企业版的一部分提供。客户可以利用这一组合在 中快速部署和运行已预编译且对 GPU进行优化的基础模型,缩短生成式AI应用的推出时间。

亚马逊云科技与英伟达还在利用计算机辅助的药物发现领域进行合作拓展,推出了新的 基础模型,用于生成化学、蛋白质结构预测,以及理解药物分子与目标的相互作用。这些新模型将很快在 上提供,这是一个专为帮助医疗保健和生命科学组织存储、查询和分析基因组、转录组及其他组学数据而设计的专用服务。

和英伟达医疗保健团队还合作推出生成式AI微服务,以推进药物发现、医疗技术和数字健康领域的发展,该服务提供一个新的GPU加速的云端服务目录,涵盖生物学、化学、成像和医疗保健数据,以便医疗企业能够在亚马逊云科技上利用生成式AI的最新成果。

亚马逊云科技首席执行官Adam 表示:“我们双方的深入合作可以追溯到13年前,当时我们共同推出了世界上第一个亚马逊云科技上的GPU云实例,而今天我们为客户提供了最广泛的英伟达GPU解决方案。英伟达的下一代Grace 处理器是生成式AI和GPU计算领域的标志性事件。当结合亚马逊云科技强大的EFA网络、 EC2 的超大规模集群功能,以及我们独有的 Nitro高级虚拟化系统及其安全功能时,我们就能够使客户更快、更大规模且更安全地构建和运行具有数万亿参数的大型语言模型。”