NVIDIA 近日首次公开展示其资料中心规模等级的超级电脑 Eos,可处理大规模的 AI 工作负载,像是训练大型语言模型、推荐系统以及量子模拟等,显示「AI 工厂」已然成型。
NVIDIA 在本周四发布了一段影片,首次展示超级电脑 Eos。Eos 是一个超大型 NVIDIA DGX SuperPOD,它由 576 个 NVIDIA DGX H100 系统、NVIDIA Quantum-2 InfiniBand 网路和软体构建而成,可提供总共 18.4 exaflops 的 FP8 AI 效能。
此外,每个 DGX H100 系统均配备 8 个 NVIDIA H100 Tensor 核心 GPU,Eos 共有 4,608 个 H100 GPU。
Eos 在 2023 年 11 月 Supercomputing 2023 大会(SC23)上亮相,而这是 NVIDIA 首次公开展示这台前 10 大超级电脑的运作。Eos 在全球最快超级电脑 TOP500 中排名第 9。
NVIDIA 指出,Eos 的到来恰逢其时。因为人们正在利用生成式 AI 改变世界,从药物探索到聊天机器人,再到自主机器等等。
为了实现这些突破,他们需要的不仅仅是 AI 专业知识和开发技能。而是需要一个 AI 工厂,一个随时可用的专用 AI 引擎,并有助於提升他们构建大规模 AI 模型的能力,而 Eos 正巧就是解方,此次展示影片也让人们可以一睹为先进 AI 工厂提供动力的架构。
Eos 在去年 11 月最新的 MLPerf 产业基准测试中展现了非凡能力,在 3.9 分钟内完成基於 GPT-3 模型、拥有 1750 亿个参数的训练基准,与 NVIDIA 於此测试在不到六个月前甫推出时所创下的 10.9 分钟纪录相比,本次成绩提高了近 3 倍,创下新记录。
NVIDIA 在新闻稿中表示,随着世界各地的企业和开发人员寻求利用 AI 的力量,Eos 将成为一种「关键资源」。
为迎接 AI 时代,「AI 工厂」已准备好
NVIDIA CEO 黄仁勳去年出席鸿海科技日时,曾提出「AI 工厂」概念:「AI 资料中心处理堆积如山的连续资料,以训练和完善人工智慧模型。投入的原始资料经过提炼便产生出智慧——企业制造出智慧,运行着巨大的 AI 工厂。」
他认为,未来每一家企业都会有一个自己的 AI 工厂,这个工厂内有大量资料,人们将资料输入超级电脑後,让 AI 学习与运作,这些由 AI 生成的资料与内容,又将成为企业日後发展的重要养分,并可应用在工厂、机器人、程式码、制造等领域。而这个工厂将高强度不间断地运行,且只要提升一点点品质,便能显着提升客户参与度与公司利润。
近期,黄仁勳也呼吁各国政府,应当尽速打造 AI 基础设施,「剩下来的工作就真的要靠你们采取主动,启动你们的产业,尽快建立基础设施。」
核稿编辑:Jocelyn
快加入 INSIDE Google News 按下追踪,给你最新、最 IN 的科技新闻!