英伟达H100给AI圈的一点“小小震撼”:11分钟训完GPT-3,霸榜8
11 分钟内训练一遍 GPT-3,8 秒训完 BERT。
这就是英伟达给 AI 圈的一点“小小震撼”。
在最新 MLPerf 训练基准测试中,英伟达 H100 集群,横扫八项测试,全部创下新纪录,并且在大语言模型任务中表现尤为突出!
在大语言模型任务中,H100 集群的加速性能逼近线性增长。
即随着集群处理器数量增加,加速效果也几乎同比增加。
这意味着在集群内 GPU 之间的通信效率非常高。
除此之外,H100 还完成了推荐算法、CV、医学图像识别以及语音识别等任务,是唯一一个参加 8 项测试的集群。
而在算力就是生产力的时代下,这波成绩意味着什么,懂得都懂。
据悉,本次测试系统由英伟达和 Inflection AI 联合开发,在云厂商 CoreWeave 上托管。
单节点性能增长明显
这次 MLPerf Training v3.0 中增加了两项新任务:
大语言模型
推荐算法
这意味着测试任务包含了更大的数据集和更先进的模型。
如上刷新各项记录的,是由 3584 块 H100 组成的超大集群。
它的具体成绩如下:
这是本轮测试中,英伟达拿出的最大集群。
实际上他们还提交了一个包含 768 块 H100 的集群进行测试,并分别在云上和本地部署。
结果显示二者性能几乎完全相同。
更进一步还论证了随着集群中显卡数量的增加,其性能提升可以接近线性增长。
除此之外,这轮测试中英伟达还刷新了单节点加速记录。
和 6 个月前 MLPef Training v2.1 的数据比较,单个 DGX H100 系统在各项任务中平均提速 17%。
和 A100 Tensor Core GPU 相比,最高能提速 3.1 倍。
这些加速效果的实现,主要得益于两个方面。
一方面是 H100 本身就足够强悍。
H100 基于最新 Hopper 架构,采用台积电 4nm 工艺,集成 800 亿个晶体管,较 A100 增加了 260 亿个。
内核数量达到前所未有的 16896 个,是 A100 的 2.5 倍。
由于面向 AI 计算,H100 中专门搭载了 Transformer Engine,让大模型训练速度可直接 ×6。
另一方面则是依赖集群内的加速网络。
这里使用的是英伟达 Quantum-2 InfiniBand 网络,是该网络架构的第七代。
据悉,共有 90 个系统参与最新一轮测试,其中 82 个使用了英伟达的 GPU,英特尔方面有 7 个系统参与。
英特尔的加速系统使用了 64-96 Intel Xeon Platinum 8380 处理器和 256-389 Intel Habana Gaudi2 加速器。
其高配系统完成 LLM 的训练时间为 311 分钟。
基于这次报告的测试结果,有分析师表示他感受到的最大震撼不是 H100 本身的性能,而是在云上训练 AI 实现的卓越效果。
那么这次和英伟达合作的云厂商 CoreWeave 是谁?联合开发系统 Inflection AI 又来者何人?
计算集群还会进一步扩大
首先来看 CoreWeave。
它成立于 2017 年,是一家大型云厂商,号称提供业内最快、最灵活的大规模 GPU 计算资源,提供渲染、机器学习等云上方案,速度比大型公共云快 35 倍,成本低 80%。
而这家云厂商很受科技巨头青睐,英伟达在此之前没少 cue 过它。
5 月,CoreWeave 拿下 2 亿美元融资,主要来自对冲基金 Magnetar Capital,B 轮总融资额达到 4.21 亿美元。
6 月,有消息称微软与 CoreWeave 签署 AI 算力协议,用于计算基础设施,未来数年内的投资金额可能数十亿美元。
英伟达也向 CoreWeave 投资了 1 亿美元,4 月时它的估值为 20 亿美元。
另一家 AI 初创公司 Inflection AI 由 DeepMind 创始成员穆斯塔法?苏莱曼等人创立。
这家公司成立于 22 年 3 月,已拿下 2.25 亿美元融资,估值超 12 亿美元。
公司已经开发出了一个大语言模型 Pi,正是在 H100 集群上训练出来的。
据了解,Pi 的定位是帮助人类更好和计算机交互,它能通过聊天内容来逐渐了解用户,然后提供更加个性化的回答,类似于个人智能管家的感觉。
Inflection AI 的最新 Blog 里表示,基于目前的合作,他们计划在未来几个月内进一步扩大底层计算基础设施的规模。
参考链接:
广告声明:本文含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考。IT之家所有文章均包含本声明。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
责任编辑:余梓阳
最新阅读
-
“深交所·创享荟”打造资本市场服务国企改革新典范
9月27日,深交所举办第九期“创享荟”国企专业化整合专场活动。“创享荟”是深交所着力打造的具有深市特色的市场服务品牌,目前已围绕热点主题举办了多期专场活动,影响力和吸引力不断增强。 深交所相关负...
-
微软在GitHub上线开发工具包,助力开发者使用Rust语言编写Wind
,微软Azure首席技术官MarkRussinovich日前在X平台发文,公开微软最近宣布“扩大采用Rust语言的成果”,微软同时还在GitHub中发布了一系列开发工具包,让开发者可以使用Rust语言...
-
擦亮“金融为民”底色光大银行多维发力谱写“人民金融”新篇章
像这样面向听障人士的手语服务模式,光大银行已持续运行了四年。四年来,光大银行通过收集听障客群金融业务需求及沟通痛点,让金融服务更贴近听障人士的日常生活。而这,只是光大银行践行“金融为民”初心,努力提供...
-
云南信托联合多家金融机构进乡村开展金融知识普及教育
近日,为帮助广大农村群众进一步提升金融素养及金融风险防范意识,助力打造诚信、健康、安全、和谐的金融环境,在云南省农村信用社联合社、昆明市农村信用社联合社及昆明市西山区农村信用合作联社的共同协调组织下,...
-
“领头羊”计划走进广州番禺,超59家企业具备上市潜力
南方财经全媒体记者翁榕涛实习生曾日丽广州报道 9月26日下午,广州企业上市“领头羊”行动计划“番禺行动”启动仪式在番禺节能科技园交流中心举行。 据南方财经全媒体记者了解,今年7月以来,广州市地方金...
-
算力牛股中际旭创股价“反攻”800G能否助三季度业绩惯性增长?
21世纪经济报道记者雷晨实习生原婷婷北京报道 近期受国内外AI利好消息驱动,二级市场上,中际旭创股价重新抬头,9月26日、9月27日连续上涨。截至9月27日收盘,公司股价报收于114.07元/股,收...
-
索尼申请外置小型触摸屏专利,可“架在”PS5手柄上远程游玩游戏
,据外媒gamerant报道,索尼近日注册了一项新专利,从文件内容上来看,这项专利主要显示,外加可以使用一个“触摸屏”连接DualSense手柄,来游玩PS5游戏。 图源索尼 索尼于此前正式公布了...
-
14幅图看懂债市潮起潮落
超越城乡居民储蓄存款规模和A股总市值,拥有百万亿以上体量的债券。如同资产配置中的“米面粮油”,在投资中无处不在。相较于股票,您可能是更加委婉地参与其中,大部分人是通过银行理财、债券基金、保险、资管计划...
-
国庆黄金周运输今日启动,长三角铁路预计发送超250万人次
国庆黄金周运输启动。 9月27日,澎湃新闻记者从中国铁路上海局集团有限公司获悉,今天是铁路国庆黄金周运输首日,长三角铁路预计发送旅客逾250万人次,较2019年同期多发送60余万人次,增幅超三成。 ...
-
阿里拟分拆菜鸟在港上市菜鸟子公司已申请上百项物流专利
9月26日,阿里巴巴港交所公告,拟通过以菜鸟股份于香港联交所主板独立上市的方式分拆菜鸟。拟议分拆完成后,阿里巴巴将继续持有菜鸟50%以上的股份,菜鸟将仍为其子公司。 天眼查App显示,菜鸟网络科技有...