kaiyun体育(中国)全站app官网进口下载装置官方网站IOS/安卓通用版/手机APP下载
11 分钟内练习一遍 GPT-3,小小震动8 秒训完 BERT。英伟
这便是达H的点英伟达给 AI 圈的一点“小小震动”。
在最新 MLPerf 练习基准测试中,分钟英伟达 H100 集群,训完横扫八项测试,小小震动kaiyun体育(中国)全站app官网进口下载装置官方网站IOS/安卓通用版/手机APP下载全数创下新记载,英伟并且在大说话模子使命中表现尤其凸起!达H的点
在大说话模子使命中,小小震动H100 集群的英伟加快机能迫近线性增添。
即跟着集群处置器数目增添,达H的点加快成果也几近同比增添。分钟
这象征着在集群内 GPU 之间的训完博亚体育官网进口app最新版(中国)官方网站IOS/安卓通用版/手机APP通讯效力很是高。
除此以外,H100 还完成了保举算法、CV、医学图象辨认和语音辨认等使命,是独一一个到场 8 项测试的集群。
而在算力便是出产力的时期下,这波成就象征着甚么,晓得都懂。
据悉,本次测试体系由英伟达和 Inflection AI 结合开辟,kaiyun体育(中国)全站app官网进口下载装置官方网站IOS/安卓通用版/手机APP下载在云厂商 CoreWeave 上托管。
此次 MLPerf Training v3.0 中增添了两项新使命:
大说话模子(基于 GPT-3)
保举算法
这象征着测试使命包罗了更大的数据集和更进步前辈的模子。
如上革新各项记实的,是由 3584 块H100 构成的超大集群。
它的详细成就以下:
这是本轮测试中,英伟达拿出的最大集群。
现实上他们还提交了一个包罗 768 块 H100 的集群停止测试,并别离在云上和本地安排。
成果显现两者机能几近完整不异。
更进一步还论证了跟着集群中显卡数目的增添,其机能晋升能够或许靠近线性增添。
(NVIDIA Pre-Eos 为本地安排,NVIDIA+CoreWeave 为云上安排)
除此以外,这轮测试中英伟达还革新了单节点加快记实。
和 6 个月前 MLPef Training v2.1 的数据比拟,单个 DGX H100 体系(8 块 H100 构成)在各项使命中均匀提速 17%。
和 A100 Tensor Core GPU 比拟,最高能提速 3.1 倍(BERT 使命)。
这些加快成果的完成,首要得益于两个方面。
一方面是 H100 自身就充足刁悍。
H100 基于最新 Hopper 架构,接纳台积电 4nm 工艺,集成 800 亿个晶体管,较 A100 增添了 260 亿个。
内核数目到达史无前例的 16896 个,是 A100 的 2.5 倍。
因为面向 AI 计较,H100 中专门搭载了 Transformer Engine,让大模子练习速率可间接 ×6。
另外一方面则是依靠集群内的加快收集。
这里利用的是英伟达 Quantum-2 InfiniBand收集,是该收集架构的第七代。
官网先容,加快收集能够或许供给软件界说收集、收集内计较、机能断绝、优胜加快引擎、RDMA 和最快达 400Gb / s 的宁静加快。
据悉,共有 90 个体系到场最新一轮测试,此中 82 个利用了英伟达的 GPU,英特尔方面有 7 个体系到场。
英特尔的加快体系利用了 64-96 Intel Xeon Platinum 8380 处置器和 256-389 Intel Habana Gaudi2 加快器。
其高配体系完成 LLM 的练习时候为 311 分钟。
基于此次报告的测试成果,有阐发师表现他感触感染到的最大震动不是 H100 自身的机能,而是在云上练习 AI 完成的出色成果。
那末此次和英伟达协作的云厂商 CoreWeave 是谁?结合开辟体系 Inflection AI 又来者何人?
起首来看 CoreWeave。
它建立于 2017 年,是一家大型云厂商,号称供给业内最快、最矫捷的大范围 GPU 计较资本,供给衬着、机械进修等云上打算,速率比大型大众云快 35 倍,本钱低 80%。
而这家云厂商很受科技巨子喜爱,英伟达在此之前没少 cue 过它。
5 月,CoreWeave 拿下 2 亿美圆融资,首要来自对冲基金 Magnetar Capital,B 轮总融资额到达 4.21 亿美圆。
6 月,有动静称微软与 CoreWeave 签订 AI 算力和谈,用于计较根本举措措施,将来数年内的投资金额能够数十亿美圆。
英伟达也向 CoreWeave 投资了 1 亿美圆,4 月时它的估值为 20 亿美圆。
另外一家 AI 草创公司 Inflection AI 由 DeepMind 开创成员穆斯塔法・苏莱曼(Mustafa Suleyman)等人创建。
这家公司建立于 22 年 3 月,已拿下 2.25 亿美圆融资,估值超 12 亿美圆。
公司已开辟出了一个大说话模子 Pi,恰是在 H100 集群上练习出来的。
据领会,Pi 的定位是赞助人类更好和计较机交互,它能经由过程谈天内容来逐步领会用户,而后供给加倍特性化的回覆,近似于小我智能管家的感受。
Inflection AI 的最新 Blog 里表现,基于今朝的协作,他们打算在将来几个月内进一步扩展底层计较根本举措措施的范围。
参考链接:
[1]//blogs.nvidia.com/blog/2023/06/27/generative-ai-debut-mlperf/?continueFlag=685ee2dc8db6455efed731baa85e2741
[2]//developer.nvidia.com/blog/breaking-mlperf-training-records-with-nvidia-h100-gpus/
[3]//www.forbes.com/sites/stevemcdowell/2023/06/27/nvidia-h100-dominates-new-mlperf-v30-benchmark-results/?sh=62b226c35e99
本文来自微信公家号:量子位 (ID:QbitAI),作者:明敏
告白申明:本文含有的对外跳转链接(包罗不限于超链接、二维码、口令等情势),用于通报更多信息,节流甄选时候,成果仅供参考。IT之家一切文章均包罗本申明。
停止时候:2023-08-16 13:36:13
礼包内容:潮水纤维*50,金币*1
停止时候:2023-08-16 13:36:13
礼包内容:瓶盖*1000
停止时候:2023-08-16 13:36:13
礼包内容:瓶盖*600,潮水纤维*20
6月小非农大爆炸!美国ADP失业增添49.7万人,为预期两倍多
日期 2023-08-16 12:1815MB
检查5MB
检查853MB
检查1119MB
检查67MB
检查8MB
检查56MB
检查5MB
检查
网友批评
2467 白夜_7831
叨教列位网友天猫与淘宝哪一个好,有甚么区分,哪一个买工具更实惠更自制
2023-08-15 来自湖南 保举
6 ⚡️骏航⚡️
叨教马来西亚能不能用?
2023-08-15 来自湖南 保举
869 星桃的风
为了套那10块钱滴积分红包真是不轻易呀
2023-08-15 来自湖南 保举
3685 啊辞丶
我来评个价吧
2023-08-15 来自湖南 保举
97441 肯德基。
叨教马来西亚能不能用?
2023-08-15 来自湖南 保举