您的位置  建站  经验

英伟达商用GPU和谷歌超算霸榜!MLPerf最新芯片跑分榜单还能看出啥?

  • 来源:互联网
  • |
  • 2020-07-31
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

7 月 30 日,MLPerf 发布了 MLPerf Training v0.7 的结果。MLPerf 是 2018 年发起的一套通用基准,用以测量和评价机器学习软硬件性能。目前有 70 多家 AI 公司和哈佛、斯坦福等 10 所研究机构参与。

MLPerf Training 的结果从 2018 年开始发布 v0.5 开始,每年发布一次,v0.7 是第三版。

每年的测试标准都会进行修订。相比于去年,v0.7 版基准测试增加了两项新的测试项目,以及一个原有项目的修订。

今年的测试项目按照视觉、语言、商业、研究分为四类,共八项基准(Benchmarks)。其中新增的两项是自然语言处理(NLP)模型 BERT推荐模型 DLRM。前者广泛应用于翻译、机器问答、文本生成等领域;后者则常应用于商业上的购物推荐、社交媒体推荐、搜索结果显示。

英伟达与谷歌霸榜

英伟达凭借其 5 月份新发布 A100 Tensor Core GPU 和 HDR InfiniBand 架构方案,实现了八项测试的性能大幅增长。与去年的 V100 相比,A100 的训练速度提升了 1.5 到 2.5 倍。 同时,它也是唯一一家以商用芯片参与了全部八项测试的公司

图 | 英伟达 A100 在 8 项测试中实现性能突破(来源:英伟达)

而在用于研究的芯片方面,谷歌表现不俗。其基于 TPU v3 和 TPU v4 研发的超级计算机,参与了其中的六项测试,性能也显著提升。

图 | 谷歌 TPU 在 Traning v0.7 上的性能提升(来源:谷歌官网)

图 | 谷歌超级计算机的改进(来源:谷歌官网)

英伟达的产品管理高级主管帕雷什 · 卡尔亚 (Paresh Kharya) 表示,“商用解决方案有一个非常严格的要求,即硬件、所有软件和所有组件都必须向客户提供第三方使用的证据。”

A100 在测试中的优异表现,也体现了其市场潜能。

A100 是英伟达首款基于安培(Ampere)架构的处理器,进入市场的速度也比以往任何 NVIDIA GPU 更快。A100 在发布之初用于第三代 DGX 系统,正式发布六周后即被谷歌云采用。

此外,AWS、百度云、微软 Azure 和腾讯云等全球领先的云提供商,以及 Dell Technologies、HPE、浪潮和超微等数十家主要服务器制造商,均采用了 A100。

图 | 使用对话式 AI 和推荐系统的英伟达客户(来源:英伟达)

性能与商用之争

谷歌参与测试的 TPU 属于研究类别的产品,较长一段时间内都不会面市。 如果不衡量商业使用,谷歌能够在 BERT 项目上实现目前的最优解。

英伟达用 2048 块 A100 芯片训练 BERT 用时花了 49 秒。在谷歌云上,使用 16 个 TPU 芯片的商业化方案,这个任务需要 57 分钟。而谷歌使用 4096 个 TPU 芯片,只需要 23 秒,取得了目前的最短时间纪录。

谷歌 Cloud TPU 产品经理扎克 · 斯通 (Zak Stone) 表示,他们突破性能极限的方式之一是建造世界上最快的超级计算机。

剩下的 21 种配置中,8 种来自谷歌,7 种来自英特尔,6 种来自华为。

硅谷芯片初创公司 Cerebras,以及英国芯片公司 Graphcore 都没有参与测试。他们认为,测试结果展现的竞争格局,并不能反映他们的客户感兴趣的实际工作。

目前 MLPerf 测试只衡量计算性能,而没有将能源效率作为指标。来自 MLPerf 的坎特(Kanter)表示,测量能源效率是一个挑战。这是由于参与竞争的不同系统的规模非常复杂,云计算模式和预定模式的消耗资源方式就非常不同。

参考:

https://mlperf.org/training-results-0-7

https://www.zdnet.com/article/nvidia-and-google-claim-bragging-rights-in-mlperf-benchmarks-as-ai-computers-get-bigger-and-bigger/

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186