您的位置: 首页 > IT > AMD于2020年11月16日发布全新架构计算卡Instinct MI100,AI性能暴涨7倍

AMD于2020年11月16日发布全新架构计算卡Instinct MI100,AI性能暴涨7倍

时间:2025-01-27 15:07:57 来源:互联网 编辑:阳阳资源网

Instinct MI100 是其迄今为止性能最高的HPC GPU,FP64双精度浮点性能首次突破10TFlops(也就是每秒1亿亿次),并在架构设计上专门加入了Matrix Core(矩阵核心),用于加速HPC、AI运算,号称在混合精度和FP16半精度的AI负载上,性能提升接近7倍。

AMD于2020年11月16日发布全新架构计算卡Instinct MI100,AI性能暴涨7倍

扩展阅读:

Instinct MI100 集成多达120个计算单元、7680个流处理器,搭配32GB HBM2,带宽高达1.23TB/s,同时支持PCIe 4.0,集成Infinity Fabric x16高速互联通道,峰值带宽达276GB/s(相当于PCIe 4.0 x16的大约4倍),而整卡功耗控制在300W。

AMD于2020年11月16日发布全新架构计算卡Instinct MI100,AI性能暴涨7倍

计算性能方面,FMA64/FP64双精度为11.5TFlops(每秒1.15亿亿次),FMA32/FP32单精度为23.1TFlops(每秒2.31亿亿次),FP32 Matrix单精度矩阵计算为46.1TFlops(每秒4.61亿亿次),FP16 Matrix半精度矩阵计算为184.6TFlops(每秒18.46亿亿次),Bfloat16浮点为92.3TFlops(每秒9.23亿亿次)。

如今的一块卡,就相当于20年前的一个大规模计算集群!

AMD上代计算卡Instinct MI50采用的还是Vega 20核心,60个计算单元,3840个流处理器,32GB HBM2显存带宽1TB/s,Infinity Fabric总线带宽92GB/s,功耗300W。

Instinct MI100的核心规模翻了一番,显存带宽提升了超过20%,Infinity Fabric带宽提升了整整2倍,但是功耗却完全没变(工艺应当也还是7nm),新架构的能效可见一斑。

AMD于2020年11月16日发布全新架构计算卡Instinct MI100,AI性能暴涨7倍

新卡的性能更是不可同日而语,FP64双精度、FP32单精度性能均提升74%,FP32矩阵性能提升接近2.5倍,AI负载性能更是几乎7倍的飞跃。

在美国能源部旗下的橡树岭国家实验室,AMD MI100计算卡已经在支撑多项百亿亿次科研项目,涉及NAMD分子动力学模拟、CHOLLA星系形成研究、PIConGPU激光放射癌症疗法、GESTS流体动力学等等诸多前沿科技。

AMD Instinct MI100计算卡还有一个绝佳搭档,那就是AMD自家的霄龙数据中心处理器,慧与、戴尔、超威、技嘉等多家行业巨头都有提供这种双A方案。

当然了,只有硬件,是做不成高性能计算的,AMD同时一直在推进一站式软件解决方案ROCm。

从2016年初入江湖的1.x版本,2018年奠定基础的2.0版本,到2019年专注于机器学习的3.0版本,再到如今最新的4.0版本,AMD ROCm已经打造成了一整套针对机器学习、高性能计算的百亿亿次级开发方案,规划中的各项功能特性也基本都已经实现。

软件优化的力量无疑是巨大的,可以充分释放硬件潜力,比如说上代MI50,搭配ROCm 3.0的话性能相比于搭配ROCm 2.0可以提升3-4倍,而最新的MI100、ROCm 4.0联合,更是可以轻松带来5-8倍的性能提升。
AMD ROCm生态的进步速度非常快,已经有众多领域的头部厂商采纳和支持,而且它沿袭了AMD一贯的原则,那就是完全开源开放,非常方便代码迁移,比如说HACC(宇宙学)只用了一个下午,SPECFEM3D(地震学)半天就搞定,CHOLLA(天体物理学)花了几天,QUDA(量子物理学)也不过21天。

NVIDIA引领创新,GeForce 256开启GPU时代!

NVIDIA于1999年8月发布GeForce 256(核心代号NV10),是由NVIDIA研发的第五代显示核心。此核心常简称为GeForce,这亦是NVIDIA第一个以"GeForce"为名的显示核心。 NVIDIA在产品宣传中,称GeForce 256为世界上第一个GPU,这是NVIDIA首创的词汇,GPU即是Graphics Processing Unit的缩写。

NVIDIA于1999年8月发布GeForce 256(NV10),首先提出了GPU的概念

扩展阅读

GeForce 256与前代(RIVA TNT2)相比增加Pixel Shader流水线的数目,支持硬体T&L引擎,亦支持MPEG-2硬体影象加速。

GeForce 256显示核心采用0.22微米制程制造,是256-bit显示架构,拥有4条像素流水线。

每一条有4个像素单元,1个材质单元。三角形生成率是每秒1500万个,像素生成率则是每秒4亿8000万个。

它拥有2300万个晶体管,数量已超过了PentiumIII,本应采用0.18微米制程去解决热量问题,但为了加速上市,唯有采用旧的工艺。但凭着四条像素流水线,性能依然强劲。GeForce 256一般配置为32MBSDRAM(中高端)或DDR SDRAM(高端)。由于DDR带宽是SDRAM的两倍,所以能提供较佳性能,尤其在高分辨率的情况下。某些厂商曾推出64MB版本,但非常罕见。

GeForce 256凭着它的功能和速度,在各路厂商的竞争中获取很好销量,令NVIDIA的电脑图形工业霸主地位更坚固。

NVIDIA于1999年8月发布GeForce 256(NV10),首先提出了GPU的概念

NVIDIA的成功,使3dfx,Matrox和S3 Graphics都变成牺牲品。就在GeForce 256发布后的几个月,竞争对手S3亦发布Savage 2000 Diamond Viper II。此产品内置硬体T&L,价格比GeForce 256便宜。但是,驱动带有缺陷,使T&L不能正常运作,而S3亦不打算对此修正。一年后,剩下ATi的Radeon显卡还能孤军作战。

NVIDIA提出GPU的概念

GPU(图形处理器)是NVIDIA就在发表NVIDIA GeForce 256(GeForce 256)绘图处理芯片时首先提出的概念,在此之前,电脑中处理影像输出的显示芯片,通常很少被视为是一个独立的运算单元。

而对手冶天科技(ATi)亦提出视觉处理器(Visual Processing Unit)概念。

图形处理器使显卡减少对中央处理器(cpu)的依赖,并分担部分原本是由中央处理器所担当的工作,尤其是在进行三维绘图运算时,功效更加明显。

图形处理器所采用的核心技术有硬件坐标转换与光源、立体环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等。

显卡OC与非OC版的区别:激发性能潜力的一击!

oc和非oc显卡的区别:1、OC后缀显卡支持自动超频,非OC后缀显卡需要用户手动开启超频;2、为了满足超频玩家的需求,OC后缀显卡在散热方面做了比无OC后缀显卡更多的优化和提升。

显卡带oc和不带oc的区别

显卡oc和不带oc的区别:

显卡型号中的【OC】是【over clock,超频】的缩写,表示该显卡在出厂前已经进行预超频处理。以下是OC后缀显卡和无OC后缀显卡的具体区别介绍:

1、超频能力不同:OC后缀显卡支持自动超频(默认频率更高);无OC后缀显卡需要用户手动开启超频。

2、散热性能不同:OC后缀显卡为了满足超频玩家需求,在散热上比无OC后缀显卡做了更多的优化和改进,以降低超频时带来的更大热量。

3、使用寿命不同:OC后缀显卡使用的显存颗粒比无OC后缀显卡寿命更长,以保证能够更长时间的维持高频运作状态。

hnqyjy.cn 版权所有 (C)2011 https://www.hnqyjy.cn All Rights Reserved 渝ICP备20008086号-34