1月15日最新披露,VideoCardz 揭晓英伟达潜心研发中的6GB显存RTX 3050显卡,透露即将在未来数周内上市动态。
与 2022 年 1 月推出的 8GB 显存版 RTX 3050 不同,这款新型号的内核数更少、显存更少、带宽和功耗也更小。
这款显卡配备 2304 个 CUDA 核心,规格类似于 RTX 3050 OEM 版本,但显存总线位宽减少到 96bit,因此带宽直接从 224 GB/s 下降至 168 GB/s。
TX 3050 8GB 与 RTX 3050 6GB 对比
CUDA:2560 → 2304(-10%)
显存:8GB → 6GB(-25%)
带宽:224 GB/s → 168 GB/s(-25%)
GPU 频率: 1552/1777 MHz → 1042/1470 MHz(-32%/-17%)
TDP:130W → 70W(-46%)
从规格来看,这款显卡完全可以命名为 RTX 3040 而不是 3050,外媒预测它的定价会在 179 美元(当前约 1285 元人民币)左右,相比现有 RTX 3050 更加划算。
此外,考虑到仅 70W 的 TDP 设计,这款显卡完全可以仅凭 PCIe 供电轻松驱动,所以相信会有很多厂商推出无外接供电的刀卡,甚至被动散热式显卡,敬请期待。
7月30日消息,NVIDIA创始人黄仁勋在SIGGRAPH 2024峰会上宣布,自本周起,公司将向客户寄送基于全新Blackwell架构的样品。这一举动标志着NVIDIA在高性能计算和图形处理领域再次迈出重要一步。
消息源还曝料称英伟达为了准备 Blackwell 产品,已经大幅削减了消费级显卡的供应,最高降幅为 50%,导致显卡供应出现短缺和新一轮涨价。
消息称受英伟达涨价影响,华硕、技嘉、微星、华擎等厂商都在酝酿新一轮显卡涨价。
供应链消息源表示英伟达本次减产的是 RTX 40 系列为主的高端显卡,尤其是 RTX 4070 及以上的高端显卡缺货最为明显。
该消息源表示英伟达削减 RTX 40 系列显卡产能主要有两方面因素:
将消费级高端显卡的产能转移到 Blackwell 产品上。
开始紧缩 RTX 40 系列供应,为即将到来的 RTX 50 系列做准备。
业内消息称,英伟达的产品早在今年第 1 季度就有削减产能苗头,附上相关信息如下:
2024 年第 1 季度,英伟达 RTX 4060 和 RTX 4060 Ti 开始出现供货短缺情况
4 月,RTX 4060、3050 及 GTX 1650 入门级显卡开始涨价
现在 RTX 4070、4080、4090 中高端显卡被曝出涨价
近日,英伟达确认其云游戏服务GeForce NOW将于2024年11月起停止支持Windows 7、Windows 8.1以及macOS 10.11至10.14等旧版操作系统。
英伟达在本周二悄然更新了支持页面以宣布这一变动,尽管用户可通过Web浏览器在这些旧系统上继续访问GeForce NOW,但仍可能无法获得最新功能和安全更新。
此外,公司还公布了即将在8月加入GeForce NOW游戏阵容的名单。
本周新增游戏:
《Stormgate》:(Steam,7 月 30 日)
《Space for Sale》:(Steam,7 月 30 日)
《Cyber Knights:Flashpoint》(Steam)
《Dark and Darker》:(Steam)
《祇:女神之路》(Xbox,可在 PC Game Pass 上玩)
《祇:女神之路》试玩版(Steam 和 Xbox)
近日消息,英伟达举办了一场专属媒体吹风会,预先揭开了Blackwell平台的神秘面纱,这一举动引起了科技界的广泛关注。
据悉,英伟达将在即将召开的Hot Chips 2024大会(8月25日至27日)期间,正式对外展示Blackwell平台在数据中心应用的详细情况,分享其如何革新数据中心的运算效率与能力,这无疑是大会的一大亮点,也是英伟达技术实力的又一展现。
否认 Blackwell 推迟上市消息
英伟达在本次吹风会上,驳斥了 Blackwell 推迟上市的消息,并分享了更多数据中心 Goliath 的相关信息。
英伟达在吹风会上演示了 Blackwell 在其一个数据中心的运行情况,并强调 Blackwell 正在按计划推进,并将于今年晚些时候向客户发货。
有消息称 Blackwell 存在某种缺陷或问题,今年无法投放市场,这种说法是站不住脚的。
Blackwell 简介
英伟达表示 Blackwell 不仅仅是一款芯片,它还是一个平台。就像 Hopper 一样,Blackwell 包含面向数据中心、云计算和人工智能客户的大量设计,每个 Blackwell 产品都由不同的芯片组成。
附上包括的芯片如下:
Blackwell GPU
Grace CPU
NVLINK Switch Chip
Bluefield-3
ConnectX-7
ConnectX-8
Spectrum-4
Quantum-3
Blackwell 桥架
英伟达还分享了 Blackwell 系列产品中各种桥架的全新图片。这些是首次分享的 Blackwell 桥架图片,展示了设计下一代数据中心平台所需的大量专业工程技术。
目标万亿参数 AI 模型
Blackwell 旨在满足现代人工智能的需求,并为大型语言模型(如 Meta 的 405B Llama-3.1)提供出色的性能。随着 LLMs 的规模越来越大,参数也越来越多,数据中心将需要更多的计算和更低的延迟。
多 GPU 推理方法
多 GPU 推理方法是在多个 GPU 上进行计算,以获得低延迟和高吞吐量,但采用多 GPU 路线也有其复杂性。多 GPU 环境中的每个 GPU 都必须将计算结果发送给每一层的其他 GPU,这就需要高带宽的 GPU 对 GPU 通信。
多 GPU 推理方法是在多个 GPU 上进行计算,以获得低延迟和高吞吐量,但采用多 GPU 路线也有其复杂性。多 GPU 环境中的每个 GPU 都必须将计算结果发送给每一层的其他 GPU,这就需要高带宽的 GPU 对 GPU 通信。
更快的 NVLINK 交换机
通过 Blackwell,NVIDIA 推出了速度更快的 NVLINK 交换机,将结构带宽提高了一倍,达到 1.8 TB/s。NVLINK 交换机本身是基于台积电 4NP 节点的 800mm2 芯片,可将 NVLINK 扩展到 GB200 NVL72 机架中的 72 个 GPU。
该芯片通过 72 个端口提供 7.2 TB/s 的全对全双向带宽,网内计算能力为 3.6 TFLOPs。NVLINK 交换机托盘配有两个这样的交换机,提供高达 14.4 TB/s 的总带宽。
水冷散热
英伟达采用水冷散热,来提升性能和效率。GB200、Grace Blackwell GB200 和 B200 系统将采用这些新的液冷解决方案,可将数据中心设施的电力成本最多降低 28%。
首张使用 FP4 计算生成的人工智能图像
英伟达™(NVIDIA®)还分享了全球首张使用 FP4 计算生成的人工智能图像。图中显示,FP4 量化模型生成的 4 位兔子图像与 FP16 模型非常相似,但速度更快。
由 MLPerf 在稳定扩散中使用 Blackwell 制作而成。现在,降低精度(从 FP16 到 FP4)所面临的挑战是会损失一些精度。
hnqyjy.cn 版权所有 (C)2011 https://www.hnqyjy.cn All Rights Reserved 渝ICP备20008086号-34