中关村在线

游戏硬件

3090Ti会出现吗? RTX 30系显卡核心对比

截止目前,GeForce RTX 30系显卡的发布基本已经告一段落,虽然此次共有60、70、80、90的四个常规型号,以及Ti系列的三个型号,共7款显卡。但核心却只有三种,分别为GA102、GA104和GA106,所以这几个芯片到底有什么区别,所谓的阉割核心又有什么区别,下面笔者给大家逐一讲解一下。

在每个显卡的GPU核心中,包含无数的大大小小的处理单元,首先我们从最小的流处理器(SM)来看。

SM详解

在新的NVIDIA Ampere架构中,每个SM单元包含四个大的处理分区共128个CUDA核心,4个第三代Tensor Core,1个第二代RT Core,1个256 KB的缓存文件,1个128 KB的L1缓存,这个L1缓存可以根据不同的工作需求来调配缓存,工作效率发挥至最大。

本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。

而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。

如刚刚发布的GeForce RTX 3070 Ti共有6144个CUDA,其实它有3072个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了6144的CUDA数量。

01 GA102核心

完整的GA102核心

完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成。在整个架构图中,GPC是占据主导地位的高级模块,拥有所有的关键图形处理单元,每个GPC包含一个专用光栅引擎。在新的NVIDIA Ampere架构中,每个GPC还包含了两个ROP分区,每个分区包含8个ROP单元。

根据图中可以计算出,完整GA102核心的CUDA数量应该是10752个,目前还没有一款显卡达到,即便是RTX 3090的CUDA数量也只是10496个,所以可以推断RTX 3090屏蔽了一组TPC,意味着只有82个SM单元。

所以从理论上来讲,GA102还有余力,而且RTX 3080 Ti和RTX 3090也只差了2个SM单元,GeForce RTX 3090 Ti的出现也不是没有可能。

RTX 3080阉割后的GA102核心

上图为RTX 3080所使用的GA102核心,即便我们不知道架构原理,但也能明显看出该核心被大幅削减过,RTX 3080共有8704个CUDA,所以可以推算出相比完整的GA102,其屏蔽了8组TPC,也就是少了16个SM单元,2048个CUDA。

02 GA104核心

GA104核心示意

RTX 3060 Ti、RTX 3070以及RTX 3070 Ti均采用了GA104核心,不过NVIDIA官方并没有放出架构图,我们只能以完整的GA102来做参考。

RTX 3070共有5888个CUDA,所以根据我们之前的计算,可以推算出,RTX 3070共有46个SM单元,23个TPC,也就是上图中圈出来的范围。但我们仅以数量来进行参考,真正的核心设计不可能只是简单粗暴的裁剪。

RTX 3060 Ti共有4864个CUDA,RTX 3070 Ti共有6144个CUDA,大家也可以动手计算一下这两个卡都各有多少TPC,多少个SM单元。

03 GA106核心

完整的GA106核心

目前采用GA106核心的只有RTX 3060,完整的GA106 GPU包含3个GPC(图形处理集群)15个TPC(纹理处理集群)30个SM(流处理器)3840个CUDA。而RTX 3060共有3584个CUDA,28个SM单元,所以使用的也并不是完整的GA106核心。

从目前发售的显卡来看,使用GA106核心的只有RTX 3060;使用GA104核心的则有RTX 3060 Ti、RTX 3070、RTX 3070 Ti;而使用GA102核心的则有RTX 3080、RTX 3080 Ti、RTX 3090,包含整个RTX 30系家族共有7款显卡。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具