刚才提到过NVIDIA过去的几款中高端性能级显卡Geforce5900XT、Geforce6800GS和Geforce7900GS等,他们都有一个共同点——都是基于当代高端核心的工艺改进版本,再进行简化所得,要么在频率上降低,要么在渲染管线数量上删减。而到了G92这一代NVIDIA做法有点不一样了,G92是一款全新设计的芯片。
![]() |
G92外观上与Geforce6800的NV40核心比较相似
![]() |
被牵开盖子的G80核心
65nm工艺也跌眼镜——核心面积过大
编辑第一眼看到核心的时候,其实有点失望,采用了最新65nm工艺制造的G92核心面积比预想中要大不少,根据资料显示达到328mm2。要知道采用90nm工艺的G80为496mm2,如果同样采用65nm工艺制造的话,G92与G80核心面积谁大谁小还是未知之数。核心面积大小与整卡成本可下降空间有着直接的关系,之前Geforce7900GS的G71核心之所以能成为经典就是因为在每平方毫米性能比方面达到了相当的高度。
![]() |
在过往,像素渲染单元和顶点渲染单元都分别负责着不同的数据渲染,比如说像素渲染单元负责着包括RGB(三原色)和这三原色的信息说明等一共四个数据的运算,而顶点渲染单元则是负责三角型顶点的XYZW坐标数据的运算,我们把这些任何一个单独的数据称为标量。因为在以前往往这两种数据都是4个标量为一组的,所以像素渲染单元和顶点渲染单元都被设计成单周期同时执行一组4标量的运算,这就是旧有的SIMD架构,SIMD架构在处理4标量为一组的矢量运算时效率非常高。
![]() |
但随着游戏的复杂化,一组矢量未必数量一定为4的标量,那么比如在执行只有单一标量的矢量数据时,原来的SIMD架构效率就大打折扣了。虽然近代的ATI使用了“3+1” 的设计,允许一次处理4个矢量运算,或者同时处理一个3矢量运算和一个单标量运算。而NVIDIA的Geforce6和Geforce7系列则除“3+1”外还可以提供一个额外的“2+2”类型运算来提高效率,但由于的单标量运算日益频繁,加上长久以来像素渲染与顶点渲染比重的问题,所以SIMD架构终被取缔,DirectX9时代结束。随之而来的就是统一渲染架构的DirectX10时代。
![]() |
Geforce8800GT核心规格图
到了DirectX10时代的统一渲染架构,NVIDIA采用流处理器设计的概念,并且是全标量并行运算。流处理器既可以提供100%的标量运算效率,也能提供100%的矢量运算效率,并且处理器运行频率是核心频率的一倍以上!而我们以前常说的核心频率,现在仅是纹理运算单元(Texture)和光栅处理单元(ROPs)的运行频率,这是在规格说法上一个较大的改动,进入DirectX10以后,我们应该把着色器单元的频率作为主要性能指标。
G8X体制以16个流处理器为一个束,最高端的Geforce8800GTX/Ultra拥有完整的8个束,一共128个流处理器,而Geforce8800GTS被删减了2组,一共96个流处理器。而G92仍然保持了G8X的流处理器束规格,且拥有7组流处理器束,一共达到112个流处理器,比Geforce8800GTS还要多。不过显存控制器方面有所减少,从Geforce8800GTS的5个内存界面减少至4个(每个具备64Bit位宽)也就是说从320Bit降低至256Bit。
G92并不只包含Geforce8800GT
G92没那么简单——Geforce8800GT仍然只是简化版
G92继承了G80所有的核心技术(关于NVIDIA G80核心技术的详细信息请参阅‘3D世界的革命 GF8800显卡深入剖析’),所以流处理器的效率是基本一致的。那从上表可见Geforce8800GT除了在显存位宽方面低于Geforce8800GTS 320M外,其他包括频率、流处理器数量等重要参数都远超过Geforce8800GTS 320M,性能在后者之上已经成为不争的事实。NVIDIA当然不容许这样同门相残的情况出现,其实NVIDIA早就准备好同样基于G92核心的新版GeForce8800GTS 512M,并且升级至128个流处理器,也就是说完整的G92核心其实本来就内建128个流处理器规格,和高端的G80一样规格!这就能解释为何G92核心面积会如此大,因为G92本来就是一款旗舰规格的核心!简单来说我们可以把G92看成是G80的65nm+256Bit版本。
从此可见其实Geforce8800GT仍然是由当代高端核心的工艺改进+流处理器简化所得,保持了NVIDIA一贯的作风,只是在上市时间有所调换而已。根据消息完整128个流处理器的Geforce8800GTS 512M将会在11月下旬低调出现。
| 第1页:突破传统 倒叙式详细分析G92 | 第2页:产品赏析-GALAXY影驰 |
| 第3页:产品赏析-XFX讯景 | 第4页:产品赏析-INNO3D映众 |
| 第5页:产品赏析-GAINWARD耕升 | 第6页:产品赏析-Colorful七彩虹 |
| 第7页:产品赏析-ASL翔升 | 第8页:产品赏析-MSI微星 |
| 第9页:产品赏析-ELSA艾尔沙 | 第10页:产品赏析-旌宇SPARKLE |
| 第11页:测试平台及测试细节说明 | 第12页:理论性能测试——3Dmark06 |
| 第13页:DirectX10游戏——孤岛危机 | 第14页:DirectX10游戏——迷失星球 |
| 第15页:DirectX10游戏——冲突世界 | 第16页:DirectX10游戏——英雄连:抵抗前线 |
| 第17页:DirectX9游戏——半条命:第二章 | 第18页:DirectX9游戏——虚幻3 |
| 第19页:DirectX9游戏——科林麦克雷:尘埃 | 第20页:OpenGL游戏——雷神战争 |
| 第21页:OpenGL游戏——掠食者 | 第22页:AA/AF测试决战三大代表性游戏 |
| 第23页:谁在左右着中高端性能显卡的出现? | 第24页:深入分析G92规格与缘由 |
| 第25页:超前标准——首款PCI-E 2.0显卡 | 第26页:破除G80诅咒 实测G92的H.264加速 |
| 第27页:原厂P393公版8800GT详解 | 第28页:瘦身成功 首款单槽的GF8800显卡 |
| 第29页:为DisplayPort准备 内部元件分析 | 第30页:展望:两个星期后大战将一触即发 |
| 第31页:附:其他各品牌Geforce8800GT一览 |