◆ GeForce GTX 200圖形處理架構
GTX 200是首款使用NVIDIA第二代統一架構渲染及運算引擎的顯卡。對比GeForce 8或者9系顯卡,新架構能夠帶來約1.5倍的性能增長。
|
想必大家都記得GeForce 8系列以及GeFeforce 9系列的核心是基于一個可擴展處理器陣列(Scalable Processor Array,SPA)結構,GTX 200系列所用的是一個重新設計加強以及延展的SPA結構。
SPA結構里面包含了一些TPC單元,TPC的全稱根據用途的不同而有所不同。在圖形處理模式時它被稱為貼圖處理群(Texture Processing Cluster),而在并行計算模式時它被稱為線程處理群(Thread Processing Cluster)。每一個TPC包含了一定數量的流處理單元(Streaming multiprocessors,SMs),而每一個流處理單元內部又包含了8個流處理器核心(Stream Processors,SPs,或者thread Processors)。另外,每一個SM內部也包含了一定數量的紋理過濾處理器(Texture Filtering Processor),除了在3D圖形模式上有著很大的作用之外,在運算模式下也非常有用處,如大型圖像的放大縮小等等。
第二代統一渲染架構和G80以及G92所使用的第一代統一渲染架構相比,在兩方面有著巨大的進步。首先,每一個TPC內的SM數目從第一代的兩個增加至三個;第二是每一個GPU內的TPC從8個增加至10個(GTX 260為8個),TPC和SM數量上的增加直接導致了SP的數目增加至240個(GTX 260只有192個)。
|
GPU的處理核心SP基于傳統的處理器核心設計,能夠進行整數,浮點計算,邏輯運算等操作,從硬體設計上看就是一種完全為多線程設計的處理核心,擁有復數的管線平臺設計,完全勝任每線程處理單指令的工作。
GPU內的線程分成多種,包括像素、幾何以及運算三種不同的類型,在三維圖像處理模式下,大量的線程同時處理一個shader program以達到最大化的效率,所以GTX 200 GPU的核心內很大一部分面積都作為計算之用,和CPU上大部分面積都被緩存所占據有所不同,大約估計在CPU上有20%的晶體管是用作運算之用的,而(GTX 200)GPU上有80%的晶體管用作運算。GPU處理的首要目標是運算以及數據吞吐量,而CPU內部晶體管的首要目的是降低處理的延時以及保持管線繁忙,這也決定了GPU在密集型計算比起CPU來更有優勢。
從上面的GeForce GTX 280的圖形處理架構圖可以看到10個TPCs,每個TPCs包含了三個SMs,每個SMs又包含了8個流處理器核心,這樣流處理器核心總量達到了240個。