如果說HD7970的性能是意料之中的話,HD7870則有些意外了。GCN架構雖然優(yōu)秀,但包括筆者在內(nèi),相信很多網(wǎng)友都沒想到這一代的中端HD7870可以輕松擊敗上一代的旗艦HD6970。
就實用性而言,旗艦產(chǎn)品性能固然無可比擬,功耗發(fā)熱卻也不小,再加上價格昂貴,并不適合大多數(shù)消費者,而兼顧性價比的高端產(chǎn)品更適合游戲玩家,所以也是大家關注的焦點。
因此,在HD7870發(fā)布之后,各大AIB對這款產(chǎn)品均給予厚望,而今天抵達泡泡的就是來自XFX的FX-787A-CDB雙酷魂黑卡,一款穿著金屬鎧甲的非公版HD7870!
GCN架構的精髓:更強大的多線程性能
因為HD7870發(fā)布時間還不長,所以可能很多朋友對這款顯卡還不是非常了解。這里我們簡單介紹一下這款顯卡的GPU核心。
眾所周知,相比HD5000/6000系列,南方群島除了工藝從40nm更新到28nm以外,最重大的改變就是采用了全新的GCN架構了。關于GCN架構想必大家在HD7970首發(fā)評測中已經(jīng)有所了解,所以本文只做簡單介紹。
AMD歷代GPU的瓶頸除了曲面細分以外,其實最重要的是5D/4D VLIW架構的效率問題。這一痼疾在南方群島身上終于得以根除,它的流處理器結(jié)構已經(jīng)面目全非了。
通過Pitcairn的整體架構圖我們看到,傳統(tǒng)的SIMD流處理器陣列消失了,取而代之的是GCN陣列,Pitcairn總計擁有1280個流處理器,現(xiàn)在來看看GCN陣列的微觀結(jié)構。
GCN陣列里有4組SIMD單元,每組SIMD單元里面包括16個流處理器、或者說是標量運算器。GCN架構已經(jīng)完全拋棄了此前5D/4D流處理器 VLIW超長指令架構的限制,不存在5D/4D指令打包-派發(fā)-解包的問題,所有流處理器以16個為一組SIMD陣列完成指令調(diào)度。簡單來說,以往是指令 集并行,而現(xiàn)在是線程級并行。
可以這么理解,一個GCN陣列與GF100當中的一組SM相當,GF100的一組SM當中有4組共計32個流處理器,而Tahiti的一組GCN當中有4組共計64個流處理器。
更多的線程調(diào)度
從線程級別來看,GCN與SM是不可分割的最小單元,GCN一次可以執(zhí)行64個線程,而SM是48個(其實就是流處理器的數(shù)量)。
從多線程執(zhí)行上來看,GCN可以同時執(zhí)行4個硬件線程,而SM是雙線程調(diào)度器的設計(參見架構圖)。如此來看,GCN架構的多線程性能會更好一些。