● Texture性能測試:二維卷積
由于Tahiti和Pitcairn擁有相同的幾何端、光柵化單元和輸出端,CU單元的圍觀邏輯結構也完全相同,因此CU的總規模就成了兩者最主要的區別。我們已經通過測試了解了Tahiti構架CU中ALU團簇部分因線程和緩沖等效密度密度不同而產生的性能差異。接下來我們將要展開的測試,將圍繞著CU中的另一個重要組成部分——Texture Array展開。
我們在之前的文章中提到過,在傳統手段中想要單純測試體系的TMU性能是相當困難的事情。幸運的是,TMU對材質的諸多操作過程,包括抽離材質的顏色信息,將之轉化成灰度數據,再將其與頂點數值進行對照并輔以相關的操作等等,本質上就是對像素數據數組的一系列操作。因此GPCBenchmark對于二維卷積性能的測試,可以讓我們將TMU性能轉化成單純的TMU動作能力以及與相關緩沖互動能力的測試。
卷積過程的應用領域極為廣泛,其在統計學、概率論、聲學研究、以及電子信號處理領域都有廣泛的涉及,任何一個存在于世界上受物理學支配的線性系統均包含卷積過程。用TMU單元對卷積過程進行運算,可以考驗TMU處理數據類型完全相同的材質過程時的性能,同時還能避開來自幾何、光柵化以及輸出過程的諸多干擾。
由于Tahiti構架的Texture cache資源相當豐富,再加上Texture Array的動作方式遠比ALU面對shader時要來的規整和平滑,所以HD7900的二維卷積性能相當出色。作為sweet spot登場,Texture Array只有Tahiti一半的Pitcairn雖然因為總量不足而落敗,但卻憑借更加充盈的線程分配資源獲得了更為“平滑”的性能延伸曲線。