搜尋本站文章

2011年12月4日 星期日

AMD Bulldozer 推土機十大熱門問題,且看 AMD 官方細細解答!

雖然很多公關人士都被裁掉了,AMD 與玩家社區的聯繫卻並未中斷,近日就通過媒體向硬體發燒友徵求了一系列有關推土機處理器的熱門問題,並在 100 多個中挑選出了最受關注的十個做出了回應。儘管其中官方辭令不少,但仍值得一看。

總的來說,AMD 一直在反覆強調推土機架構是一種面向未來多線程應用的超前設計,同時也更加面向高吞吐量的服務器環境,而不是普通桌面環境,因此有時候會顯得『太委屈』了。

有趣的是,AMD 證實了 Windows 8 線程調度器會針對推土機進行專門優化,以提高其執行效率,甚至 Windows 7 都會有一次這方面的更新升級

下邊問答開始:

1、推土機的一級緩存容量為什麼比 Phenom II 更少了? 

AMD 院士兼推土機總設計師 Mike Butler:多年來,AMD 的處理器架構師們一直在分析和模擬不同的客戶端、服務器工作負載數據,以高效率控制各級緩存的容量,並實現性能的最優化。

在推土機上,AMD 使用了逐一寫入(write-thru)一級數據緩存,並重點改進了預取算法、提升了常用小尺寸區塊的傳輸頻寬。對於那些不常用的、較大尺寸區塊的傳輸,我們依賴更大的 16 路關聯 2MB 二級緩存。

根據如今的普遍工作負載,我們認為這種新的設計方式雖然一級緩存容量更小,但在處理數據時效率更高。

2、為什麼整數性能測試成績比 AMD 以往的四核心低很多? 

Mike Butler:推土機是一種新架構,在很多方面都與以往不同。推土機同時使用了獨享和共享資源,得以在最大範圍內提高效率、改進單位功耗的指令、維持 IPC,包括無鎖桌面版的高速加速頻率、服務器版的低壓低功耗,這都是上代架構無法比擬的。

也正因為如此,一些單獨的測試會顯示出與以往核心設計不同的性能水平,有的高些,有的低些。多線程應用的性能取得了顯著進步,但一些較老的測試程序無法從推土機架構中獲益。

另外需要特別指出的是,推土機架構是針對服務器吞吐配置、優化的。推土機(每個模塊)內的兩個整數執行核心是為了在單位面積與功耗下提供更高效的多線程輸出。

3、模塊化與核心共享設計看起來很精彩,但提升頻率的同時 IPC 更低卻像是一種退步。為何如此? 

Mike Butler:很顯然,IPC 是處理器性能的重要參數,第一代推土機也確實有輕微下降。推土機是一種前瞻式的架構設計,反應其性能的參數有很多,其中一些會有所妥協。

新的處理器核心頻率更高,並基本維持了 IPC,還有著前代架構不具備的多線程並行計算性能、單位功耗指令、高級加速能力、新的 x86 指令集、強大的超頻能力。

我們相信,隨著操作系統與應用軟體逐漸發揮推土機的內在優勢,這些增強會給終端用戶帶來積極的一面。展望未來,隨著處理技術的不斷成熟,(推土機)核心的頻率提升潛力也非常大。

4、根據不同的評測,推土機的性價比似乎低於 Intel Sandy Bridge。如何解釋與 Intel 的相對定位? 

AMD 產品市場經理 Adam Kozak:AMD 是根據客戶使用的應用和環境設計(推土機)的,他們在今後也會一直使用。該架構強調高頻率和資源共享,以在下一代應用、高分辨率遊戲中獲得優化的吞吐與速度。

這是一種前瞻的、創新的處理器設計理念。儘管很難用陳舊的單線程工具去衡量,但我們相信 FX 處理器能為我們的高性能客戶帶來傑出的 PC 體驗。
5、AMD 有沒有推動更多真正多線程代碼的開發?有沒有向開發者提供指南,幫助他們獲取盡可能好的多線程代碼性能?

AMD 高級產品市場經理 Gabe Gravning:我們正在與開發人員、ISV(獨立軟體開發商)合作,鼓勵多線程代碼與應用的開發。這是 AMD 與其它行業夥伴共同關注的重大課題,也是我們舉辦 2011 年開發者峰會的主要動力,讓我們有機會和開發人員坐下來談談並行計算、異構計算。

沒錯,我們正在推廣新的(開發)工具,讓開發人員能夠更簡單地充分利用 CPU、GPU 不斷增加的計算核心。

6、據說 Win8 調度器會給推土機帶來性能提升,能否解釋一下?

Gabe Gravning:我們一直在與微軟合作,改進 Windows 8 系統中推土機架構的線程調度。

Windows 7 裡邊,工作負載只是簡單地在各個核心上順序執行,Windows 8 調度器則會針對推土機架構優化,首先將工作負載分配給每一個核心對(也就是每個模塊),然後再交給每個核心,因此會有更好的線程性能。

舉例來說,AMD 內部測試 FX-8150 的時候發現,Windows 8 開發者預覽版再大量遊戲中都能比 Windows 7 帶來最多 10% 的性能提升。當然了,不同的測試結果肯定是不一樣的。

我們還在與微軟合作對 Windows 7 進行調度器升級,預計不久便會發布。

7、170 美元的 Phenom II X6 1090T 在我所見的所有基準測試和遊戲中都不比 275 美元的推土機差,甚至有時候更好,為什麼我要多花那麼多錢?

Adam Kozak:我們理解用戶時根據 PC 用途來購買處理器的,很多情況下 Phenom II 確實非常優秀。對於那些需要更先進的架構、需要高分辨 PC 遊戲、需要運行新的多線程應用的人來說,AMD FX 是非常棒的升級。

8、推土機最擅長的專用或通用計算是什麼?比如說虛擬化、Windows 8、紙牌遊戲? 

Adam Kozak:默認頻率下(推土機)的高清視頻創作、文件處理、圖形處理、高分辨率遊戲性能就非常好。它們大多都能用到多個核心,有的甚至開始使用引入的新指令集,以進一步增強性能。

9、為什麼要增加管線長度來取得更高頻率,而不是提高效率? 

Mike Butter:AMD 與友商的最新架構設計都有更深的管線。推土機內的管線比上代增加了大約 25%。更深的管線是一種關鍵的技術進步,能帶來創紀錄的頻率和性能改進。

此外,推土機能夠在特定電壓下運行於更高的頻率,這是其它架構做不到的,因此能耗比更高。我們預計性能還會隨著時間而不斷提升,特別是在製造工藝更成熟之後。

舉例來說,在『文明 5』、『地鐵 2033』等並行化 DX11 遊戲中,FX-8150 的性能超出了 Core i7-2600,分別領先最多 18%、8%。

也正是基於這樣的設計理念,AMD FX-8150 的最高加速頻率達到了 4.2GHz,相比於 Phenom II X6 1100T 的 3.7GHz 提高了 15%。

10、我們看過一些處理器多線程發飆的測試,也了解『戰地 3』和未來的遊戲能用到多線程 DX11。鑑於推土機是極端多線程的芯片,在這些領域是否比競爭產品更有性能優勢?你們有沒有與 DICE 或者其它遊戲開發商合作,針對未來遊戲和多線程作品進行類似的優化?

Gabe Gravning:問題不是會不會轉向多線程應用,而只是個時間問題。AMD 正在以 64 位元計算和 APU 平台推動業界的轉向。

很顯然,多線程應用是未來大勢所趨,包括 DX11 裡邊的多線程技術,而推土機架構正是通往這一未來的橋樑。AMD 有很大機會引領業界邁向多線程未來,就像我們過去做過的那樣。這當然也絕對需要軟體開發社區的通力合作。

===============================================
創用 CC 授權條款
Related Posts Plugin for WordPress, Blogger...

沒有留言:

張貼留言

1、本留言處歡迎多加留言交流,但不歡迎垃圾留言及廣告留言
2、留言時可以使用部份 HTML 標記
3、對於教學文章介紹或軟體使用有問題歡迎提出,若站長沒回應表示不清楚該問題的解決方案
4、留言時請勿留下電子郵件,以免因搜尋引擎爬文而造成您的困擾,且站長不會寄相關郵件給您,僅會在留言區提供解決方案
5.站長保留不當刪除留言的權力,若造成不便尚請見諒