Alder Lake處理器深入把玩:雙內(nèi)核效能對比,未來移動版性能預(yù)覽
其實自Intel Alder Lake處理器要用x86混合架構(gòu)的消息傳出,與之相關(guān)的爭論就沒停過,爭論的重點基本上都在桌面處理器有沒有必要用E-Core這一點,對于移動處理器來說,E-Core確實挺有用的,畢竟筆記本的體積是有限的,要控制發(fā)熱量,而且還需要考慮續(xù)航問題,降低發(fā)熱和功耗這正是E-Core在行的。但臺式機的散熱器大得多,處理器的熱功耗設(shè)計和筆記本相比可以大許多, 也不需要太過在意節(jié)能的問題。
那么為什么Intel還要在Alder Lake-S里面塞E-Core呢?Alder Lake所用的P-Core也就是Golden Cove的IPC與頻率都很高,有著很強的單線程性能,而想提升多線程性能的話就需要堆砌大量的P-Core,不過P-Core的核心面積實在是太大了,堆太多的話發(fā)熱太大就會影響頻率。還有就是芯片面積的問題,下一代Xeon可擴展處理器Sapphire Rapids單個芯片里面就有15個Golden Cove,根據(jù)Intel的資料它的芯片面積大約是400mm2,這尺寸肯定不能直接扔主流消費市場。
那么如果確保處理器有足夠的單線程性能,又在不大幅增加芯片面積的情況下增加多線程性能呢?Intel給出的答案就是混合架構(gòu)的Alder Lake,在此架構(gòu)里P-Core的目的是提升處理器的單線程性能,而E-Core的設(shè)計目的則是用更低的功耗來提升多線程性能,因為E-Core相當(dāng)省晶體管,大概4個E-Core的芯片面積才和1個P-Core這么大。
這里直接借用一下@Locuza_做的圖
從上圖可以看到,1個E-Core的芯片面積大概1.7mm2,而4個E-Core加上2MB L2緩存的面積是8.78mm2,只是略大于一個P-Core加上它的1.25MB L2緩存,但根據(jù)官方的說法,4個E-Core所提供的多線程性能是要遠(yuǎn)高于1個開啟超線程的P-Core的,所以桌面的Alder Lake-S上那8個E-Core的主要作用確實是用來拉高處理器的多線程性能的,節(jié)能作用只是其次。
桌面版Alder Lake-S的8P+8E組合是Alder Lake里面核心數(shù)量最多的,移動版的Alder Lake-P最多只有6P+8E,但核顯的規(guī)模增大,并且增加了Thunderbolt 4控制器和IPU圖像處理單元,低功耗移動版更是只有2P+8E,而下一代的Raptor Lake處理器更是打算把E-Core數(shù)量增加到16個 ,看來這E-Core是真的好用,而且堆起來性價比也很高。
其實我們在首測的時候是想單獨測試P-Core和E-Core的性能的,但實際上只能單獨把E-Core完全關(guān)閉,P-Core至少得保留一個,所以那時候就沒關(guān)于E-Core的測試,現(xiàn)在我們換個思路,來試下不同P-Core和E-Core的組合會對性能有什么影響。
測試平臺與說明
測試平臺就是同步評測那套,使用Core i9-12900K處理器,華碩ROG MAXIMUS Z690 HERO主板,兩條16GB芝奇RIPJAWS S5 DDR5-5200內(nèi)存,時序是CL40-40-40-76,顯卡是NVIDIA GeForce RTX 3090 Founder Edition。這次測試是通過關(guān)閉Core i9-12900K的P-Core和E-Core來驗證不同核心組合性能,我們并不會處理器的頻率做任何改動,如果沒特殊說明的話就是默認(rèn)解鎖功耗限制,這次只是一個驗證性的測試,所以測試的項目會比首發(fā)評測少很多。
Core i9-12900K默認(rèn)的睿頻設(shè)置請看下表:
驗證一:4P和2P+8E誰更強
為什么會選這樣的組合來測呢?因為4個E-Core的芯片面積和1個P-Core大致相同,Intel也說過2個P-Core加8個E-Core的多線程性能是比4個P-Core更好的,所以我們就來驗證一下,附帶測下1 P-Core+8 E-Core以及1 P-Core+4 E-Core的組合。
理論測試
單純看各個測試的多線程測試的話,2P+8E的組合多線程性能是要比4P更強的,畢竟核心線程數(shù)量差距擺在那里,兩個P-Core多線程性能確實不如8個E-Core,甚至1P+8E的多線程性能也和4P差不多。
但認(rèn)真去看這些數(shù)據(jù)的話,你會發(fā)現(xiàn)只剩1個P-Core時單線程性能是明顯下降了的,這可能與Windows的顯存輔助均衡調(diào)度算法有關(guān)。
此外看3DMark CPU Profile的測試結(jié)果,4個P-Core在4線程和8線程時得分是要比2P+8E要高的,單線程性能相同,雙線程的結(jié)果可能是單純的測試誤差,說明在8個線程內(nèi)P-Core其實要比2P+8E更強,只有在兩個都是最大線程時多線程性能才會拉開差距。
其實如果光看多線程性能的話,8個E-Core是肯定要比2個P-Core更好的,兩者的芯片面積也差不多,那在有限尺寸的晶圓上全堆E-Core多線程性能不是更好?更何況Gracemont架構(gòu)本身是支持超線程的,只不過在Alder Lake里面它是E-Core沒這個必要所以沒開而已,事情肯定沒這么簡單,不然Intel也不會畫這么大力氣去搞個混合架構(gòu)了。
游戲性能
消費級處理器在絕大部分情況下都不會全線程一齊負(fù)載的,單線程性能有多重要這個游戲就會告訴你,測試的4個游戲里面4P與2P+8E在《全面戰(zhàn)爭:三國》和《Far Cry 6》幀數(shù)差距不大,但《古墓麗影:暗影》與 《銀河破碎者》里2P+8E就明顯落后4P很多,如果進(jìn)一步削減P-Core數(shù)量的話性能下降得更厲害,1P+8E的游戲性能與2P+8E差很多,1P+4E的性能下降幅度反而沒那么大。
很明顯,E-Core在游戲里面幫不上太大的忙,主要還是得看單線程性能強得多的P-Core,就如Intel在架構(gòu)日上所說的那樣,P-Core是用來提供單線程性能的,而E-Core則是在盡量節(jié)能的情況下提升多線程性能。
功耗測試
雖然我沒對Core i9-12900K的頻率進(jìn)行改動,但因為睿頻的關(guān)系它在不同核心數(shù)量時頻率還是不一樣的,核心數(shù)量越少全核頻率就越高,這會對CPU的功耗帶來微妙的影響,但整體來說還是關(guān)閉核心帶來的影響更大,4個P-Core的功率是要比2個P-Core加8個E-Core功耗高8%的,后者的組合帶來的多線程提升反而更大一點,怪不得Intel下一代產(chǎn)品還要繼續(xù)增加E-Core數(shù)量。
2P+8E跑FPU的功耗是112W,而1P+8E則是84W,大致可推算出一個P-Core的功耗是28W,而1P+4E的功耗是60W,大致可推算出一組4個E-Core的功耗是24W,當(dāng)然這只是大致的推算,并不是十分準(zhǔn)確的數(shù)值,但依然看得出E-Core在能耗方面確實要比P-Core好不少。
驗證二:超線程有多大作用
由于Core i9-12900K是16核24線程的,然后你會發(fā)現(xiàn)把E-Core關(guān)閉或者把P-Core的超線程關(guān)閉的話都會變成16線程,只是這16線程的組成成分不太一樣,下面就來對比一下這兩個組合的性能,并且會放上完整的Core i9-12900K的成績作為參照。
理論測試
基本上這三種組合單線程性能沒多大差別,多線程性能大部分情況下8P+8E 16T是要優(yōu)于8P 16T的,畢竟多了8個物理核心怎么都比8個邏輯核心要強,當(dāng)然7-Zip的解壓縮測試是個例外,只有這里8P 16T是要比8P+8E 16T更強的。
3DMark CPU Profile這個分線程數(shù)的測試我們能看出更多有趣的事,8P 16T在4線程和8線程的成績是要遠(yuǎn)比8P+8E 16T和8P+8E 24T更低的,2線程時也略微低一些,這很有可能是線程調(diào)用出了問題,在E-Core開啟的時候線程被正確分配到P-Core上,沒有調(diào)用到虛擬的邏輯核心,但在只有P-Core的時候調(diào)度可能出了問題,線程被分配到邏輯核心上,導(dǎo)致性能明顯下降。
16線程時8P 16T的得分也是低于8P+8E 16T的,不過這就不是線程調(diào)度的原因了,單純是8個E-Core性能比8個P-Core超線程弄出來的邏輯核心性能更強。8P+8E 16T在8線程和16線程時性能比8P+8E 24T好一點,這是因為P-Core在關(guān)閉超線程后全核頻率從4.8GHz提升到4.9GHz,而且我們可以從16線程的得分看出此時Core i9-12900K是優(yōu)先使用E-Core來進(jìn)行負(fù)載的,而不是使用P-Core的超線程。
游戲性能
這三個組合的游戲性能差別倒是不大,畢竟P-Core數(shù)量管夠,硬要說的話就是關(guān)閉超線程后性能會高那么一點點,因為這種情況下P-Core的全核頻率更高,關(guān)閉超線程也對CPU的單線程性能有輕微提升,但不怎么明顯就是了。
功耗測試
Core i9-12900K在華碩ROG Z690 Hero主板上跑AIDA 64 FPU AVX2負(fù)載時功耗是242W,關(guān)閉全部E-Core的話功耗會降低到213W,而關(guān)閉超線程的功耗則是214W,兩者的功耗如此接近比較意外的,當(dāng)然了兩者的溫度其實相差很遠(yuǎn),關(guān)閉E-Core后會讓熱量更為集中,就算用360一體式水冷也很難壓住,關(guān)閉超線程的話會降低P-Core的發(fā)熱,讓CPU溫度下降到只有70多度。
驗證三:預(yù)測下未來的移動版Alder Lake
移動版的Alder Lake-P會在明年1月的CES上發(fā)布,和桌面版Alder Lake-S相比,核顯的EU單元從32個增加到96個,而CPU則從8P+E8變成了6P+8E,核顯規(guī)模我們沒法模擬,但CPU性能我們可以通過減少兩個P-Core和限制CPU的PL1和PL2功耗進(jìn)行模擬,當(dāng)然了,Core i9-12900K的L3緩存應(yīng)該會比移動版處理器多6MB,這個就沒辦法了。
這個測試?yán)锩嫖覀儠袰ore i9-12900K關(guān)到6P+8E的狀態(tài),會分別測試解鎖功耗以及把功耗限制到PL2=105W,PL1=45W,Tau=56秒的性能,這功耗限制是我們根據(jù)現(xiàn)在的11代酷睿H45處理器來設(shè)定的,未來的Alder Lake H45的標(biāo)準(zhǔn)功耗估計也差不多這樣,而測試解鎖功耗限制的是單純想看看這種核心組合的性能上限,畢竟不少游戲本也會把處理器的PL1和PL2值設(shè)置到很高,當(dāng)然性能肯定會和我們現(xiàn)在用桌面處理器模擬有一定差距。
理論測試
從各個測試來看,單線程性能基本沒太大影響,畢竟只有單線程輔助時根本摸不到PL2的105W,基本可以滿血跑完所有的測試。多線程的話,如果不限制功耗,6P+E8依然會比8P+8E性能下降10%~20%,加上功耗限制影響就大了,像CPU-Z這樣的短時間測試性能降幅不會很明顯,因為都在PL2的時間范圍內(nèi),而R23這種10分鐘以上的長時間測試,只有56秒的PL2就可以忽略不計了,絕大部分時間都只有45W,性能降幅相當(dāng)明顯。
但換個角度去看,Core i9-12900K關(guān)掉兩個核后FPU烤機功率是175W,把它限制成只有45W的話依然能發(fā)揮出原本60%的性能,Alder Lake架構(gòu)以及Intel 7工藝在能耗方面確實做得很不錯。
游戲性能
把Core i9-12900K關(guān)兩個P-Core游戲性能影響不大,也就《銀河破碎者》這個比較吃CPU的有一點下降,限制功耗后,有三款游戲大概有10%的幀率下降,《全面戰(zhàn)爭:三國》這游戲這么吃CPU性能居然沒變我是比較驚訝的。
從測試結(jié)果來看未來的移動版Alder Lake處理器性能還是比較不錯的,在限制了功耗的情況下最差情況下依然有Core i9-12900K的一半性能,如果負(fù)載較輕時會發(fā)揮出更佳性能,當(dāng)然實際在筆記本上肯定會被散熱設(shè)計以及搭配的內(nèi)存影響性能發(fā)揮,我們的測試只是大致模擬。
總結(jié)
簡單歸納一下這次測試,Alder Lake里面的一個P-Core和四個E-Core芯片面積接近,四個E-Core的多線程性能大概比一個P-Core高出10~15%,而且功耗要低15%左右,在提升多線程性能和降低功耗方面,E-Core功不可沒,所以Intel下一代的Raptor Lake打算繼續(xù)堆E-Core來提升多線程性能。
當(dāng)然了,只有E-Core是肯定不行的,因為E-Core的IPC只比Skylake好一點,而且它的頻率并不算高,實踐證明P-Core數(shù)量太少的話會嚴(yán)重影響游戲性能,至于需要多少個P-Core那就得看游戲需求了,每個主線程能分到一個獨立的P-Core那當(dāng)然是最好的狀態(tài),Alder Lake以及Raptor Lake最多8個P-Core的設(shè)計Intel肯定是在多年的數(shù)據(jù)收集后統(tǒng)計出來的。
關(guān)閉P-Core的超線程對Core i9-12900K來說大概會讓多線程性能降低10~30%,具體數(shù)值得看負(fù)載是什么,不過可以確定的是在16線程內(nèi)的負(fù)載是不會造成任何影響的,只有在需要調(diào)用超過16線程時才會動用到邏輯核心,關(guān)閉超線程的話可以讓CPU的溫度與功耗大幅降低,這也是解決Core i9-12900K溫度過高的其中一個方法,當(dāng)然不怎么建議這么做就是,限制功耗同樣可以達(dá)到降溫的目的,而且性能損失沒那么大。
在對未來移動版的Alder Lake處理器的模擬當(dāng)中,我們可以看出這處理器的能耗比其實是相當(dāng)棒的,在關(guān)閉兩個核心并且限制PL1=45W后,此時滿載功耗只有原來的18.5%,它依然能發(fā)揮出接近Core i9-12900K至少50%的多線程性能,而游戲性能方面至少有80%,明年的Alder Lake-P移動處理器是相當(dāng)值得期待的。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。