龍芯3A3000 CPU深入實(shí)測:國產(chǎn)CPU春天何時(shí)來?
國產(chǎn)自主技術(shù)的重要性,如今體現(xiàn)得越來越明顯,尤其是在高性能半導(dǎo)體領(lǐng)域,我國正在全力奮起直追,面臨的困難和挑戰(zhàn)很多,取得的成果也不少,一方面需要繼續(xù)加大馬力,另一方面也需要予以肯定和支持。
本文引用地址:http://butianyuan.cn/article/201811/395003.htm在高性能CPU處理器領(lǐng)域,Intel、AMD是我們最熟悉的兩個(gè)名字,還有企業(yè)級的IBM。我國也在不斷投入,相關(guān)企業(yè)并不少,但由于高性能CPU的特殊性,門檻極高,目前只能采取引入授權(quán)再發(fā)展的方式,而性能距離世界頂級水平還有極大的差距,只能一步一步縮小。
龍芯是起步較早的國產(chǎn)CPU之一,而且早就已經(jīng)完全獨(dú)立自主研發(fā)和經(jīng)營,不拿國家一分錢資助。龍芯走的不是我們?nèi)粘J煜さ膞86指令集,而是MIPS指令集體系,所以更多應(yīng)用在一些特殊行業(yè)領(lǐng)域,消費(fèi)級市場上也有但不多見,還處在生態(tài)建設(shè)的初級階段。
目前,龍芯已經(jīng)發(fā)展出了多個(gè)龍芯產(chǎn)品家族,其中針對桌面市場的最新產(chǎn)品是龍芯3A3000。
想必大家一定很想知道它的性能到底如何吧?之前也陸續(xù)見過一些官方非官方的性能數(shù)據(jù),但都很零散。最近,有龍芯愛好者對龍芯3A3000做了一次全面的實(shí)際性能測試,并發(fā)表在龍芯社區(qū),這里節(jié)選一部分來看看(略有修改)。
據(jù)介紹,這套測試平臺(tái)是去年9月份龍芯俱樂部搞龍芯3A主板團(tuán)購時(shí)買的,自行搭建,測試工具為phronix-test-suite,盡可能理性、中立、客觀、全面,不吹不黑,不夸大成績,也不回避問題。
龍芯3A3000主板照片,風(fēng)扇下面是龍芯的CPU。另外兩塊散熱片下面分別是南橋和北橋。
拆下風(fēng)扇后的龍芯3A3000近照。LS3A3000D-LP的編號(hào)代表這是一個(gè)低功耗版本的龍芯3A3000。
開機(jī)后BIOS:可以看到CPU的主頻是1400MHZ,一級指令緩存64KB,一級數(shù)據(jù)緩存64KB,二級緩存4MB。
主板上的國產(chǎn)Unilc(西安紫光國芯半導(dǎo)體)內(nèi)存條。
龍芯3A3000規(guī)格表
龍芯3A3000頻率最高1.5GHz,這里測試的是1.4GHz版本,因此最好性能應(yīng)該比以下測試的再高出5%左右。
此外需要說明的是,龍芯3A3000筆記本里帶的龍芯3A3000的主頻被限制在了1.2GHZ。
規(guī)格對比
性能測試基本環(huán)境
龍芯3A3000處理器性能測試
測試是在Linux系統(tǒng)上進(jìn)行的,很多測試內(nèi)容都偏重CPU理論性能測試,跟大家熟悉的Windows下CPU性能測試不同,具體原理就不贅述了,大家只要看看結(jié)果和對比就行了。
測試對比型號(hào)除了Intel酷睿i5-7200U、賽揚(yáng)J1900,還加入了同樣國產(chǎn)的處理器、來自飛騰的FT-1500A、FT-2000+。
i5-7200U是Intel第七代酷睿移動(dòng)平臺(tái)的低壓低功耗版本,14nm工藝,雙核心四線程,主頻2.5-3.1GHz,集成核顯HD 620,熱設(shè)計(jì)功耗15W。
賽揚(yáng)J1900則是一顆超低功耗的移動(dòng)產(chǎn)品,隸屬于Bay Trail家族,2013年就發(fā)布了,22nm工藝,四核心四線程,主頻2.0-2.42GHz,集成核顯HD Graphics,熱設(shè)計(jì)功耗10W。
作者的結(jié)論:
從縱向上看龍芯的發(fā)展,相比龍芯2F,龍芯3A3000的性能有了很大的進(jìn)步。工藝上,從龍芯2F的90nm,提高到了龍芯3A3000處理器的28nm;主頻從龍芯2F的800MHZ提高到了1.5GHz。
在用戶實(shí)際應(yīng)用上,基本可以達(dá)到流暢使用的程度。與Intel處理器相比,龍芯3A3000綜合性能相當(dāng)于Intel賽揚(yáng)J1900,單核性能相當(dāng)于i5-7200U的30%~40%。
通過本文中所進(jìn)行的34項(xiàng)測試,我們發(fā)現(xiàn)龍芯3A3000在性能不好的根源有以下幾個(gè):
同主頻性能較弱
從同主頻性能來看,龍芯3A3000已經(jīng)超過了J1900,但只有Intel i5-7200U的60%~70%。預(yù)計(jì)2019年流片的龍芯3A4000同主頻性能至少有30%的性能提升——那樣就能達(dá)到i5-7200U的80-90%。
主頻太低
這是龍芯處理器讓眾多愛好者耿耿于懷的的一個(gè)難以回避的弱點(diǎn)。誠然,主頻不代表所有性能,但主頻太低是萬萬不行的。
J1900的同主頻性能弱于龍芯3A3000,但由于它的主頻可以到1.99GHz,并且還可以睿頻到2.4GHz,在多項(xiàng)測試中一樣超過了龍芯3A3000。
i5-7200U基礎(chǔ)主頻達(dá)到2.5GHz,睿頻可以到3.1GHz。飛騰2000+主頻可以到2.2GHz,而兆芯的KX-6000主頻甚至可以到3.0GHz。
飛騰、兆芯處理器可能在同主頻性能上弱于龍芯,但還是可以靠著較高的主頻擊敗龍芯3A3000。
龍芯主頻較低的原因之一是落后的工藝制程,目前還在使用28nm工藝,而Intel、飛騰、兆芯等已經(jīng)在使用14nm工藝。
根據(jù)龍芯的發(fā)展規(guī)劃,到2020年龍芯將使用14nm工藝對了龍芯3C5000進(jìn)行流片,主頻能夠達(dá)到2.5GHz。
系統(tǒng)軟件優(yōu)化不夠
在測試中,我們發(fā)現(xiàn)的問題有三角函數(shù)等數(shù)學(xué)函數(shù)運(yùn)算速度過慢,看起來部分硬件浮點(diǎn)運(yùn)算的沒有得到應(yīng)用,而且龍芯缺少一個(gè)優(yōu)化的數(shù)學(xué)函數(shù)庫。在加密解密指令上,缺少AES硬件實(shí)現(xiàn)。
在測試中,我們發(fā)現(xiàn)使用Debian操作系統(tǒng)、GCC7.3和1.4GHz的龍芯3A3000進(jìn)行的各項(xiàng)測試基本優(yōu)于使用Loongnix操作系統(tǒng)、GCC4.9編譯器和1.5GHz龍芯3A3000的組合。
我們認(rèn)為編譯器的優(yōu)化對發(fā)揮龍芯的性能非常重要。
在測試中,我們也發(fā)現(xiàn)使用4.14的Linux內(nèi)核會(huì)比3.10的Linux內(nèi)核上有相當(dāng)程度的性能提升,龍芯依然缺少優(yōu)化的Linux內(nèi)核。
應(yīng)用軟件優(yōu)化不夠
由于MIPS架構(gòu)缺少軟件生態(tài),各種應(yīng)用軟件缺少針對MIPS架構(gòu)的優(yōu)化。具體表現(xiàn)就是在很多軟件有針對X86系統(tǒng)的匯編優(yōu)化。
要建立龍芯的生態(tài),發(fā)揮龍芯處理器的性能,相同級別的優(yōu)化不可缺少。隨著龍芯未來架構(gòu)的優(yōu)化、主頻的提升,影響龍芯發(fā)展的瓶頸將不是處理器的性能,而是軟件生態(tài)的建設(shè),也就是系統(tǒng)軟件優(yōu)化以及應(yīng)用軟件優(yōu)化。
其中,各種應(yīng)用軟件的優(yōu)化將是提升龍芯用戶體驗(yàn)的捷徑。實(shí)際上,龍芯也已經(jīng)意識(shí)到了這些問題,提出了要學(xué)習(xí)蘋果“app by app, feature by feature, pixel by pixel”地進(jìn)行優(yōu)化。
評論