新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 業(yè)界動(dòng)態(tài) > 憶往昔展未來 AMD能否建立不毀防線?

憶往昔展未來 AMD能否建立不毀防線?

作者: 時(shí)間:2017-08-01 來源:臺灣水電工協(xié)會 收藏

  陽光般的貴人

本文引用地址:http://butianyuan.cn/article/201708/362433.htm

  但 過去沒真正經(jīng)營過服務(wù)器市場,因產(chǎn)品需更可靠,軟硬體環(huán)境更加復(fù)雜,服務(wù)器的產(chǎn)品驗(yàn)證遠(yuǎn)比個(gè)人電腦嚴(yán)謹(jǐn),那 如何彌補(bǔ)缺乏經(jīng)驗(yàn)的弱點(diǎn)?

  無獨(dú)有偶,因Ultra SPARC 逐漸失去競爭力,被迫進(jìn)入x86 服務(wù)器市場且在市場開發(fā)階段不斷掙扎的Sun,也許因Opteron 系統(tǒng)架構(gòu)近似于后來取消的幾個(gè)UltraSPARC 處理器專案,優(yōu)先選擇 為x86 服務(wù)器處理器供應(yīng)商,Sun 也是最早推出Opteron 服務(wù)器的一線大廠。Sun 身為客戶的反饋,補(bǔ)強(qiáng)了AMD 過去一直缺乏經(jīng)驗(yàn)的服務(wù)器環(huán)境驗(yàn)證,這影響遠(yuǎn)遠(yuǎn)超出很多人的想像。

  Sun 的選擇,同時(shí)增強(qiáng)了其他服務(wù)器市場競爭對手與企業(yè)客戶對AMD 服務(wù)器產(chǎn)品線的信心,AMD 開始懂得如何做好過去一直被系統(tǒng)客戶罵翻的產(chǎn)品品質(zhì)和嚴(yán)苛驗(yàn)證,而且隨著越來越多客戶選擇Opteron,進(jìn)入良性循環(huán),直到開始有越來越多企業(yè)用戶相信“Opteron 優(yōu)于Xeon”,包括臺灣以前某個(gè)“有名大站”等。

  除了從天上掉下來砸到AMD 的幸運(yùn),已經(jīng)沒有其他可以解釋的理由了。

  AMD 從此不再是企業(yè)市場的陌生人

  也許一般個(gè)人電腦玩家無法體會這種感覺,但當(dāng)看到最普及的商用Unix 作業(yè)系統(tǒng)Solaris,跑在搭載AMD Opteron、由Sun 天字第一號員工親自設(shè)計(jì)如同藝術(shù)品的Galaxy 系列x86 服務(wù)器上,這對當(dāng)時(shí)無法把AMD 跟企業(yè)應(yīng)用聯(lián)想在一起的企業(yè)客戶是何等巨大的震撼。

  別說支援原生雙處理器了,你看過8 顆Opteron 處理器的服務(wù)器嗎?而且上面掛的品牌還是Sun HP 這些大廠(HP 雖貴為Intel 在Itanium 最重要甚至可說是實(shí)際上唯一的伙伴,但后來HP 賣Opteron 服務(wù)器卻是賣最兇的,Intel 應(yīng)該不少人內(nèi)心五味雜陳)。

  這也是Hector Ruiz 擔(dān)任AMD 執(zhí)行長的最大貢獻(xiàn),讓AMD 成功進(jìn)入企業(yè)市場,不只服務(wù)器,后來商用電腦與筆電也雨露均沾,AMD 慢慢占有一席之地,在職場隨處可見AMD Inside 的系統(tǒng)。即使近年AMD 比較弱勢,多數(shù)人也不會覺得公司配發(fā)給你的生產(chǎn)力工具里面裝著來自AMD 的心臟,是很奇怪的事情。

  AMD Opteron 的成功,也許可以直接從產(chǎn)品牌價(jià)略見一斑:2003 年的Opteron 846 / 848,曾高達(dá)3,199 美元,直到最近的EPYC 7500,才再度看到這種等級的價(jià)格標(biāo)簽,整整相隔了近14年。

  得來不易的優(yōu)勢最終仍慘遭Intel 鐘擺巨輪輾碎

憶往昔展未來 AMD能否建立不毀防線?

  但AMD 的攻勢也就到了盡頭,接著就是Intel 在2006 年重整旗鼓開始帝國大反擊,也是關(guān)心過去10 年處理器市場的讀者所熟悉的“鐘擺(Tick-Tock)戰(zhàn)略”,小步快跑,急起直追,展現(xiàn)了驚人的執(zhí)行力,以服務(wù)器市場為主,Intel 追擊的軌跡可簡述為:

  2006年:由以色列海法主導(dǎo)、原本和NetBurst高低檔搭配的Pentium M體系Merom微架構(gòu),完全取代NetBurst,一統(tǒng)服務(wù)器、桌機(jī)、筆電。這時(shí)Intel靠著Woodcrest奪回單一核心的效能優(yōu)勢,也再度確定Intel高效能x86微架構(gòu)的發(fā)展基礎(chǔ),回到起源于1995年P(guān)entium Pro的P6,直到非循序指令執(zhí)行引擎替換成NetBurst系的Sandy Bridge,才替問世于1995年的P6劃下輝煌的句點(diǎn)。

  沒有原生4 核沒關(guān)系,采用多芯片封裝一次包兩顆湊4 核也可以。當(dāng)時(shí)應(yīng)該也少人預(yù)期到,隔沒幾年,就換AMD 被迫如法炮制昔日嘲諷的“雙餡水餃”,在Socket G34 塞兩顆核心二打一,勉強(qiáng)對抗占有優(yōu)勢的Intel。

  2009年:由Hillsboro主導(dǎo)、在Pentium 4初期曾目標(biāo)“時(shí)脈上看10GHz”的Nehalem,重回以P6體系為基礎(chǔ)后,原生4核加上了同時(shí)多執(zhí)行緒、QPI匯流排、整合式記憶體控制器與相對應(yīng)的MESIF快取記憶體一致性協(xié)定,基本上已經(jīng)可以視為“Intel世界的K8”,但青出于藍(lán)勝于藍(lán),AMD K8的多處理器系統(tǒng)架構(gòu)優(yōu)勢,此時(shí)已蕩然無存(除了Intel多出很燙手有點(diǎn)難散熱的IOH),支撐AMD不墜的,只有K8重大戰(zhàn)略勝利的剩余動(dòng)量與現(xiàn)有客戶的信心度。

  對Intel,開始移植源自Itanium 的系統(tǒng)可靠性技術(shù)至8 處理器Nehalem-EX 最重大的意義是:確立Itanium 邊緣化的命運(yùn)。2006 年啟動(dòng)鐘擺戰(zhàn)略時(shí),將64 位元x86 指令集從心不甘情不愿的IA-32e 和EM64T 正名為Intel 64,就初露端倪。這重大的戰(zhàn)略決定,也和當(dāng)時(shí)Intel 部分高層離職潮有直接或間接關(guān)系,包括因P6 奇跡而擁有完美“服務(wù)器夏天”感到驕傲的某任Cadence 執(zhí)行長,與18 歲就進(jìn)Intel 上班,后來確定搶不到執(zhí)行長而跳槽VMware 時(shí)還放話“Itanium 業(yè)務(wù)其實(shí)有賺錢”的那位。

  當(dāng)然,AMD 也沒有閑著坐等Intel 咬上來,但以K8 為基礎(chǔ)的原生4 核K10(Barcelona,Shanghai)與原生6 核K10(Istanbul),相較于Intel 的鐘擺頻率,進(jìn)步幅度都太小了,而Barcelona 的TLB 臭蟲事件,更傷害了企業(yè)對Opteron 的信心,以Nehalem 微架構(gòu)與Tylersburg 平臺為死亡交叉點(diǎn),即使AMD 再如何對外宣稱“執(zhí)行力到位”,如2006 年底在德州展示原生4 核,2009 年準(zhǔn)時(shí)推出Istanbul 等,頹勢已無法挽回。

  2011~2012年:AMD一拖再拖、由IBM Power4總架構(gòu)師Chuck Moore操刀的Bulldozer,與Intel同樣一再延宕的Sandy Bridge在服務(wù)器市場頂上決戰(zhàn),從內(nèi)到外每個(gè)環(huán)節(jié)幾乎都輸人的AMD,就如同在衛(wèi)城作戰(zhàn)失敗后的德軍,從此一蹶不振,連續(xù)4個(gè)世代叢集多執(zhí)行緒微架構(gòu)都被Intel“后P6時(shí)代”鐘擺壓垮,低耗電微架構(gòu)Jaguar與ARM Cortex-A57的Opteron,對大局完全無足輕重,直到2017年Zen微架構(gòu)的EPYC問世前,沒有一絲一毫翻身的可能性。

  對了,為何AMD 沒有K9?因?yàn)镵9 的英文發(fā)音是“犬類”,AMD 不想當(dāng)敗家之犬,只可惜本名K8L 的K10 也沒有成功阻止AMD 退潮。

  走音出錘的推土機(jī)工地秀

  Intel 有鐘擺,AMD 當(dāng)然也有,只是跟Intel 相比,AMD 連續(xù)4 個(gè)世代的叢集多執(zhí)行緒微架構(gòu),完全是小巫見大巫,而AMD 為了異質(zhì)多核心大計(jì)預(yù)先鋪設(shè)的暗樁,也被Intel的鐘擺巨輪輾成碎片。

  2011年:推土機(jī)(Bulldozer),32nm制程,出師不利的先鋒,因?yàn)橥仆翙C(jī)設(shè)定集里面的預(yù)定對手不是Sandy Bridge,而是前一代Westmere甚至是更早的Nehalem。“剛剛好”經(jīng)領(lǐng)導(dǎo)K7救世主的Dirk Meyer就在2011年初從執(zhí)行長大位下臺一鞠躬,代表AMD經(jīng)營階層對采取雙軌路線(推土機(jī)搭配山貓)投下的不信任票。

  2012年:打樁機(jī)(Piledriver),32nm制程(SOI晶圓),微幅改進(jìn)微架構(gòu),主要著眼在分支預(yù)測和指令排程,但聊勝于無。這時(shí)候,已經(jīng)傳聞AMD準(zhǔn)備全面棄守現(xiàn)有產(chǎn)品時(shí)程表,全力投入全新x86微架構(gòu)與開辟ARM服務(wù)器戰(zhàn)線。

  2014年:壓路機(jī)(Steamroller),28nm制程,AMD終于真正對癥下藥,疏通指令管線前端的塞車問題,改進(jìn)指令快取的命中率(2路64kB升級為3路96kB),新增微指令回圈緩沖區(qū),也讓叢集多執(zhí)行緒的兩個(gè)整數(shù)邏輯運(yùn)算核心擁有專屬的指令解碼器,但為時(shí)已晚,AMD連早已不再閃亮的金雞母Opteron產(chǎn)品線都放棄導(dǎo)入“新”核心了,僅APU產(chǎn)品線有幸一親芳澤。

  2015年:Excavator(挖土機(jī)),28nm制程(當(dāng)然有所改進(jìn)),在設(shè)計(jì)工具端,因引進(jìn)源自于GPU產(chǎn)品線的高密度函式庫,所以有更小的芯片面積和更好的電力效率,至于支援AVX2指令集與DDR4記憶體就不值得特別著墨了。

  AMD原始如意算盤:用比較簡單的微架構(gòu)跟你拼核心數(shù)和電力效率(類似RV770 GPU的概念),日后將雙核心共用的浮點(diǎn)運(yùn)算單元換裝成GPU更有巨大的應(yīng)用彈性,大概萬萬沒想到Intel真的就脫下褲子跟你拼了。推土機(jī)家族留下的遺產(chǎn),只有在Zen微架構(gòu)開花結(jié)果的先進(jìn)動(dòng)態(tài)分支預(yù)測技術(shù)。

  同場加映Intel 的鐘擺,AMD 戰(zhàn)線不全面崩盤還真的沒有天理:

  2011年(Tock):Sandy Bridge,32nm制程,AVX指令集,微指令快取堪稱Intel從NetBurst那激進(jìn)至極的Trace Cache一路摸石過河的最佳集大成,換裝NetBurst系非循序指令執(zhí)行引擎,也結(jié)束了光榮的P6時(shí)代。這時(shí)候,AMD用兩倍的核心數(shù)勉力抗衡,還稍有喘息空間。

  2012年(Tick):Ivy Bridge,22nm制程(Intel不動(dòng)聲色導(dǎo)入3D電晶體),如過去的Tick,充滿了一堆看起來好像很沒什么但又好像很厲害的“微幅改進(jìn)”,但原生15核心版本,幾乎就是釘在AMD Opteron棺材上的第一根釘子,讓AMD已經(jīng)沒有靠雙餡水餃以量取勝的希望。

  2013年(Tock):Haswell,22nm制程3D電晶體,AVX2指令集,Intel主力x86微架構(gòu)發(fā)展史上最大的執(zhí)行單元橫向擴(kuò)張,最大核心數(shù)擴(kuò)張到18核,AMD連核心數(shù)量優(yōu)勢都沒了,棺材再打上一根釘子。值得注意的是,從Haswell開始,Intel開始虛擬化功能,加入更精細(xì)的快取存取QoS機(jī)能。

  2014年(Tick):Broadwell,14nm制程3D電晶體,還是依循優(yōu)良傳統(tǒng),充滿一堆看起來好像很沒什么但又好像很厲害的“微幅改進(jìn)”,最大22核心和有點(diǎn)走火入魔的快取存取QoS機(jī)能,讓已經(jīng)被埋在土里的Opteron就算躺著中槍也不會喊痛了。不過Broadwell世代的整合內(nèi)顯處理器卻隱藏了Intel未來在服務(wù)器與高效能運(yùn)算市場可能隨時(shí)上場的超級武器:可能用來當(dāng)L4快取的高容量嵌入式DRAM,這在過去是IBM和日本廠商的強(qiáng)項(xiàng),未來卻可能變成Intel的王牌。

  2015年(Tock):Skylake,14nm制程3D電晶體,鐘擺巨輪終于停下,Intel恐怕也被太過頻繁的制程升級搞到人仰馬翻了,產(chǎn)品持續(xù)推陳出新對業(yè)務(wù)系統(tǒng)造成的銷售壓力大概也不足為外人道也,開始轉(zhuǎn)型成牙膏商,一次Tock擠一次不夠,你可以擠三次。Intel開始好整以暇,慢條斯理的將過去不同插槽的多種服務(wù)器平臺,與FPGA、HPC專用高速介面Omni-Path等特殊應(yīng)用,畢其功于一役整合在Skylake-SP“Purley”上(只差沒趕上3DX Point NVDIMM的Apache Pass),也讓服務(wù)器用處理器有差異化(AVX-512指令集,Mesh匯流排)──然后就被AMD EPYC一口咬上。

  洋洋灑灑一大篇,重點(diǎn)只有一句話:AMD的研發(fā)資源遠(yuǎn)遠(yuǎn)不及Intel,沒有任何犯錯(cuò)的空間,Intel以“擅于站在巨人肩膀上”的以色列海法與“持續(xù)追求激進(jìn)創(chuàng)新”的奧勒岡Hillsboro兩大軸心擔(dān)綱創(chuàng)新的“Tock”,搭配數(shù)個(gè)負(fù)責(zé)改良“Tick”或?qū)W⒂谔厥鈶?yīng)用的輔助研發(fā)中心(像總部Santa Clara、加州Folsom、德州Austin、印度Bangalore等),才足以支撐x86單一微架構(gòu)開發(fā)案,因指令集先天毫無道理可尋的高度復(fù)雜性與其帶來的驗(yàn)證復(fù)雜度,動(dòng)輒3到5年,卻如此密集的產(chǎn)品更新頻率。

  反過來說,鐘擺戰(zhàn)略強(qiáng)迫每個(gè)研發(fā)中心“有效分工”,也徹底解放了Intel 的處理器研發(fā)潛能,至于有沒有趁機(jī)解決內(nèi)部政治問題的家務(wù)事,就不是外人可以置喙的了。



關(guān)鍵詞: AMD Zen

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉