憶往昔展未來 AMD能否建立不毀防線?
陽光般的貴人
本文引用地址:http://butianyuan.cn/article/201708/362433.htm但AMD 過去沒真正經(jīng)營過服務(wù)器市場(chǎng),因產(chǎn)品需更可靠,軟硬體環(huán)境更加復(fù)雜,服務(wù)器的產(chǎn)品驗(yàn)證遠(yuǎn)比個(gè)人電腦嚴(yán)謹(jǐn),那AMD 如何彌補(bǔ)缺乏經(jīng)驗(yàn)的弱點(diǎn)?
無獨(dú)有偶,因Ultra SPARC 逐漸失去競(jìng)爭(zhēng)力,被迫進(jìn)入x86 服務(wù)器市場(chǎng)且在市場(chǎng)開發(fā)階段不斷掙扎的Sun,也許因Opteron 系統(tǒng)架構(gòu)近似于后來取消的幾個(gè)UltraSPARC 處理器專案,優(yōu)先選擇AMD 為x86 服務(wù)器處理器供應(yīng)商,Sun 也是最早推出Opteron 服務(wù)器的一線大廠。Sun 身為客戶的反饋,補(bǔ)強(qiáng)了AMD 過去一直缺乏經(jīng)驗(yàn)的服務(wù)器環(huán)境驗(yàn)證,這影響遠(yuǎn)遠(yuǎn)超出很多人的想像。
Sun 的選擇,同時(shí)增強(qiáng)了其他服務(wù)器市場(chǎng)競(jìng)爭(zhēng)對(duì)手與企業(yè)客戶對(duì)AMD 服務(wù)器產(chǎn)品線的信心,AMD 開始懂得如何做好過去一直被系統(tǒng)客戶罵翻的產(chǎn)品品質(zhì)和嚴(yán)苛驗(yàn)證,而且隨著越來越多客戶選擇Opteron,進(jìn)入良性循環(huán),直到開始有越來越多企業(yè)用戶相信“Opteron 優(yōu)于Xeon”,包括臺(tái)灣以前某個(gè)“有名大站”等。
除了從天上掉下來砸到AMD 的幸運(yùn),已經(jīng)沒有其他可以解釋的理由了。
AMD 從此不再是企業(yè)市場(chǎng)的陌生人
也許一般個(gè)人電腦玩家無法體會(huì)這種感覺,但當(dāng)看到最普及的商用Unix 作業(yè)系統(tǒng)Solaris,跑在搭載AMD Opteron、由Sun 天字第一號(hào)員工親自設(shè)計(jì)如同藝術(shù)品的Galaxy 系列x86 服務(wù)器上,這對(duì)當(dāng)時(shí)無法把AMD 跟企業(yè)應(yīng)用聯(lián)想在一起的企業(yè)客戶是何等巨大的震撼。
別說支援原生雙處理器了,你看過8 顆Opteron 處理器的服務(wù)器嗎?而且上面掛的品牌還是Sun HP 這些大廠(HP 雖貴為Intel 在Itanium 最重要甚至可說是實(shí)際上唯一的伙伴,但后來HP 賣Opteron 服務(wù)器卻是賣最兇的,Intel 應(yīng)該不少人內(nèi)心五味雜陳)。
這也是Hector Ruiz 擔(dān)任AMD 執(zhí)行長的最大貢獻(xiàn),讓AMD 成功進(jìn)入企業(yè)市場(chǎng),不只服務(wù)器,后來商用電腦與筆電也雨露均沾,AMD 慢慢占有一席之地,在職場(chǎng)隨處可見AMD Inside 的系統(tǒng)。即使近年AMD 比較弱勢(shì),多數(shù)人也不會(huì)覺得公司配發(fā)給你的生產(chǎn)力工具里面裝著來自AMD 的心臟,是很奇怪的事情。
AMD Opteron 的成功,也許可以直接從產(chǎn)品牌價(jià)略見一斑:2003 年的Opteron 846 / 848,曾高達(dá)3,199 美元,直到最近的EPYC 7500,才再度看到這種等級(jí)的價(jià)格標(biāo)簽,整整相隔了近14年。
得來不易的優(yōu)勢(shì)最終仍慘遭Intel 鐘擺巨輪輾碎
但AMD 的攻勢(shì)也就到了盡頭,接著就是Intel 在2006 年重整旗鼓開始帝國大反擊,也是關(guān)心過去10 年處理器市場(chǎng)的讀者所熟悉的“鐘擺(Tick-Tock)戰(zhàn)略”,小步快跑,急起直追,展現(xiàn)了驚人的執(zhí)行力,以服務(wù)器市場(chǎng)為主,Intel 追擊的軌跡可簡(jiǎn)述為:
2006年:由以色列海法主導(dǎo)、原本和NetBurst高低檔搭配的Pentium M體系Merom微架構(gòu),完全取代NetBurst,一統(tǒng)服務(wù)器、桌機(jī)、筆電。這時(shí)Intel靠著Woodcrest奪回單一核心的效能優(yōu)勢(shì),也再度確定Intel高效能x86微架構(gòu)的發(fā)展基礎(chǔ),回到起源于1995年P(guān)entium Pro的P6,直到非循序指令執(zhí)行引擎替換成NetBurst系的Sandy Bridge,才替問世于1995年的P6劃下輝煌的句點(diǎn)。
沒有原生4 核沒關(guān)系,采用多芯片封裝一次包兩顆湊4 核也可以。當(dāng)時(shí)應(yīng)該也少人預(yù)期到,隔沒幾年,就換AMD 被迫如法炮制昔日嘲諷的“雙餡水餃”,在Socket G34 塞兩顆核心二打一,勉強(qiáng)對(duì)抗占有優(yōu)勢(shì)的Intel。
2009年:由Hillsboro主導(dǎo)、在Pentium 4初期曾目標(biāo)“時(shí)脈上看10GHz”的Nehalem,重回以P6體系為基礎(chǔ)后,原生4核加上了同時(shí)多執(zhí)行緒、QPI匯流排、整合式記憶體控制器與相對(duì)應(yīng)的MESIF快取記憶體一致性協(xié)定,基本上已經(jīng)可以視為“Intel世界的K8”,但青出于藍(lán)勝于藍(lán),AMD K8的多處理器系統(tǒng)架構(gòu)優(yōu)勢(shì),此時(shí)已蕩然無存(除了Intel多出很燙手有點(diǎn)難散熱的IOH),支撐AMD不墜的,只有K8重大戰(zhàn)略勝利的剩余動(dòng)量與現(xiàn)有客戶的信心度。
對(duì)Intel,開始移植源自Itanium 的系統(tǒng)可靠性技術(shù)至8 處理器Nehalem-EX 最重大的意義是:確立Itanium 邊緣化的命運(yùn)。2006 年啟動(dòng)鐘擺戰(zhàn)略時(shí),將64 位元x86 指令集從心不甘情不愿的IA-32e 和EM64T 正名為Intel 64,就初露端倪。這重大的戰(zhàn)略決定,也和當(dāng)時(shí)Intel 部分高層離職潮有直接或間接關(guān)系,包括因P6 奇跡而擁有完美“服務(wù)器夏天”感到驕傲的某任Cadence 執(zhí)行長,與18 歲就進(jìn)Intel 上班,后來確定搶不到執(zhí)行長而跳槽VMware 時(shí)還放話“Itanium 業(yè)務(wù)其實(shí)有賺錢”的那位。
當(dāng)然,AMD 也沒有閑著坐等Intel 咬上來,但以K8 為基礎(chǔ)的原生4 核K10(Barcelona,Shanghai)與原生6 核K10(Istanbul),相較于Intel 的鐘擺頻率,進(jìn)步幅度都太小了,而Barcelona 的TLB 臭蟲事件,更傷害了企業(yè)對(duì)Opteron 的信心,以Nehalem 微架構(gòu)與Tylersburg 平臺(tái)為死亡交叉點(diǎn),即使AMD 再如何對(duì)外宣稱“執(zhí)行力到位”,如2006 年底在德州展示原生4 核,2009 年準(zhǔn)時(shí)推出Istanbul 等,頹勢(shì)已無法挽回。
2011~2012年:AMD一拖再拖、由IBM Power4總架構(gòu)師Chuck Moore操刀的Bulldozer,與Intel同樣一再延宕的Sandy Bridge在服務(wù)器市場(chǎng)頂上決戰(zhàn),從內(nèi)到外每個(gè)環(huán)節(jié)幾乎都輸人的AMD,就如同在衛(wèi)城作戰(zhàn)失敗后的德軍,從此一蹶不振,連續(xù)4個(gè)世代叢集多執(zhí)行緒微架構(gòu)都被Intel“后P6時(shí)代”鐘擺壓垮,低耗電微架構(gòu)Jaguar與ARM Cortex-A57的Opteron,對(duì)大局完全無足輕重,直到2017年Zen微架構(gòu)的EPYC問世前,沒有一絲一毫翻身的可能性。
對(duì)了,為何AMD 沒有K9?因?yàn)镵9 的英文發(fā)音是“犬類”,AMD 不想當(dāng)敗家之犬,只可惜本名K8L 的K10 也沒有成功阻止AMD 退潮。
走音出錘的推土機(jī)工地秀
Intel 有鐘擺,AMD 當(dāng)然也有,只是跟Intel 相比,AMD 連續(xù)4 個(gè)世代的叢集多執(zhí)行緒微架構(gòu),完全是小巫見大巫,而AMD 為了異質(zhì)多核心大計(jì)預(yù)先鋪設(shè)的暗樁,也被Intel的鐘擺巨輪輾成碎片。
2011年:推土機(jī)(Bulldozer),32nm制程,出師不利的先鋒,因?yàn)橥仆翙C(jī)設(shè)定集里面的預(yù)定對(duì)手不是Sandy Bridge,而是前一代Westmere甚至是更早的Nehalem。“剛剛好”經(jīng)領(lǐng)導(dǎo)K7救世主的Dirk Meyer就在2011年初從執(zhí)行長大位下臺(tái)一鞠躬,代表AMD經(jīng)營階層對(duì)采取雙軌路線(推土機(jī)搭配山貓)投下的不信任票。
2012年:打樁機(jī)(Piledriver),32nm制程(SOI晶圓),微幅改進(jìn)微架構(gòu),主要著眼在分支預(yù)測(cè)和指令排程,但聊勝于無。這時(shí)候,已經(jīng)傳聞AMD準(zhǔn)備全面棄守現(xiàn)有產(chǎn)品時(shí)程表,全力投入全新x86微架構(gòu)與開辟ARM服務(wù)器戰(zhàn)線。
2014年:壓路機(jī)(Steamroller),28nm制程,AMD終于真正對(duì)癥下藥,疏通指令管線前端的塞車問題,改進(jìn)指令快取的命中率(2路64kB升級(jí)為3路96kB),新增微指令回圈緩沖區(qū),也讓叢集多執(zhí)行緒的兩個(gè)整數(shù)邏輯運(yùn)算核心擁有專屬的指令解碼器,但為時(shí)已晚,AMD連早已不再閃亮的金雞母Opteron產(chǎn)品線都放棄導(dǎo)入“新”核心了,僅APU產(chǎn)品線有幸一親芳澤。
2015年:Excavator(挖土機(jī)),28nm制程(當(dāng)然有所改進(jìn)),在設(shè)計(jì)工具端,因引進(jìn)源自于GPU產(chǎn)品線的高密度函式庫,所以有更小的芯片面積和更好的電力效率,至于支援AVX2指令集與DDR4記憶體就不值得特別著墨了。
AMD原始如意算盤:用比較簡(jiǎn)單的微架構(gòu)跟你拼核心數(shù)和電力效率(類似RV770 GPU的概念),日后將雙核心共用的浮點(diǎn)運(yùn)算單元換裝成GPU更有巨大的應(yīng)用彈性,大概萬萬沒想到Intel真的就脫下褲子跟你拼了。推土機(jī)家族留下的遺產(chǎn),只有在Zen微架構(gòu)開花結(jié)果的先進(jìn)動(dòng)態(tài)分支預(yù)測(cè)技術(shù)。
同場(chǎng)加映Intel 的鐘擺,AMD 戰(zhàn)線不全面崩盤還真的沒有天理:
2011年(Tock):Sandy Bridge,32nm制程,AVX指令集,微指令快取堪稱Intel從NetBurst那激進(jìn)至極的Trace Cache一路摸石過河的最佳集大成,換裝NetBurst系非循序指令執(zhí)行引擎,也結(jié)束了光榮的P6時(shí)代。這時(shí)候,AMD用兩倍的核心數(shù)勉力抗衡,還稍有喘息空間。
2012年(Tick):Ivy Bridge,22nm制程(Intel不動(dòng)聲色導(dǎo)入3D電晶體),如過去的Tick,充滿了一堆看起來好像很沒什么但又好像很厲害的“微幅改進(jìn)”,但原生15核心版本,幾乎就是釘在AMD Opteron棺材上的第一根釘子,讓AMD已經(jīng)沒有靠雙餡水餃以量取勝的希望。
2013年(Tock):Haswell,22nm制程3D電晶體,AVX2指令集,Intel主力x86微架構(gòu)發(fā)展史上最大的執(zhí)行單元橫向擴(kuò)張,最大核心數(shù)擴(kuò)張到18核,AMD連核心數(shù)量優(yōu)勢(shì)都沒了,棺材再打上一根釘子。值得注意的是,從Haswell開始,Intel開始虛擬化功能,加入更精細(xì)的快取存取QoS機(jī)能。
2014年(Tick):Broadwell,14nm制程3D電晶體,還是依循優(yōu)良傳統(tǒng),充滿一堆看起來好像很沒什么但又好像很厲害的“微幅改進(jìn)”,最大22核心和有點(diǎn)走火入魔的快取存取QoS機(jī)能,讓已經(jīng)被埋在土里的Opteron就算躺著中槍也不會(huì)喊痛了。不過Broadwell世代的整合內(nèi)顯處理器卻隱藏了Intel未來在服務(wù)器與高效能運(yùn)算市場(chǎng)可能隨時(shí)上場(chǎng)的超級(jí)武器:可能用來當(dāng)L4快取的高容量嵌入式DRAM,這在過去是IBM和日本廠商的強(qiáng)項(xiàng),未來卻可能變成Intel的王牌。
2015年(Tock):Skylake,14nm制程3D電晶體,鐘擺巨輪終于停下,Intel恐怕也被太過頻繁的制程升級(jí)搞到人仰馬翻了,產(chǎn)品持續(xù)推陳出新對(duì)業(yè)務(wù)系統(tǒng)造成的銷售壓力大概也不足為外人道也,開始轉(zhuǎn)型成牙膏商,一次Tock擠一次不夠,你可以擠三次。Intel開始好整以暇,慢條斯理的將過去不同插槽的多種服務(wù)器平臺(tái),與FPGA、HPC專用高速介面Omni-Path等特殊應(yīng)用,畢其功于一役整合在Skylake-SP“Purley”上(只差沒趕上3DX Point NVDIMM的Apache Pass),也讓服務(wù)器用處理器有差異化(AVX-512指令集,Mesh匯流排)──然后就被AMD EPYC一口咬上。
洋洋灑灑一大篇,重點(diǎn)只有一句話:AMD的研發(fā)資源遠(yuǎn)遠(yuǎn)不及Intel,沒有任何犯錯(cuò)的空間,Intel以“擅于站在巨人肩膀上”的以色列海法與“持續(xù)追求激進(jìn)創(chuàng)新”的奧勒岡Hillsboro兩大軸心擔(dān)綱創(chuàng)新的“Tock”,搭配數(shù)個(gè)負(fù)責(zé)改良“Tick”或?qū)W⒂谔厥鈶?yīng)用的輔助研發(fā)中心(像總部Santa Clara、加州Folsom、德州Austin、印度Bangalore等),才足以支撐x86單一微架構(gòu)開發(fā)案,因指令集先天毫無道理可尋的高度復(fù)雜性與其帶來的驗(yàn)證復(fù)雜度,動(dòng)輒3到5年,卻如此密集的產(chǎn)品更新頻率。
反過來說,鐘擺戰(zhàn)略強(qiáng)迫每個(gè)研發(fā)中心“有效分工”,也徹底解放了Intel 的處理器研發(fā)潛能,至于有沒有趁機(jī)解決內(nèi)部政治問題的家務(wù)事,就不是外人可以置喙的了。
評(píng)論