熱門芯片亮點(diǎn)
別讓芯片過熱
8月14~16日,在Stanford大學(xué)召開的為期三天的第17屆熱門芯片展(Hot Chips 17)落下了帷幕。回顧本屆展覽,展品范圍廣泛,從科研前沿到流行商用芯片應(yīng)有盡有,本文很難面面俱到(可瀏覽www. hotchips.org/hc17),僅就當(dāng)前的亮點(diǎn)作一概覽。
今年的熱門芯片展上展出了IBM的游戲機(jī)控制臺,并進(jìn)一步披露Cell處理器的結(jié)構(gòu),微軟談了Xbox360系統(tǒng)的某些的細(xì)節(jié),Toshiba介紹了為PlayStation 3配套的超級I/O芯片,還有IBM關(guān)于其寄存器的數(shù)據(jù)操作細(xì)節(jié)、器件連接總線和編程模塊等展項(xiàng)。
會展程序的安排反映了當(dāng)前研發(fā)的主體,正轉(zhuǎn)向可配置邏輯和渾然不于傳統(tǒng)馮尼曼主流結(jié)構(gòu)的處理器。Telairity, Philips, Cradle和Tensilica (軟核IP)等公司研制出各有自己獨(dú)特解決方法的媒體處理器。
在前沿技術(shù)方面,Luxtera令聽眾第一次窺見用調(diào)制激光所生產(chǎn)的硅片結(jié)構(gòu)。環(huán)形調(diào)制器生成的半徑為30_m的硅結(jié)構(gòu)準(zhǔn)備用于生產(chǎn)可微調(diào)的光學(xué)濾波器。
另一個非??岬男录夹g(shù)是用超導(dǎo)和Josephson結(jié)研制的40GHz的高頻邏輯開關(guān),用于控制無損耗超導(dǎo)中傳送的量子脈沖信號。其極終目標(biāo)是要制造超帶寬的微型控制器件。雖然這項(xiàng)技術(shù)今天還正在開發(fā)之中,但是感到美中不足的是,為保持超導(dǎo)所需的7K低溫,所需制冷設(shè)備太過笨重。
離不開摩爾定律
Intel技術(shù)與生產(chǎn)部總經(jīng)理Bill Holt回顧Intel半導(dǎo)體技術(shù)發(fā)展的歷程時說,Intel持續(xù)地保持著大約每兩年微電子技術(shù)前進(jìn)一個階梯的速度,印證了摩爾定律的正確。而且預(yù)計(jì)最近若干年內(nèi)還會出現(xiàn)幾次這種微電子技術(shù)的階躍。
Holt指出當(dāng)前微電子的生產(chǎn)技術(shù)向多核結(jié)構(gòu)轉(zhuǎn)移,其背后的秘密與降低硅片的功耗密度有關(guān)。雙核處理器使每個核的工作電壓與頻率降低,而管芯面積翻番。于是,原來集中在單核管芯的功耗不僅得以降低并且還被分散于倍增的面積之上。
改變特定電路的設(shè)計(jì)也能降低局部的熱力集中。將電路分成兩個半速的功能塊,可以降低每個功能塊的峰值功率,且將功耗分散于較大面積的管芯之上。代價是需用雙倍的晶體管和較大的管芯面積。如果使用90nm或更先進(jìn)的工藝,將大量的晶體管集成于相對較小硅面積的余地越大。
Intel沒有走大力降低功能塊功率的道路,而是繞過去對時鐘電路加以控制??墒菍r鐘電路的控制并不能改變晶體管的靜態(tài)漏電流。為切斷漏電流需增加“睡眠”晶體管,像高速緩存器那樣集中地切斷大型晶體管的電源線和底線。但是它們的再次上電,需要增加一個以上的額外時鐘周期。Holt說,這項(xiàng)技術(shù)已用于整塊的高速緩存。那里需要更多的時鐘周期,然而切斷電源的時間往往是數(shù)倍于此時間的。
增加額外時鐘周期的主要原因是因連線的RC延遲。改進(jìn)連線結(jié)構(gòu)使電路靠得更近,改進(jìn)管芯集成策略將硅層3維疊置。這種將同樣的管芯上下疊置,可能是制造多核處理器和相應(yīng)SoC的更好更快的途徑。這種想法與Sun公司的臨近連接的研究課題有些相近。
Xbox360結(jié)構(gòu)設(shè)計(jì)
微軟對即將面世的Xbox360游戲控制臺系統(tǒng)作了進(jìn)一步介紹,并在一臺Xbox360的開發(fā)系統(tǒng)上進(jìn)行演示。微軟是在多核策略的基礎(chǔ)上構(gòu)建Xbox360的。微軟表示其設(shè)計(jì)目標(biāo):旨在向游戲程序的開發(fā)者提供一個強(qiáng)大而價格又是可接受的平臺。功能強(qiáng)大的3核處理器是一個便于開發(fā)的對稱多處理器方案,微軟使用OpenMP實(shí)現(xiàn)線程API。3核處理器附有1MB的 L2 高速緩存和總數(shù)為1.65億只晶體管。
Xbox360 有512MB統(tǒng)一的DDR3 DRAM 存儲器,連接到圖形處理單元(GPU) (見圖1)。它不同于Sony的PlayStation 3 游戲站的設(shè)計(jì)。Sony的設(shè)計(jì)中,存儲器是分散于多核處理器和GPU之間的。分散存儲器的好處是各有自己專用帶寬的存儲器,但缺點(diǎn)是封裝的引腳多、硅片集成度低、存儲器劃分固定和高價位。而統(tǒng)一存儲器的好處是,可以按需要在處理器之間重新劃分,但是,在設(shè)計(jì)Xbox360時必須考慮到處理器與主存儲器之間的較長延時,應(yīng)采取措施進(jìn)行補(bǔ)償。
Xbox360使用了一種技術(shù)使每個CPU核的數(shù)據(jù)流只進(jìn)入自己的數(shù)據(jù)緩沖L1,避免多次出入高速緩存L2,攪亂那里的正常數(shù)據(jù)流 (見圖2)。每個CPU核處理結(jié)束后的流才送到3核共用的L2 。GPU使用IBM設(shè)計(jì)的高速點(diǎn)-點(diǎn)連接,直接從3核共用的L2取到正確的數(shù)據(jù)流。采用這樣的流數(shù)據(jù)編程模式,使程序員能以最少的讀和寫數(shù)來節(jié)約存儲器的帶寬。
每個CPU核模塊將圖形/文字的數(shù)據(jù)流送到L1 數(shù)據(jù)高速緩存,經(jīng)整理后再送入共用的1MB L2高速緩存。 GPU 直接從L2 獲得數(shù)據(jù)流,免除多余的對DRAM主存的讀/寫
所有CPU核所用的高速緩存的位寬為128b。 L2高速緩存具有靈活的指令集能對確定的指令與數(shù)據(jù)加鎖,如微軟設(shè)計(jì)的VMX SIMD單元有專門擴(kuò)展的指令。它包括有點(diǎn)積和支持同GPU相共享的Direct3D API 數(shù)據(jù)格式。今年10月由In-Stat《微處理器報告》主辦的“秋季處理器論壇”上,對于Xbox360 還會有進(jìn)一步的介紹。
ATI所設(shè)計(jì)的GPU (見圖3)具有48個并行的工作于500MHz的統(tǒng)一分色器核。每個核均支持32位的IEEE浮點(diǎn)運(yùn)算。它是對每條指令都能進(jìn)行向量、標(biāo)量、和紋理運(yùn)算的超標(biāo)量結(jié)構(gòu),每秒鐘能執(zhí)行240億次分色器指令。其他可列出的峰值技術(shù)規(guī)范還有:全速時的每秒40億次的像素運(yùn)算、每秒80億次的雙向線性采樣率、以及每秒5億次的有關(guān)于三角形的幾何運(yùn)算。
著眼于效率,CPU核可以工作于GPU的從機(jī)模式。為了及時提交3D圖像,必須使圖像跟上視頻刷新的時間要求,經(jīng)常需運(yùn)行于最高優(yōu)先級,各CPU核應(yīng)竭盡全力保證所提供的流水線能夠避免出現(xiàn)不自然的人為痕跡(如不完整的紋理組織)和屏幕更新的呆滯,總之,不允許干擾畫面的真實(shí)感和游戲的沉迷感。
Xbox360芯片要在不同的90nm工廠生產(chǎn)。微軟希望以后能把管芯的尺寸縮小,并移植到下一代生產(chǎn)工藝的流水線上去生產(chǎn),從而降低游戲機(jī)控制臺的價格。
并非事必“多核”
盡管Intel對于多核處理器和Xbox360作過許多正面的宣傳,外界也有許多將多核處理器用于家用PC、游戲控制臺、和其它消費(fèi)設(shè)備的多種設(shè)想,然而,也有一種聲音在說:皇帝沒穿衣服!對熱點(diǎn)芯片發(fā)表這樣基調(diào)的,有Nvidia公司的主要科學(xué)家David Kirk,他指出,今天尚缺乏能有效使用多核處理器的內(nèi)容(如游戲的節(jié)目)!幾乎同時,John Carmack——Id軟件公司的合伙創(chuàng)立人、技術(shù)主任和編程老鳥,在一次有關(guān)計(jì)算機(jī)游戲的聚會時談到,用現(xiàn)行的軟件方法和工具要想使多線程游戲程序正確地工作是很困難的。還指出,對于PC,除去應(yīng)用代碼問題之外,驅(qū)動程序也得改進(jìn)。一般來說,編寫常規(guī)的串序執(zhí)行程序,游戲程序的編程人員需要花費(fèi)多年時間才能對一種處理器體現(xiàn)出優(yōu)化。將代碼拆分成多核執(zhí)行的形式,又得重新進(jìn)行優(yōu)化,它們都需要時間和重新加以研究和探討。
多線程編碼的部分問題還在于,現(xiàn)在最常用的語言對于揭示出并行性的能力很弱。Kirk也相信,對此問題,目前還沒有足夠的主流研究和教育部門的關(guān)注。超級計(jì)算機(jī)界的研究者和專業(yè)軟件界的編程者可能都不會同意這種多核的主張,因?yàn)樯袩o多線程方面的擴(kuò)展研究;再者,多線程也未形成主流研究課題。誠然,多核PC和游戲控制臺將來會促使多線程編碼成為一個主流研究課題。
上述問題會獲得解決的一個信號,是Intel, Microsoft, 和Cell計(jì)算機(jī)的伙伴(IBM/Sony) 提供了多核處理器的改良軟件工具。當(dāng)程序人員學(xué)會如何有效使用多核技巧的時候,相信抱怨定會減少。(摘自美國Microprocessor Report,梁合慶譯)
評論