3D DRAM,Chiplet芯片微縮化的“續(xù)命良藥”
來源:ASPENCORE
在邊緣計算領(lǐng)域里,對DRAM帶寬的要求遠高于容量,此時采用Chiplet方式集成3D DRAM存儲方案,就可以同時提供高帶寬和低功耗。
今年2月,在正式加入UCIe?(Universal Chiplet Interconnect Express?)產(chǎn)業(yè)聯(lián)盟之后,華邦電子隨即宣布其創(chuàng)新產(chǎn)品CUBE: 3D TSV DRAM和3DCaaS(3D CUBE as a Service)一站式服務平臺,將成為公司向客戶提供優(yōu)質(zhì)定制化內(nèi)存的首選解決方案。
芯片微縮化的“續(xù)命良藥”CUBE是Customized/Compact Ultra Bandwidth Elements,即“半定制化緊湊型超高帶寬DRAM”的簡稱。華邦電子次世代內(nèi)存產(chǎn)品營銷企劃經(jīng)理曾一峻在向《電子工程專輯》說明CUBE核心價值時表示,新能源汽車、5G、可穿戴設備等領(lǐng)域的不斷發(fā)展,對芯片性能的需求越來越高,但如果采用諸如“直接在5nm SoC裸片上堆疊7nm SRAM裸片”的做法,會因為帶入太多TSV工藝架構(gòu)而導致芯片成本暴漲。
于是,采用先進封裝技術(shù)的Chiplet成為了芯片微縮化進程的“續(xù)命良藥”?!斑@也是華邦解決方案的思路”,按照曾一峻的解釋,在邊緣計算領(lǐng)域,華邦將SoC裸片置上,DRAM裸片置下,省去了SoC中的TSV工藝(圖中虛線部分所示),從而大幅降低了SoC裸片的尺寸與成本。與此同時,3D DRAM TSV工藝又可以將SoC信號引至外部,使它們成為同一顆芯片,進一步縮減了封裝尺寸。
另一方面,考慮到現(xiàn)在的AI芯片都有著很高的算力需求,SoC裸片置上也可以帶來更好的散熱效果。因此,華邦方面認為,按照這樣的方式進行CUBE 3D DRAM 裸片堆疊可以帶來高帶寬、低功耗和優(yōu)秀的散熱表現(xiàn),這也是華邦CUBE解決方案主要面向低功耗、高帶寬、中低容量內(nèi)存需求應用的主要原因。
眾所周知,DRAM裸片中都會包含電容,華邦CUBE芯片也不例外。目前,先進制程SoC芯片的核心電壓約為0.75V-1V,運行過程中電源產(chǎn)生的波動會影響功耗和信號穩(wěn)定性。但CUBE芯片所采用的硅電容(Si-Cap)卻可以有效降低電源波動帶來的影響。
下圖是華邦當前硅電容規(guī)格和制程的進展??梢钥吹?,盡管電容縮小到了原來的一半,但是運行的經(jīng)時擊穿電壓(TDDB)卻被提高了1倍至1.5V(這也是目前大部分先進制程芯片的核心電壓),擊穿電壓也是目前先進制程所需的5V,因此1500nF/(mm2)是完全符合目前先進制程芯片的電容需求。而根據(jù)規(guī)劃,下半年還會有更優(yōu)規(guī)格的硅電容產(chǎn)品面世。
再來關(guān)注一下華邦DRAM堆疊和中介層(Interposer)架構(gòu)的演進。如圖所示,由于中介層也是華邦提供,因此客戶可以得到一個包括DRAM、中介層、硅電容在內(nèi)的整體解決方案,這也是華邦加入UCIe后做出的貢獻之一。
另一個值得關(guān)注的優(yōu)勢來自功耗的降低。由于SoC裸片和DRAM裸片堆疊的時候,相比于傳統(tǒng)的引線鍵合(Wire Bonding),微鍵合(Micro Bonding)工藝可以將1000微米的線長縮短至40微米,僅有傳統(tǒng)長度的2.5%,在未來的混合鍵合(Hybrid Bonding)封裝工藝下,線長甚至可以縮短至1微米。這意味著在芯片內(nèi)部,信號所經(jīng)過的傳輸距離更短,功耗自然也得到相應的降低。此外,當采用混合鍵合工藝時,兩顆堆疊的芯片其實可以被看作同一顆芯片,因此內(nèi)部傳輸信號和SIP表現(xiàn)會更優(yōu)秀。
與CUBE同時出現(xiàn)的還包括3D CaaS平臺,也就是 CUBE as a Service。這意味著對于客戶來說,華邦不僅僅提供3D TSV DRAM KGD內(nèi)存芯片和針對多芯片設備優(yōu)化的2.5D/3D后段工藝(采用CoW/WoW),還可獲取由華邦的平臺合作伙伴提供的技術(shù)咨詢服務,是一套完整且全面的CUBE產(chǎn)品支持,并享受Silicon-Cap、interposer等技術(shù)的附加服務。
CUBE應用架構(gòu)ChatGPT的面世帶動了AI應用領(lǐng)域的再次火熱,而CUBE就可以應用到AI-ISP架構(gòu)中。
上圖中的灰色部分代表AI-ISP中的神經(jīng)網(wǎng)絡處理器(NPU),如果AI-ISP要實現(xiàn)大算力,就需要很大的帶寬,或者是SPRAM加持。但目前來看,在AI-ISP上使用SPRAM成本高昂,轉(zhuǎn)而使用LPDDR4則需要4-8顆,如果用到傳輸速度為4266Mhz的高速LPDDR4,還需要依賴7nm或12nm的先進制程工藝。
相比之下,CUBE解決方案就可以允許客戶使用成熟制程(28nm/22nm)獲得類似的高速帶寬。簡單而言,CUBE芯片可以通過多個I/O(256或者512個)結(jié)合28nm SoC提供500MHz運行頻率,以及最高256GB/s帶寬。據(jù)透露,華邦在未來可能會和客戶共同探討64GB/s帶寬的合作可能性,如果成功,I/O數(shù)量和裸片尺寸都將進一步縮小。
在下面的應用場景中,CPU的高速運算需求對制程的要求從16nm、7nm、5nm到3nm,越來越高。但不難發(fā)現(xiàn),盡管制程工藝越來越先進,圖中紅色部分所代表的SRAM占比并沒有同比例縮小,因此當需要實現(xiàn)AI運算或者高速運算的情況下,就需要將L3緩存SRAM容量加大,即便采用堆疊方式達到幾百MB,也會導致高昂的成本。
華邦的做法是將L3緩存縮小,轉(zhuǎn)而使用L4緩存的CUBE解決方案。這并不意味著CUBE解決方案的時鐘傳播延遲(Latency)等同于SRAM,而是可以作為L4緩存。原因在于CUBE可以進行定制化的設計,使得時鐘傳播延遲比一般的DRAM還要短。同時,考慮到AI模型在某些情況下需要外置一定容量的內(nèi)存,例如在某些邊緣計算場景下會需要8-12GB LPDDR4/LPDDR5,因此在需要的情況下,也可以外掛高容量工作內(nèi)存(Working Memory)。
“在邊緣計算領(lǐng)域里,對DRAM帶寬的要求遠高于容量,此時采用Chiplet方式集成類似CUBE的存儲方案,就可以同時提供高帶寬和低功耗。”但曾一峻也同時強調(diào)稱,畢竟Chiplet芯片需要兼容多個接口協(xié)議才能避免造成信號偏差,因此,如何進一步縮小3D DRAM的裸片尺寸,如何更好的實現(xiàn)不同芯粒間的互聯(lián)互通,是繞不開的挑戰(zhàn)。
華邦DRAM技術(shù)路線圖相對于市場上三大頭部內(nèi)存廠商而言,華邦主要專注于利基型內(nèi)存,產(chǎn)品容量一般最大為8GB,其特點是不需要非常先進的制程,并以KGD為主,便于與SoC進行合封。
在KGD 1.0(SiP)中,DRAM Die厚度約為100-150微米,裸片至裸片(Die to Die)的I/O路徑為1000微米,目前這種性能的KGD信號完整性/電源完整性(SI/PI)是主流的,也是夠用的。華邦方面曾經(jīng)對LPDDR4的電源效率進行過估算,其小于35pJ/Byte,帶寬方面X32 LPDDR4x每I/O為17GB/s。
當進化到KGD 2.0(3D堆疊)后,得益于TSV的深寬比能力,DRAM Die厚度可以達到50微米的深度,未來,通過Hybrid Bonding工藝還可以實現(xiàn)1微米的距離。同時,信號完整性/電源完整性(SI/PI)性能更好,功耗更低,可以達到甚至低于LPDDR4的四分之一(為8pJ/Byte),而帶寬可以實現(xiàn)16-256GB/s。
目前,華邦擁有兩座12寸晶圓廠,一座是位于臺中的Fab 6工廠,另一座是在高雄新建的第二座工廠,其產(chǎn)能為1萬片/月左右,后續(xù)將逐漸提升至1.4萬片-2萬片/月。
從制程工藝角度來看,高雄工廠投產(chǎn)后,華邦會將一些先進制程的DRAM產(chǎn)能轉(zhuǎn)移至高雄廠,臺中廠的中小容量DRAM制程會維持在65nm、46nm、38nm和25nm,且無意再向更小制程演進,而是專注于成熟制程產(chǎn)品。高雄廠已經(jīng)量產(chǎn)的包括25nm 2GB和4GB兩種產(chǎn)品,20nm產(chǎn)品預計在今年年中進入量產(chǎn)階段,并繼續(xù)向19nm制程演進。
華邦電子大陸區(qū)產(chǎn)品營銷處處長朱迪再次強調(diào)了華邦對于DDR3的生產(chǎn)和支持。盡管他認為像三星這樣的大廠逐漸舍棄DDR3和中小容量DDR4是一個大概率的事件,但從實際使用情況來看,4Gb DDR3產(chǎn)品將有望繼續(xù)被廣泛采用至少到2027-2028年,尤其在工業(yè)和汽車領(lǐng)域需要長期支持。而且,相同容量相同速度下,DDR3較DDR4更具成本效益(相同制程下,與DDR3相比,Die尺寸DDR4增加10%,LPDDR4增加18%),DDR4將會持續(xù)向更高容量發(fā)展,并隨著PC和服務器市場的需求遷移至DDR5。
根據(jù)規(guī)劃,DDR3仍將保持1Gb、2Gb、4Gb和8Gb四種容量,并計劃在2025年演進至16nm;DDR4方面,當20nm制程就緒之后,高雄廠會在2024年初量產(chǎn)DDR4 DRAM芯片。
“利基型存儲市場大約只占整個存儲市場的10%,它的供需相對而言是比較平衡和穩(wěn)定的。在當前終端客戶、代理商、以及原廠庫存都比較低的情況下,確實有可能會出現(xiàn)缺貨的情況,但對具體時間節(jié)點做出判斷為時尚早,需要做進一步的觀察?!敝斓险f。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。