如何擴(kuò)展 FPGA 的工作溫度范圍

作者：時(shí)間：2017-10-14 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　部分應(yīng)用要求電子產(chǎn)品運(yùn)行的溫度高于該器件規(guī)定的最高工作結(jié)溫。油井?dāng)z像頭設(shè)計(jì)就是一個(gè)很好的例證。

本文引用地址：http://butianyuan.cn/article/201710/366434.htm

　　任何電子器件的使用壽命均取決于其工作溫度。在較高溫度下器件會加快老化，使用壽命會縮短。但某些應(yīng)用要求電子產(chǎn)品工作在器件最大額定工作結(jié)溫下。以石油天然氣產(chǎn)業(yè)為例來說明這個(gè)問題以及解決方案。

　　一位客戶請求我們 Aphesa 的團(tuán)隊(duì)設(shè)計(jì)一款能夠在油井中工作的高溫?cái)z像頭（如圖 1 所示）。該器件要求使用相當(dāng)大的 FPGA 而且溫度要求至少高達(dá) 125℃——即系統(tǒng)的工作溫度。作為一家開發(fā)定制攝像頭和包括 FPGA代碼及嵌入式軟件在內(nèi)的定制電子產(chǎn)品的咨詢公司，我們在高溫工作條件方面擁有豐富的經(jīng)驗(yàn)。但就這個(gè)項(xiàng)目而言，我們還得多花些精力。

　　該產(chǎn)品是一種用于油井檢查的井下雙色攝像頭（如圖 2 所示）。它能執(zhí)行嵌入式圖像處理、色彩重構(gòu)和通信。該系統(tǒng)具有存儲器、LED 驅(qū)動器和高動態(tài)范圍（HDR）成像功能。針對該項(xiàng)目，我們選擇使用賽靈思提供的 XA6SLX45 器件（Spartan®-6 LX45 車用器件），因?yàn)樗哂袑挿旱墓ぷ鳒囟确秶?、穩(wěn)健可靠、封裝尺寸小、擁有大型嵌入式存儲器和大量單元。

　　該項(xiàng)目非常具有挑戰(zhàn)性，也有大量樂趣。下面介紹我們?nèi)绾瓮瓿稍擁?xiàng)目，首先回顧一下溫度的部分概念，包括結(jié)溫、熱阻和其他現(xiàn)象。我們將了解器件中溫升的原因并列出我們的解決方案。我們還將應(yīng)對可能的熱點(diǎn)問題并提出相應(yīng)的解決方案。

　　在這個(gè)特定項(xiàng)目中，熱電冷卻方式的使用受限，我們不得不尋找其他解決方案。

　　溫度變化

　　電子器件通常會指定最大結(jié)溫。但令人遺憾的是系統(tǒng)設(shè)計(jì)人員關(guān)心的是環(huán)境溫度。環(huán)境溫度和結(jié)溫的差異將取決于封裝傳遞熱量的能力以及冷卻系統(tǒng)將該熱量散出系統(tǒng)機(jī)箱的能力。

　　熱阻是一個(gè)熱屬性，也是衡量給定材料阻礙熱量流動的幅度的指標(biāo)。因?yàn)闊嶙璧拇嬖?，熱流通過的組件的內(nèi)外側(cè)溫度會有差異，正如電流的存在造成電阻兩端的電壓不同。對機(jī)身內(nèi)外側(cè)溫差 20℃ 的情況，最大結(jié)溫為 125℃ 的器件能夠在高達(dá) 105℃ 的環(huán)境下工作。熱阻的表達(dá)方式是℃/W，即耗散 1W 熱量時(shí)內(nèi)側(cè)和外側(cè)的溫差即為熱阻。熱阻是一種熱屬性，用來衡量給定材料阻礙熱量流動的幅度，這一關(guān)系以公式表示即為圖 3 所示。

　　耗散的熱能取決于器件、電路、時(shí)鐘頻率和運(yùn)行在器件上的代碼。器件內(nèi)部（結(jié)溫）和所在環(huán)境（環(huán)境溫度）之間的溫差因此取決于器件、代碼和工作原理圖。

　　常用冷卻解決方案

　　在大多數(shù)設(shè)計(jì)中需要冷卻的地方，設(shè)計(jì)人員使用無源冷卻（散熱器通過增大空氣接觸表面，幫助將熱量散發(fā)到空氣中）或使用有源冷卻。有源冷卻解決方案一般通過強(qiáng)制氣流，幫助更換用于吸收器件上熱量的冷空氣?？諝馕諢崃康哪芰θQ于空氣與器件之間的溫差以及空氣的壓力。其他解決方案包括液體冷卻，用液體（一般是水）取代空氣，可實(shí)現(xiàn)更高的散熱效率。空氣或流體吸熱的能力由圖 4 給出的熱吸收等式?jīng)Q定。設(shè)計(jì)人員常常使用的最終方法是熱電冷卻，即借助珀?duì)柼?yīng) （Peltier effect）（通過在連接到半導(dǎo)體樣品的兩個(gè)電極間施加電壓來形成溫差）來冷卻冷卻板的一側(cè)，同時(shí)加熱另一側(cè)。雖然這一現(xiàn)象有助于把熱量從待冷卻的器件上帶走，但珀?duì)柼鋮s有存在另一大不利因素：它要求大量的外部功耗。

　　在我們的案例中，氣流不是解決方案，因?yàn)闄C(jī)箱中的空氣數(shù)量有限，空氣溫度會迅速達(dá)到均衡。水冷也不可能，因?yàn)樗春凸ぞ咧g距離很長。因此對我們而言，珀?duì)柼?yīng)是唯一的冷卻解決方案。因?yàn)榄h(huán)境溫度是固定的（我們不能像圖 3 的公式一樣為大量液體加熱），熱電效應(yīng)冷卻器實(shí)際上會降低電子產(chǎn)品的溫度。令人遺憾的是，由于冷卻裝置需要大電流，而且需要用超長的導(dǎo)體將表面與工具相連，實(shí)際上只有有限的電流可用于冷卻，而且只能實(shí)現(xiàn)較小的溫差。

　　此外，由于我們的裝置是一個(gè)攝像頭，畫質(zhì)會隨溫度升高急劇下降。因此我們必須優(yōu)化我們的冷卻策略，盡量為圖像傳感器降低溫度，而不是 FPGA、存儲器、LED 驅(qū)動器或電源電路降低溫度。

　　由于珀?duì)柼?yīng)只能選擇用于冷卻圖像傳感器，用于冷卻 FPGA 幾乎沒有可能，所以我們唯一的選擇是降低FPGA 內(nèi)的峰值溫度。

　　熱點(diǎn)的原因

　　和不斷上升的溫度在數(shù)字器件中有三個(gè)功耗來源：動態(tài)、靜態(tài)和焦耳效應(yīng)。動態(tài)功耗是在門觸發(fā)時(shí)用于為走線電容充放電而消耗的電力。它與時(shí)鐘速率和總電容大小成正比。靜態(tài)功耗是器件類型、核心電壓和技術(shù)的函數(shù)。該功耗因內(nèi)核或 I/O 的耗電而產(chǎn)生。

　　當(dāng)熱量在空間中的某一點(diǎn)產(chǎn)生時(shí)，它將向周邊傳遞，導(dǎo)致周邊區(qū)域升溫。如果周邊區(qū)域不是熱源，則熱量會散開，溫升有限。只要等上足夠長的時(shí)間，溫度最終會在整個(gè)器件中均衡化。如果周邊區(qū)域是其他熱源構(gòu)成的，因?yàn)槊總€(gè)熱源都會給另一個(gè)熱源帶來熱量，溫度就會凈增長。

　　如果許多熱源集中在一小塊面積上，則這個(gè)面積的溫度會上升得比其他地方快，導(dǎo)致熱點(diǎn)產(chǎn)生。

　　由于器件的結(jié)溫受限，實(shí)際上最熱點(diǎn)的溫度不應(yīng)超過最大結(jié)溫。在知道器件的功耗和封裝的溫度后，所有我們能估計(jì)的平均結(jié)溫。

　　最后一個(gè)熱源與電流在導(dǎo)體中流動產(chǎn)生的焦耳效應(yīng)有關(guān)。

　　如果超過最高溫度會發(fā)生什么情況？

　　隨著工作溫度升高，器件的使用壽命會下降，部件會老化得更快。某些老化過程，如電遷移和電腐蝕只會在較高溫度下發(fā)生。電遷移發(fā)生在有濕氣和電場存在的條件下。此時(shí)導(dǎo)體的原子會以離子形態(tài)從他們的初始位置移動，在另外的地方復(fù)位，留下一個(gè)空隙。這個(gè)空隙會減小該位置導(dǎo)體的有效寬度，造成該位置電場增強(qiáng)，從而誘發(fā)更多的電遷移。這種鏈?zhǔn)椒磻?yīng)會在原子移走的位置導(dǎo)致裂隙（開路）或在原子重定位的地方導(dǎo)致短路（樹突）。為數(shù)不多的幾層水分子足以引發(fā)金屬的離子化過程，觸發(fā)電遷移。這一現(xiàn)象會隨著溫度升高明顯嚴(yán)重化。

　　像鐵生銹這樣的腐蝕現(xiàn)象涉及濕氣和有害氣體。半導(dǎo)體材料封閉在其保護(hù)性封裝中。這種封裝一般對濕氣有高吸收性，但制作所用的材料不會輕易地產(chǎn)生腐蝕性離子溶液。這種腐蝕大多數(shù)情況下會給引線框和封裝接線造成不利影響。最重要的有害材料是硅鈍化層中所含的磷，以及半導(dǎo)體制造工藝或封裝工藝所殘留的部分污染物。在運(yùn)輸、焊接和裝配過程中接觸人體皮膚和其他化學(xué)品是導(dǎo)致污染的有害原子的其他可能來源。

　　當(dāng)異質(zhì)材料連接在一起時(shí)，較便宜的材料相對于較貴的材料容易發(fā)生腐蝕（電化腐蝕）。這類型的腐蝕是隨時(shí)間推移性能降低的又一個(gè)原因。

　　在超過結(jié)溫溫度的情況下，無法保證器件的使用壽命，可能會大幅度縮短。如果溫度持續(xù)增長，該器件可能會立即失效。

　　器件的性能也取決于速度。器件在較高溫度下速度會下降，因此它們的最大時(shí)鐘速率會降低。

　　之所以把 Spartan-6 XA（汽車級）FPGA 的最高溫度限定為 125℃ 是出于最低使用壽命要求（可靠性考慮）和有保證的時(shí)鐘頻率能力（性能要求）。其他原因包 RAM 單元漏電和因這種漏電造成的位錯(cuò)誤。

　　多種解決方案

　　為克服我們的油井?dāng)z像頭設(shè)計(jì)的各類難題，我們實(shí)施了多種解決方案。

　　其中最重要的決定之一是選擇大小合適的器件。越大型的器件的靜態(tài)功耗越大，但有利于器件的散熱，避免形成熱點(diǎn)。經(jīng)認(rèn)證用于汽車用途的器件即使在高溫下也具有較長的使用壽命，因此對于使用壽命要求不高的工業(yè)應(yīng)用而言，更是一款合適的解決方案。我們已經(jīng)評估了 XA（車用）系列的 LX25 和 LX45 器件免溫度周期過程中發(fā)生板層分離問題中的代碼并測量了器件殼體的總功耗和溫度。有時(shí)如果峰值溫度較低，提高器件平均溫度也可接受。我們還在加速老化測試中評估了使用壽命。

　　我們的下一個(gè)設(shè)計(jì)選擇是為器件使用設(shè)定限制。為減少器件耗散的熱量，我們盡可能地避免使用邏輯單元和存儲器。器件未使用得到部分會消耗靜態(tài)功耗，但不會消耗動態(tài)功耗。

　　我們還施加了時(shí)鐘門控。因?yàn)閯討B(tài)功耗取決于時(shí)鐘速率，我們可以使用時(shí)鐘門控抵消未被使用的模塊的動態(tài)功耗。如果時(shí)鐘樹未觸發(fā)，器件該部分的功耗就會降低。

　　我們還可以將我們使用的 I/O 數(shù)量保持在最低水平。這樣也可以降低 I/O 模塊的功耗。

　　因此，通過把部分 I/O 用作虛地，我們縮短了器件內(nèi)部電流的傳輸距離，從而降低了電源走線的焦耳效應(yīng)。虛地也有助于把熱量傳遞到地面。

　　因?yàn)槲覀儾幌胧褂盟械?I/O 和所有的邏輯單元，我們選擇把這個(gè)設(shè)計(jì)分布到兩個(gè) FPGA 上（圖 5）。這樣就可以讓熱量在兩個(gè)單獨(dú)的位置耗散。

　　我們還使用多個(gè)接地面。這一技巧有助于把熱量從溫度較高的地方向溫度較低的地方傳遞，并提供額外的熱容量。為開發(fā)板的可靠性起見，在設(shè)計(jì)熱平面時(shí)應(yīng)考慮避。

　　一個(gè)重要步驟是優(yōu)化我們的代碼以

　　降低時(shí)鐘速率。降低時(shí)鐘速率可以降低功耗，但也可以讓器件在更高的溫度下運(yùn)行。作為例子，我們評估了慢速并行設(shè)計(jì)和快速流水線化設(shè)計(jì)之間的權(quán)衡取舍。

　　為提升設(shè)計(jì)性能，我們確保在最終裝配前干燥各個(gè)組件并覆蓋一層能抵御濕氣的保護(hù)層。另在高溫下器件會老化得更快?？梢允褂卯a(chǎn)品認(rèn)證來衡量設(shè)計(jì)的器件實(shí)際使用壽命隨溫度變化情況。

　　我們也在生產(chǎn)中采用老化流程來預(yù)老化器件，移除那些老化速度看似比其他部件更快的部件（早期失效），從而只保留下最好的部件。

　　對我們的設(shè)計(jì)流程同樣重要的是使用雖然按規(guī)范其結(jié)溫不得超過 125℃。此外我們還努力做到了無需熱電冷卻也能在 125℃ 下正常運(yùn)行。

　　以恢復(fù)或至少檢測存儲器單元中或通信中的位錯(cuò)誤。如果狀態(tài)機(jī)以未使用的狀態(tài)結(jié)束，也可以恢復(fù)。

　　我們發(fā)現(xiàn)在開展我們的設(shè)計(jì)時(shí)使用賽靈思功耗估算器（XPE）是良好的開端。TVivado® Design Suite 為采用較新型的器件的設(shè)計(jì)提供功耗估算工具。不過測量真實(shí)器件上的功耗和比較不同版本的代碼經(jīng)證明是最理想、最準(zhǔn)確的做法。

　　非熱電冷卻

　　綜合運(yùn)用上述技巧，循環(huán)冗余檢查（CRC）和其他類型的錯(cuò)誤檢測和糾正措施。我們在設(shè)計(jì)里的各個(gè)位置使用這些技巧，我們得到了一款能夠工作在 125℃ 環(huán)境溫度下且具備 SDRAM 管理、通信總線和圖像處理能力的攝像頭

新聞中心

如何擴(kuò)展 FPGA 的工作溫度范圍

評論

相關(guān)推薦

技術(shù)專區(qū)