利用時鐘裕度技術(shù)早期故障預(yù)測
系統(tǒng)老化
系統(tǒng)老化這是一個老生常談的問題了,也是一個有趣的問題。世界上沒有完美的產(chǎn)品,硅芯片制造也一樣。硅芯片的封裝會對產(chǎn)品使用壽命產(chǎn)生很大影響,因為封裝技術(shù)密封性不好,硅芯片會暴露于外界環(huán)境。從硅芯片的角度來說,熱載流子注入的自然效應(yīng)與電子移動的細(xì)微效果會對系統(tǒng)產(chǎn)生影響。熱量會加速硅芯片的老化。老化作為一種靈敏度參數(shù)來說,則體現(xiàn)在總時序預(yù)算數(shù)據(jù)上。通過超頻與降頻對比,發(fā)現(xiàn)超頻對系統(tǒng)產(chǎn)生的壓力最大,這也是性能差分析的基本方法。
時鐘裕度的實施
上面談?wù)摿诉@么多關(guān)于時鐘裕度技術(shù)的話題,那么怎樣才能實施時鐘裕度技術(shù)呢?首先,我們要知道,最先進(jìn)的系統(tǒng)通常包括眾多時鐘源。在多數(shù)情況下,時鐘間存在相互依賴的關(guān)系,但有時也會存在獨立的時鐘?,F(xiàn)在,常見的時鐘源通常采用鎖相環(huán)技術(shù),確保噪聲最小化,這使得新一代鎖相環(huán)技術(shù)產(chǎn)生的時鐘源具有較小的抖動,同時在相位噪聲性能方面優(yōu)于固定的時鐘源。鎖相環(huán)通常作為帶可編程分壓器的時鐘合成器,可支持多種時鐘輸出的合成,而且相互依賴的不同時鐘之間可建立不同的“分頻比”。分頻比是PC時鐘領(lǐng)域的過時術(shù)語,但對任何相互依賴的時鐘問題來說仍然適用。
為了成功實現(xiàn)時鐘裕度功能,其必須內(nèi)置頻率調(diào)節(jié)的功能。變頻功能在實際上可能比最初設(shè)想的要更困難,因為我們必須全面了解鎖相環(huán)技術(shù)的性能,不僅要了解工作期間可以實現(xiàn)的目標(biāo)頻率,還要了解不同反饋編程條件下的相位噪聲與抖動性能。基于時域的抖動是我們需要了解的重要內(nèi)容,這樣才能確保不同頻率之間的一致性(不能突然斷開),否則系統(tǒng)的穩(wěn)定性分析就會出錯。如果發(fā)生了不連續(xù)的抖動情況,也不會出現(xiàn)太大麻煩,可以通過多個特定的輸出頻率開槽或所需的分頻比來解決。此外,應(yīng)當(dāng)確保開槽不要在頻率變化期間進(jìn)行,除非鎖相環(huán)的設(shè)置在CPU對任何形式的開槽和短脈沖不敏感的間隔中進(jìn)行。
確??倳r序預(yù)算正確的技巧就是,應(yīng)當(dāng)了解哪些頻率范圍表現(xiàn)較好,這樣就能小心地通過逐步逼近的辦法接近總時序預(yù)算目標(biāo),而每一步的變化量可能有差別。如果頻率變化較大,那么通常會導(dǎo)致總時序預(yù)算差別結(jié)果較小??倳r序預(yù)算邊界檢測要求最終肯定要突破系統(tǒng)的界限,然后重啟并略微后退一些,直至獲得滿意的一致性閾值為止。有許多沒有文件記載的“小竅門”可以完成此項工作。建立系統(tǒng)總時序預(yù)算的關(guān)鍵就是一致性與可重復(fù)性。
正如前面簡單談到的那樣,執(zhí)行時鐘裕度工作所發(fā)現(xiàn)的最重要信息就是在產(chǎn)品投入使用后估算出實際的產(chǎn)品使用壽命終結(jié)時間。本文分析的目的就是要通過時鐘裕度來計算產(chǎn)品的標(biāo)稱性能與總時序預(yù)算之間的差異,以備后續(xù)之需。在幾周、幾個月乃至幾年的時間里,投入實際使用的產(chǎn)品運行相同的回歸進(jìn)程,重復(fù)計算性能差異。我認(rèn)為,能夠體現(xiàn)產(chǎn)品使用壽命結(jié)束的情況就是在性能差為零或為負(fù)值。這并不是說系統(tǒng)出現(xiàn)故障,而只是說沒有性能差了,說明產(chǎn)品已經(jīng)到了使用壽命的終點。無論采用何種產(chǎn)品支持方式,如果性能差為零,則說明產(chǎn)品的使用壽命已經(jīng)結(jié)束了,這一信息對那些需要全天候持續(xù)工作的系統(tǒng)來說是至關(guān)重要的。如圖1所示,根據(jù)歷史性能差信息預(yù)測出了性能差為零的時間。通過簡單的線性分析或非線性曲線分析,可以估計得出產(chǎn)品使用壽命結(jié)束的時間。
圖 1:系統(tǒng)使用壽命估算分析圖。
評論