閃存出錯(cuò):軟件錯(cuò)誤還是電源電壓故障(上)?
答案:兩個(gè)都是!閃存通常用于存儲(chǔ)嵌入式系統(tǒng)的固件。有時(shí)候,在某些系統(tǒng)的閃存中存儲(chǔ)的固件意外出錯(cuò),導(dǎo)致系統(tǒng)無(wú)法在上電后正常啟動(dòng)。閃存出錯(cuò)通常與軟件錯(cuò)誤有關(guān)。然而,工程師們也普遍認(rèn)同電源循環(huán)測(cè)試或者裕度測(cè)試增加了閃存出錯(cuò)的可能性。當(dāng)板上使用復(fù)雜的ASIC或SoC越多,閃存出錯(cuò)的問(wèn)題就會(huì)更嚴(yán)重。本文探討了除了軟件錯(cuò)誤外,其他引起閃存出錯(cuò)的情況和原因并提出解決方法,最大限度地減少損壞。
本文引用地址:http://butianyuan.cn/article/142408.htm為什么閃存內(nèi)容會(huì)出錯(cuò)?
圖1是一個(gè)典型的電路板的CPU電路。當(dāng)電源接通時(shí),復(fù)位發(fā)生器首先激活CPU的復(fù)位信號(hào)。然后等待,直到CPU、閃存和DDR存儲(chǔ)器都達(dá)到其額定的工作電壓,再等待一個(gè)額外的時(shí)間周期(約150ms),然后關(guān)閉CPU復(fù)位信號(hào)。當(dāng)復(fù)位信號(hào)關(guān)閉時(shí),CPU開(kāi)始執(zhí)行閃存中的初始化程序,將存儲(chǔ)在閃存中的固件內(nèi)容載入DDR存儲(chǔ)器,并執(zhí)行DDR存儲(chǔ)器中的程序?! ?/p>
固件載入閃存的步驟如下:
● 固件通過(guò)通信接口載入DDR存儲(chǔ)器;
● 跳轉(zhuǎn)到閃存更新程序,使用新的固件對(duì)閃存重新編程;
● 處理器重新上電,新的固件生效。
如果代碼執(zhí)行意外跳轉(zhuǎn)到閃存更新程序,閃存中的內(nèi)容可能會(huì)被損壞。當(dāng)電路板重新上電,錯(cuò)誤版本的代碼被加載到DDR,而電路板并不能如預(yù)期般工作。
代碼執(zhí)行意外跳轉(zhuǎn)到這個(gè)閃存更新程序,可能是由于軟件錯(cuò)誤或者電源電壓故障(例如在電源關(guān)斷時(shí))。使用正常的軟件調(diào)試方法,可以檢測(cè)到軟件錯(cuò)誤。然而,故障電源電壓是很難檢測(cè)的,因?yàn)殡娫措妷汗收想S時(shí)都可能發(fā)生。
為什么電源電壓故障會(huì)導(dǎo)致程序跳轉(zhuǎn)到閃存更新程序?
所有IC都有最低和最高工作電壓規(guī)范。如果供電電壓超過(guò)了最高電壓,該器件就會(huì)被損壞,如果供電電壓低于最低的電壓值,則該器件不能正常工作。例如,在圖1中CPU內(nèi)核的額定電壓是1.2V±5%。如果電壓下降到低于這個(gè)值,CPU內(nèi)部的指令執(zhí)行流水線就不能可靠地傳輸指令和數(shù)據(jù),并且(根據(jù)CPU的進(jìn)程和工作溫度)指令可能無(wú)法正確執(zhí)行。例如,“Move”指令可能被解釋為“Pop”的指令,然后代碼執(zhí)行隨機(jī)跳轉(zhuǎn)到存儲(chǔ)器中的某個(gè)位置(由堆棧中的內(nèi)容的決定)。根據(jù)該存儲(chǔ)器位置的內(nèi)容和執(zhí)行中的錯(cuò)誤,處理器可能掛起或跳轉(zhuǎn)到閃存更新程序,破壞閃存并覆蓋閃存中的內(nèi)容。
linux操作系統(tǒng)文章專(zhuān)題:linux操作系統(tǒng)詳解(linux不再難懂)
評(píng)論