ARM處理器關于非對齊存儲的訪問規(guī)則
ARM 編譯程序通常將全局變量對齊到自然尺寸邊界上,以便通過使用 LDR和 STR 指令有效地存取這些變量。這種內(nèi)存訪問方式與多數(shù) CISC (Complex Instruction Set Computing)體系結(jié)構(gòu)不同,在CISC體系結(jié)構(gòu)下,指令直接存取未對齊的數(shù)據(jù)。因而,當需要將代碼從CISC 體系結(jié)構(gòu)向 ARM 處理器移植時,內(nèi)存訪問的地址對齊問題必須予以注意。在RISC體系結(jié)構(gòu)下,存取未對齊數(shù)據(jù)無論在代碼尺寸或是程序執(zhí)行效率上,都將付出非常大的代價。
本文將從以下幾個方面討論在ARM體系結(jié)構(gòu)下的程序設計問題。
未對齊的數(shù)據(jù)指針
C和C++編程標準規(guī)定,指向某一數(shù)據(jù)類型的指針,必須和該類型的數(shù)據(jù)地址對齊方式一致,所以ARM 編譯器期望程序中的 C 指針指向存儲器中字對齊地址,因為這可使編譯器生成更高效的代碼。
比如,如果定義一個指向 int 數(shù)據(jù)類型的指針,用該指針讀取一個字,ARM 編譯器將使用LDR 指令來完成此操作。如果讀取的地址為四的倍數(shù)(即在一個字的邊界)即能正確讀取。但是,如果該地址不是四的倍數(shù),那么,一條 LDR 指令返回一個循環(huán)移位結(jié)果,而不是執(zhí)行真正的未對齊字載入。循環(huán)移位結(jié)果取決于該地址向?qū)τ谧值倪吔绲钠屏亢拖到y(tǒng)所使用的端序(Endianness)。例如,如果代碼要求從指針指向的地址 0x8006 載入數(shù)據(jù),即要載入 0x8006、0x8007、0x8008 和 0x8009 四字節(jié)的內(nèi)容。但是,在 ARM 處理器上,這個存取操作載入了0x8004、0x8005、0x8006 和 0x8007 字節(jié)的內(nèi)容。這就是在未對齊的地址上使用指針存取所得到的循環(huán)移位結(jié)果。
因而,如果想將指針定義到一個指定地址(即該地址為非自然邊界對齊),那么在定義該指針時,必須使用 __packed 限定符來定義指針: 例如,
__packed int *pi; // 指針指向一個非字對其內(nèi)存地址
使用了_packed限定符限定之后,ARM 編譯器將產(chǎn)生字節(jié)存取命令(LDRB或STRB指令)來存取內(nèi)存,這樣就不必考慮指針對齊問題。所生成的代碼是字節(jié)存取的一個序列,或者取決于編譯選項、跟變量對齊相關的移位和屏蔽。但這會導致系統(tǒng)性能和代碼密度的損失。
值得注意的是,不能使用 __packed 限定的指針來存取存儲器映射的外圍寄存器,因為 ARM 編譯程序可使用多個存儲器存取來獲取數(shù)據(jù)。因而,可能對實際存取地址附近的位置進行存取,而這些附近的位置可能對應于其它外部寄存器。當使用了位字段(Bitfield)時, ARM 程序?qū)⒃L問整個結(jié)構(gòu)體,而非指定字段。
在ARM中,通常希望字單元的地址是字對齊的(地址的低兩位為0b00),半字單元的地址是半字對齊的(地址的最低為0b0).在存儲訪問操作中,如果存儲單元的地址沒有遵守上述的對齊規(guī)則,則稱為非對齊(unaligned)的存儲訪問操作.
轉(zhuǎn)載自:ARM開發(fā)板|嵌入式開發(fā)http://armdmc.woku.com/article/5018028.html
———————————————— END ————————————————
自修改代碼指的是代碼在執(zhí)行過程種可能修改自身.對于支持指令預取的ARM系統(tǒng),自修改代碼可能帶來潛在的問題.當指令被預取后,在該指令被執(zhí)行前,如果有數(shù)據(jù)訪問指令修改了位于主存種的該指令,這是被預取的指令和主存種對應的指令不同,從而可能使執(zhí)行的結(jié)果發(fā)生錯誤.
評論