新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 利用高效的編程技術(shù)發(fā)揮多內(nèi)核架構(gòu)優(yōu)勢(shì)

利用高效的編程技術(shù)發(fā)揮多內(nèi)核架構(gòu)優(yōu)勢(shì)

作者: 時(shí)間:2014-01-07 來(lái)源:網(wǎng)絡(luò) 收藏
在整個(gè)嵌入式領(lǐng)域,“更多內(nèi)核”已經(jīng)成為設(shè)計(jì)趨勢(shì),一些硬件架構(gòu)可以提供數(shù)十個(gè)內(nèi)核,有些架構(gòu)中的內(nèi)核甚至多達(dá)上千個(gè)。然而,多內(nèi)核設(shè)計(jì)在軟件方面仍存在諸多挑戰(zhàn),在不同架構(gòu)間進(jìn)行應(yīng)用程序的移植并不容易。

在低端嵌入式領(lǐng)域,單內(nèi)核解決方案仍然存在。通過(guò)采用速度更快或帶寬更寬的處理器仍有可能提升系統(tǒng)的功能和性能曲線。在高端領(lǐng)域,多內(nèi)核是必然的發(fā)展方向。這正是雙精度浮點(diǎn)算法經(jīng)常出現(xiàn)并在超級(jí)計(jì)算機(jī)中長(zhǎng)盛不衰的原因。事實(shí)上,臺(tái)式機(jī)和機(jī)架安裝系統(tǒng)(比如Nvidia的產(chǎn)品)正在將這種處理能力普及化。

在討論軟件和時(shí)經(jīng)常提及的另一個(gè)問(wèn)題是。并不是所有多內(nèi)核平臺(tái)都支持,但確實(shí)能帶來(lái)更好的機(jī)會(huì)。雖然虛擬化使得硬件設(shè)計(jì)面臨更多的挑戰(zhàn),但它通常能簡(jiǎn)化軟件和應(yīng)用管理。

服務(wù)器

Xeon Nehalem-EX是Intel公司提供的頂級(jí)8內(nèi)核對(duì)稱多處理()平臺(tái)。像8芯片、64內(nèi)核系統(tǒng)這樣的多芯片解決方案,通常采用高速Q(mào)uickPath點(diǎn)到點(diǎn)互連技術(shù)將處理器和外設(shè)控制器鏈接在一起(圖1)。使用過(guò)帶HyperTransport鏈路的AMD Opteron處理器的工程師,對(duì)這種架構(gòu)非常熟悉。在這兩種情況下,最簡(jiǎn)單的配置是單個(gè)處理器通過(guò)單條高速鏈路鏈接到單個(gè)外設(shè)控制器。
利用高效的編程技術(shù)發(fā)揮多內(nèi)核架構(gòu)優(yōu)勢(shì)

除了提供分布式內(nèi)存子系統(tǒng)外,Intel和AMD還實(shí)現(xiàn)了連貫緩沖非統(tǒng)一內(nèi)存尋址(ccNUMA)技術(shù)。每個(gè)處理器芯片都有自己的內(nèi)存控制器以及一級(jí)、二級(jí)和三級(jí)緩存。任何芯片都可以使用高速鏈路訪問(wèn)其它任何芯片中的內(nèi)存。當(dāng)然,離請(qǐng)求者越遠(yuǎn)的數(shù)據(jù)訪問(wèn)時(shí)間越長(zhǎng)。這些高速鏈路也被用于消費(fèi)設(shè)備,但只有到I/O中心的單條鏈路是必需的。換句話說(shuō),在共享內(nèi)存訪問(wèn)時(shí)服務(wù)器將在處理器芯片間產(chǎn)生顯著的流量。芯片至芯片流量和緩存管理是高效操作的關(guān)鍵。

HT Assist是AMD最新推出的Istanbul Opteron處理器的一個(gè)重要功能,它通過(guò)優(yōu)化內(nèi)存請(qǐng)求和響應(yīng)過(guò)程來(lái)盡量減少相關(guān)事務(wù)處理的數(shù)量,進(jìn)而釋放出大量帶寬用于處理其它業(yè)務(wù)(圖2)。HT Assist實(shí)際上會(huì)跟蹤數(shù)據(jù)在內(nèi)核和緩存間的移動(dòng),允許請(qǐng)求得到具有所需數(shù)據(jù)的最近內(nèi)核的服務(wù)。
利用高效的編程技術(shù)發(fā)揮多內(nèi)核架構(gòu)優(yōu)勢(shì)

最壞的情況是擁有片外存儲(chǔ)器空間的芯片必須從片外存儲(chǔ)器訪問(wèn)數(shù)據(jù);最好的情況是發(fā)現(xiàn)數(shù)據(jù)正好位于運(yùn)行著需要這個(gè)數(shù)據(jù)的線程的芯片緩存中;中間情況是內(nèi)核從相鄰芯片的緩存中獲取數(shù)據(jù)。使用虛擬化和緩存技術(shù)后系統(tǒng)將變得更加復(fù)雜,并導(dǎo)致數(shù)據(jù)延時(shí)更加難以確定。這在確定性嵌入式應(yīng)用中可能是個(gè)問(wèn)題,但在大多數(shù)服務(wù)器應(yīng)用中問(wèn)題并不十分明顯,因?yàn)檫@種情況下的速度比精細(xì)的確定性更加重要。

編程人員現(xiàn)在都在使用這些平臺(tái),因?yàn)樗鼈兡艽蟠蠛?jiǎn)化編程任務(wù)。同樣,應(yīng)用程序可以使用越來(lái)越多的內(nèi)核,前提是應(yīng)用程序可高效地利用充足的線程。高效使用多內(nèi)核系統(tǒng)并不像表面看起來(lái)那么容易。緩存大小和應(yīng)用程序工作數(shù)據(jù)集中的參考位置會(huì)影響特定算法的運(yùn)行效果。

AMP應(yīng)用處理器

對(duì)稱處理()架構(gòu)對(duì)許多嵌入式應(yīng)用來(lái)說(shuō)非常有用,但非對(duì)稱多處理(AMP)也有它的用武之地。AMP配置在很多地方都可以看到,從TI的OMAP(開(kāi)放多媒體應(yīng)用平臺(tái))到飛思卡爾的P4080 QorIQ都有AMP的身影(圖3)。
利用高效的編程技術(shù)發(fā)揮多內(nèi)核架構(gòu)優(yōu)勢(shì)


上一頁(yè) 1 2 3 下一頁(yè)

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉