基于DSP的高性能通用并行彈載計算機設(shè)計與實現(xiàn)

作者：時間：2009-07-14 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

首先考慮共享總線結(jié)構(gòu)。設(shè)

分別是并行系統(tǒng)上第i個處理器的有用處理時間和額外開銷時間。設(shè)每個處理器上子任務(wù)的運算量和通信量之比為r，即平均r次運算中有一個數(shù)據(jù)需要交換。總線被p個處理器輪流訪問，tio。是處理器完成一次總線存取所需的相對時間，等效為處理器運算能力和總線訪問能力之比。一般情況下，總的處理時間和額外開銷時間如下：

本文引用地址：http://www.butianyuan.cn/article/152421.htm

假設(shè)任務(wù)均勻分成p部分，就有：Te=pt。在最壞情況下，p個處理器總是同時訪問總線，考慮最后得到總線訪問權(quán)的處理器：

Tp是每個處理器上并行算法運行時間，在最壞情況下，Tp=Te+To。設(shè)問題規(guī)模W為最佳串行算法完成的計算量，即W=Te，加速度比：

顯而易見，共享總線系統(tǒng)的并行效率隨著處理器數(shù)目p的增大而下降。
而在分布式并行系統(tǒng)中，理想情況下任一時刻都可有兩個處理器通過其通信口相互交換數(shù)據(jù)，設(shè)一個通信口傳送一個數(shù)據(jù)的相對時間為tcomm，等效為處理器運算能力和通信口傳輸能力之比。同時，假設(shè)每次交換還需對本地存儲器訪問。這樣就有通信開銷：

和處理規(guī)模p成線性關(guān)系，并行效率與p無關(guān)。
以上討論的是假設(shè)任意兩個處理器之間可以直接進行數(shù)據(jù)交換，而在實際情況下，尤其是處理器數(shù)目p多于處理器的通信口數(shù)量時，兩個非直接相連的處理器之間的數(shù)據(jù)交換所需開銷與其經(jīng)過的路徑成正比關(guān)系。但這并不影響以上討論的公式。因為在規(guī)則網(wǎng)絡(luò)拓撲結(jié)構(gòu)中最大或平均路徑是一個定值n，那么這時，分布式并行系統(tǒng)的加速比公式為：

可見，在這種情況下分布式并行系統(tǒng)同樣能獲得線性加速比。由以上理論分析可知，共享總線并行結(jié)構(gòu)適合共享存儲編程模型，進行細粒度的并行處理，但其擴展性能較差，處理器的數(shù)目有限，單機處理性能有限；分布式并行結(jié)構(gòu)采用消息傳遞的機制，適合進行粗粒度的并行處理，便于大規(guī)模的系統(tǒng)擴展，提供強大的整體性能。

2 彈載計算機的設(shè)計實現(xiàn)
由于彈上信號處理算法的復(fù)雜性，信號處理系統(tǒng)具有復(fù)雜多樣的并行處理模式，如基于空間的數(shù)據(jù)并行處理、基于時間的流水并行處理等。另外，彈上計算機系統(tǒng)具有多種類型的數(shù)據(jù)流，如原始數(shù)據(jù)流(A／D采集之后的數(shù)據(jù)流)、中間數(shù)據(jù)流(各處理節(jié)點之間傳遞的數(shù)據(jù)流)、定時同步信號以及控制數(shù)據(jù)流等。這些不同的數(shù)據(jù)流的傳輸帶寬不同，因此系統(tǒng)中要有與這些不同數(shù)據(jù)流相匹配的互聯(lián)網(wǎng)絡(luò)。
高性能通用并行彈載計算機是構(gòu)建信號處理系統(tǒng)的基礎(chǔ)。它除了選用高性能的處理器外，為了具有通用性，還要具有標準化、模塊化、可擴展、可重構(gòu)的特點，以便構(gòu)建各類控制和信號處理系統(tǒng)。同時為了適應(yīng)控制和信號處理系統(tǒng)復(fù)雜并行處理模式和多種數(shù)據(jù)流的特點，它要具有混合的并行模式和多層次的互聯(lián)網(wǎng)絡(luò)。基于這些要求和上文中對并行處理結(jié)構(gòu)模型的理論分析，筆者選用當前業(yè)界最高性能的浮點DSP芯片TS201和大規(guī)模FPGA，設(shè)計了一個標準化、模塊化、可擴展、可重構(gòu)、混合并行模式、多層次互聯(lián)的高性能通用并行彈載計算機。圖2是其結(jié)構(gòu)框圖。

新聞中心

基于DSP的高性能通用并行彈載計算機設(shè)計與實現(xiàn)

評論

相關(guān)推薦

技術(shù)專區(qū)