邊緣視覺 AI 的理想平臺
特性比較
本文引用地址:http://butianyuan.cn/article/202106/426416.htm表 1 是 Kria K26 SOM 與英偉達 Jetson Nano 和英偉達 Jetson TX2 的特性比較。
表1 K26 SOM與英偉達 Jetson 特性比較
編號 | 特性 | 賽靈思 K26 SOM | 英偉達 Jetson Nano(1) | 英偉達 Jetson TX2(1) |
1 | 應用處理器 | 四核 Arm? Cortex?-A53 MPCore?,最高主頻 1.5GHz |
四核 Arm Cortex-A57 MPCore 處理器 | 四核英偉達 Denver 2 64 位 CPU 和四核 Arm Cortex-A57 MPCore處理器 |
實時處理器 | 四核 Arm Cortex-R5F MPCore,最高主頻 600MHz | |||
2 | GPU | Mali?-400 Mp2,最高主頻 667MHz (主要用于圖形渲染) |
128 核英偉達 Maxwell GPU |
256 核英偉達 Pascal GPU |
3 | 機器學習吞吐量 | 1.36TOPS(2) | 472GFLOP(FP16) | 1.33TFLOP (FP16) 面向 TX2i 為 1.26TFLOP |
4 |
攝像頭接口 | MIPI: 多達 44 個 DPHY2.0 通道,最多支持 11 個攝像頭 每接口最大帶寬10Gb/s 每接口最多 16 個虛擬通道 |
12 個 DPHY1.1 x 4 通道,最多支持 4 個攝像頭,每接口最大帶寬 6Gb/s |
12 個 DPHY1.1 通道,最多支持 6 個攝像頭,每攝像頭最大帶寬 6Gb/s |
SLVS、LVDS: 11 個 x4 SLVS 或 LVDS 攝像頭接口 |
NA |
NA | ||
SLVS-EC: 4 個通道,每通道 5Gb/s | NA | NA | ||
5 |
顯示接口 |
DP1.2 x2 通道 | 2x HDMI 2.0、 DP 1.2、 eDP 1.2、 2x MIPI DSI x2通道(1.5Gb/s/通道) | 2x HDMI 2.0、DP 1.2、eDP 1.2、2x MIPI DSI |
附加 HDMI 2.0 (GT)、 配備軟 IP 的 DisplayPort 1.4 (GT)、 配備軟 IP 的 MIPI DSI x4 通道(2.5Gb/s/通道) |
NA |
NA | ||
6 |
視頻編碼H.264/H.265 |
最多 32 個并發(fā)流、 最高分辨率 4K @60FPS 色彩格式:422 8/10 bpc和 420 8/10bpc |
最多 9 個流;最高分辨率 4K @30 FPS 420 8bpc |
最多 8 個 H.265 流,14 個 H.264 流,最高分辨率 4K @60FPS 420 8bpc |
7 |
視頻解碼 H.264/H.265 |
最多 32 個并發(fā)流, 最高分辨率 4K @60FPS 色彩格式:422 8/10bpc和 420 8/10bpc | 最多 9 個流;最高分辨率 4K @60 FPS 420 8bpc |
最多 32 個 H.265 流,16 個 H.264 流,最高分辨率 4K @60FPS 420 8bpc |
表1 K26 SOM與英偉達 Jetson 特性比較(續(xù))
編號 | 特性 | 賽靈思 K26 SOM | 英偉達 Jetson Nano(1) | 英偉達 Jetson TX2(1) |
8 |
無線 |
GTR M.2/SATA |
載頻上的 M.2 Key-E 站點 | 802.11a/b/g/n/ac 2×2 867Mb/s | 模塊上的 Bluetooth 4.1 BCM4354 |
9 |
以太網(wǎng) | 4x 10/100/1000 Base-T 以太網(wǎng) HP I/O 內(nèi)配備軟 IP 的附加以太網(wǎng)端口 |
10/100/1000 Base-T 以太網(wǎng) |
10/100/1000 Base-T 以太網(wǎng) |
10 | USB | 2x USB3.0、2x USB2.0 | 4x USB 3.0 + Micro-USB 2.0 | USB 3.0 + USB 2.0 |
11 |
PCIe? | PCIe Gen2 x 4 在 GT 上配備軟 IP 的PCIe Gen3 x4 |
PCIe Gen2 x4 通道 |
PCIe Gen2 x5 通道 |
12 |
高速 I/O (GT) 提供附加接口支持 |
可編程邏輯中的 4x GTH 收發(fā)器可通過配置,支持多種類型的高速協(xié)議,如 SLVS - EC、PCIe Gen 3、HDMI、 10GE等等……。 |
NA |
NA |
13 |
I/O 靈活性 |
69 3.3V I/O、116 1.8V I/O 允許用戶在可編程邏輯內(nèi)創(chuàng)建高度靈活且可配置的 I/O 接口 |
NA |
NA |
14 |
可編程邏輯 |
25.6 萬個系統(tǒng)邏輯單元、1248 個 DSP、26.6Mb 片上 存儲器,便于用戶為視覺和ML 功能實施定制加速器 |
NA |
NA |
15 | DRAM | 4GB 64 位 DDR4 | 4GB 64 位 DDR4 | 8GB 128 位 LPDDR4? |
16 | eMMC | 16GB | 16GB | 32GB |
17 | 閃存 | 512MB QSPI | NA | NA |
18 | 插槽載卡接口 | 兩個 240 針連接器 | 260 針邊緣連接器 | 400 針板對板連接器 |
說明:
1.來源:https://developer.nvidia.com/embedded/jetson-modules
2.深度學習處理器的性能基于333MHz 主頻下的賽靈思 DPU 配置 B4096,其實現(xiàn)在可編程邏輯內(nèi)。
K26 SOM 基于 Zynq UltraScale+ MPSoC 架構。它內(nèi)置一個 64 位的四核 Arm? Cortex?-A53 應用處理器組,并配套一個 32 位的雙核 Arm Cortex-R5F 實時處理器和一個 Arm Mali?-400MP2 3D 圖形處理器。SOM 上還包括 4GB 的 64 位 DDR4 存儲器和 QSPI 與 eMMC 存儲器。采用 Zynq UltraScale+ 架構內(nèi)置的硬件可信根實現(xiàn)的固有的安全啟動功能,通過外部 TPM2.0 擴展用于測量啟動并遵循 IEC 62443 規(guī)范。
該 SOM 提供了 25.6 萬個系統(tǒng)邏輯單元、1248 個 DSP、26.6Mb 的片上內(nèi)存。它為用戶實現(xiàn)應用專用設計并以最低功耗獲得最佳性能提供了一個靈活的平臺。以 B4096 (1.4TOP) 為性能上限,用戶能夠?qū)崿F(xiàn)多種 DPU 變體,用于滿足機器學習需求,以及用于視覺功能和可編程邏輯中的 ML 預處理和后處理的額外硬件加速器。此外,該 SOM 還為 H.264/H.265 提供了內(nèi)置的視頻編解碼器。該編解碼器可支持最多 32 個編碼、解碼并發(fā)流,只要視頻總像素在 60FPS 下不超過 3840x2160P。該編解碼器支持高畫質(zhì)4:2:2 8/10bpc和 4:2:0 8/10bpc。
K26 SOM 的主要優(yōu)勢之一是它擁有無與倫比的 I/O 靈活性。它擁有大量的 1.8V、3.3V 單端與差分 I/O,四個 6Gb/s 收發(fā)器和四個 12.5Gb/s 收發(fā)器。這便于用戶讓每個 SOM 支持更多的圖像傳感器以及多種傳感器接口類型,其中包括 ASSP 和 GPU通常不支持的 MIPI、LVDS、SLVS 和SLVS-EC。此外,用戶還能在可編程邏輯中實現(xiàn) DisplayPort、HDMI、PCIe?、USB2.0/3.0 等標準,包括用戶定義的標準。
K26 SOM 的尺寸是 77mm x 60mm x 11mm。根據(jù) SOM 的未來發(fā)展規(guī)劃,SOM 的尺寸將大幅縮小,能夠為
應用提供支持。商用級 K26 SOM 支持的工作溫度范圍是結溫 0°C 至 +85°C,以內(nèi)置溫度傳感器向應用處理器報告的溫度為準。SOM 上的全部其他器件均以該測量溫度為準繩。類似地,工業(yè)級 K26 SOM 支持的工作溫度范圍是 –40°C 至 +100°C。
在特性之外,還應該了解和分析深度學習網(wǎng)絡如何在每個器件上運行。這將在下文中進行詳細研討,其中包括在復雜性相似的網(wǎng)絡上對類似器件進行比較。
評論