基于FPGA的嵌入式AI解決方案——EdgeBoard硬件設計與解析
EdgeBoard是基于FPGA打造的嵌入式AI解決方案,能夠提供強大的算力,并支持定制化模型,適配各種不同的場景,并大幅提高設備的AI推理能deeplab力,具有高性能、高通用、易集成等特點。
EdgeBoard系列計算卡符合工業(yè)設計標準、滿足-40℃~85℃的溫度范圍,接口齊全,可廣泛適配如安防監(jiān)控、工業(yè)質(zhì)檢、醫(yī)療診斷、科研教學、智能零售等各種場景。
EdgeBoard產(chǎn)品分為三個系列,稱之為“三兄弟”,能夠滿足客戶不同的需求,既有滿足高性能計算的方案,也有高性價比的處理方案。本文將從“三兄弟”的特點及整體硬件框架兩個方面來介紹EdgeBoard。
1.為什么EdgeBoard使用FPGA
理想的異構計算平臺應該具備三種基本能力:首先專有的硬件加速能力,提高算法的性能;其次高效靈活適配算法的能力,適配不斷演進的算法;最后豐富的外圍接口,適合不同的應用場景。
CPU作為通用處理器,以邏輯計算作為出發(fā)點,更偏重控制流數(shù)據(jù),適用于控制和調(diào)度類任務,不易于進行外圍電路的擴展。GPU具有并行計算的特點,廣泛應用在訓練階段,但由于功耗大、成本高等原因,少有部署在端上的產(chǎn)品,另外高延遲及缺少對外圍電路的支持也不利于部署到端上的產(chǎn)品中。ASIC作為一種專用集成電路芯片,具有體積小、功耗低、計算性能高等特點,但AISC芯片研發(fā)時間長,資金投入大,由于芯片內(nèi)部結構相對固定,無法適配快速演進的AI算法,在應用場景沒有明確之前ASIC顯然不是最優(yōu)的選擇。
FPGA作為一種現(xiàn)場可編程門陣列,具有低功耗、低延遲、高性能等優(yōu)勢,其可編程的特性又可以靈活適配不同的算法,同時FPGA豐富的外圍接口可以滿足不同的應用需求,F(xiàn)PGA差異化的內(nèi)部邏輯資源可以提供不同的算力支持,這些優(yōu)勢使得FPGA被廣泛應用在AI推理加速上。
2.EdgeBoard計算卡介紹
2-1 概述
EdgeBoard是基于Xilinx Zynq UltraScale+ MPSoC系列芯片打造的計算卡,芯片內(nèi)部集成ARM處理器+GPU+FPGA的架構,既具有多核處理能力、也有視頻流硬解碼處理能力,還具有FPGA的可編程的特點。內(nèi)置Linux 4.14.0系統(tǒng)和深度學習預裝環(huán)境,與百度大腦模型定制平臺(AIStudio、EasyDL、EasyEdge)深度打通,實現(xiàn)模型的訓練、部署、推理等一站式服務。
EdgeBoard計算卡產(chǎn)品可以分為FZ9、FZ5、FZ3三個系列,是分別基于XCZU9EG、XAZU5EV、XAZU3EG研發(fā)而來,分別具有高性能,硬解碼,低成本等特點,針對不同需求和應用場景,有不同的市場定位和產(chǎn)品定位,滿足各類開發(fā)者多樣性的需求。
2-2 FZ9系列計算卡
EdgeBoard FZ9系列計算卡是基于XCZU9EG芯片的高性能計算卡,具有較高的性能和集成功能。ZU9芯片PS端具有四核Cortex-A53和雙核Cortex-R5 以及Mali-400MP2 GPU;PL端資源DSP Slices 2520,計算性能達3.6Tops,片上存儲BRAM高達32.1Mb。
FZ9計算卡產(chǎn)品采用核心板+擴展板的雙層設計方案,增加了對外接口的數(shù)量,其80*120mm的尺寸方便計算卡集成于到產(chǎn)品中,具備軟硬一體的解決方案(軟件+FPGA),支持多種視頻源(usb、mipi、bt1200、網(wǎng)絡攝像頭)的輸入,并具有強大的視頻預處理能力,視頻輸出DisplayPort接口兼容標準Linux視頻框架V4L2。高性能的視頻處理能力和標準化的視頻輸出接口可滿足機器學習、醫(yī)療診斷等行業(yè)需求。
EdgeBoard FZ9計算卡
2-3 FZ5系列計算卡
EdgeBoard FZ5系列計算卡是基于XAZU5EV芯片的計算卡,提供較高性能和功能集成,具有多路視頻流H264&H265標準的編解碼功能。ZU5芯片PS端同樣包含四核Cortex-A53 、雙核Cortex-R5、以及GPU Mali-400MP2;PL端資源DSP Slices 1248,計算性能達2.4Tops,片上存儲BRAM達5.1Mb,UltraRAM 18Mb。
FZ5計算卡產(chǎn)品延續(xù)了FZ9計算卡的產(chǎn)品形態(tài),采用核心板+擴展板雙層設計方案,具有多視頻輸入接口,VCU(Video Codec Unit)硬核解碼,對視頻的輸入處理采用流水線設計,實現(xiàn)高吞吐量和低時延,具有極佳的功耗性能比。產(chǎn)品可以廣泛應用于具有硬解碼需求的視頻圖像推理,滿足安防監(jiān)控、工業(yè)質(zhì)檢、自動駕駛等行業(yè)需求。
EdgeBoard FZ5計算卡
2-4 FZ3系列計算卡
EdgeBoard FZ3系列計算卡是基于XAZU3EG芯片的計算卡,處理器ZU3芯片內(nèi)置四核Cortex-A53和核心FPGA可編程邏輯模塊;PL端資源DSP Slices 360,實測計算性能達1.2Tops,片上存儲BRAM達7.6Mb。
FZ3計算卡產(chǎn)品具有高集成性的設計方案,板卡尺寸為80*70mm,具有usb3.0、bt1120、mipi、網(wǎng)絡等多視頻輸入接口,板載2GB 64bit位寬的 DDR4,整體功耗僅5W左右,極佳的功耗性能比。對于FZ3產(chǎn)品具有的高性能、低功耗、低成本、小體積的特點,產(chǎn)品可以廣泛應用于科研教學、智能零售、安防監(jiān)控等行業(yè)。
EdgeBoard FZ3計算卡
3.EdgeBoard框架及性能介紹
3-1 MPSoC系統(tǒng)框架
Zynq UltraScale+ MPSoC架構提供頻率高達1.5GHz的四核Cortex®-A53 高效 64位 ARMv8 應用處理器、具有雙核 ARM® Cortex®-R5 600MHz的實時低功耗協(xié)處理器,以及ARM® Mali™-400MP2 GPU達到667MHz,同時EV系列還包含 H.265/H.264 視頻編解碼器單元,可提供原生 UltraHD 壓縮及專用引擎,滿足動態(tài)電源管理與安全配置需求。Zynq UltraScale+ MPSoC平臺系統(tǒng)頂層框圖如下:
MPSoC平臺系統(tǒng)框架
3-2 EdgeBoard計算卡配置比較
基于MPSoC平臺系統(tǒng)頂層框圖,EdgeBoard計算卡的系統(tǒng)框架設計如下:
EdgeBoard計算卡系統(tǒng)框架
EdgeBoard計算卡在配置方面,擁有4GB 和2GB 的不同DDR4內(nèi)存配置版本,存儲支持8GB eMMC,256MB NOR Flash,8Kb EEPROM,具有多路視頻(usb、mipi、bt1200、網(wǎng)絡視頻)輸入接口,同時為滿足開發(fā)者調(diào)試便捷性,支持TF Card系統(tǒng)盤啟動。
EdgeBoard計算卡的整體配置比較:
3-3 常用模型在EdgeBoard上的性能數(shù)據(jù)
EdgeBoard軟核仍在持續(xù)升級,性能也將同步提升。不同版本的網(wǎng)絡模型對算力要求不同,針對具體項目應用需求,可進行定制優(yōu)化。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 一文看懂視覺語言動作模型(VLA)及其應用