曠視即將開源Brain++的深度學習框架
近日,曠視科技透漏其自主研發(fā)并全員使用的AI 生產(chǎn)力套件Brain++的核心深度學習框架--MegEngine,即將于3月25日進行開源,發(fā)布會將于當日14:00在線舉辦。
2017年,AlphaGo與柯潔的圍棋大戰(zhàn)讓大眾嘆為觀止,而支撐AlphaGo運轉(zhuǎn)的底層技術(shù)框架就是谷歌的TensorFlow。
知名度或許沒有谷歌那么廣為人知,但其實曠視的國產(chǎn)深度學習框架MegEngine遠早于谷歌TensorFlow的時代,曠視早在2014年就開始研發(fā)其深度學習框架MegEngine,過去5年里,這套深度學習框架被曠視全員使用,支撐著整個曠視的科研及產(chǎn)品化。
同時在框架的基礎之上,曠視研究院還提出了“三位一體”概念,將數(shù)據(jù)和算力平臺融合,構(gòu)建了集“算法、數(shù)據(jù)和算力”于一體的 AI 生產(chǎn)力套件 Brain++,自動化、規(guī);⒓s化生產(chǎn)算法,在Brain++的驅(qū)動下成為了現(xiàn)實。
技術(shù)層面曠視的Brain++完全可以和谷歌的TensorFlow、臉譜的PyTorch相提并論。
Brain++
為了能夠快速的進行算法相關實驗,在實際的工業(yè)場景中落地,就需要一個具有高性能,可復用和能靈活迭代的AI算法平臺。
而打造一個滿足當前需求的AI算法平臺,需要從計算性能,平臺易用性,滿足真實業(yè)務場景需求等不同的方面進行考量。
人工智能發(fā)展初期階段,訓練一個 AI 模型,至少需要一兩個月,開發(fā)者甚至要通過手敲 C++ 來完成計算過程,而深度學習社區(qū)基本上被 TensorFlow 和 PyTorch 兩大框架壟斷。
算法生產(chǎn)就是對輸入數(shù)據(jù)進行分析和提煉,并輸出能預測問題答案模型的過程,如何擺脫繁瑣低效的算法開發(fā)流程,獲得批量生產(chǎn)算法的能力一直是曠視所思考的問題。
曠視聯(lián)合創(chuàng)始人唐文斌這樣介紹Brain++:“為了解決這個問題, 2014年我們開始研發(fā)Brain++,它是一套端到端的AI算法平臺,目標是讓研發(fā)人員獲得從數(shù)據(jù)到算法產(chǎn)業(yè)化的綜合技術(shù)能力,不用重復造輪子也可以推進AI快速落地。我們的Brain++還引入了AutoML技術(shù),可以讓算法來訓練算法,讓AI來創(chuàng)造AI!
MegEngine
曠視 Brain++的架構(gòu)分為三部分,其中即將開源的深度學習算法開發(fā)框架 MegEngine 是核心模塊,其次是提供算力調(diào)度支持的深度學習云計算平臺 MegCompute,以及用于提供數(shù)據(jù)服務和管理的數(shù)據(jù)管理平臺 MegData。
MegEngine可實現(xiàn)訓練、部署一體化,能夠支撐大規(guī)模視覺方向的算法研發(fā),具體又分為四個層,包括計算引擎、運行時管理、編譯和優(yōu)化以及編程和表示。
還引入了曠視獨家的AutoML技術(shù),只需訓練一次就能得到整個模型空間的刻畫,可以顯著降低人力成本并大幅提高開發(fā)效率。
MegEngine基于 C++開發(fā),使用了目前流行的計算圖方式,和其他框架不同,其使用的是異構(gòu)架構(gòu),方便使用框架進行分布式計算。
此外,MegEngine 內(nèi)部的計算以算子的形式進行,它支持多種算子節(jié)點和變量算子,包括常用的卷積、全連接、ReLU 和用戶可定制的算子,甚至可以計算二階梯度,從而進行更多底層和靈活的運算。
相比于開源的大部分深度學習框架,MegEngine 具有下列優(yōu)勢:
運算速度快:MegEngine 動態(tài)、靜態(tài)結(jié)合的內(nèi)存優(yōu)化機制,因此速度比 TensorFlow 更快;
內(nèi)存占用少:根據(jù)內(nèi)存使用狀況,MegEngine 充分優(yōu)化內(nèi)存,特別是亞線性內(nèi)存優(yōu)化,可以支持復雜的網(wǎng)絡結(jié)構(gòu),自動利用部分冗余計算縮減內(nèi)存占用,可達兩個數(shù)量級,從而支持更大規(guī)模的模型訓練;
支持多種硬件平臺和異構(gòu)計算:MegEngine 支持通用 CPU、GPU、FPGA 以及其他移動設備端硬件,可多卡多機進行訓練;
訓練部署一體化:整個框架既可用于訓練又同時支持推理,實現(xiàn)模型一次訓練,多設備部署,避免復雜的轉(zhuǎn)換過程造成的性能下降和精度損失。
曠視在 2017 年拿下 3 項 COCO 冠軍,2018年拿下 4 項 COCO 冠軍,以及19年發(fā)布的全新的通用物體檢測數(shù)據(jù)集 Objects365。這些成績之下,Brain++貢獻了不小的功勞。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領域,聯(lián)通、海爾、美的等紛紛入局