在AI的海洋里,將往哪里航行?
2
護航計劃,與產(chǎn)業(yè)同行
百度創(chuàng)始人李彥宏多次提及AI產(chǎn)業(yè)化的重要性。
他表示,AI的發(fā)展的第二階段,是經(jīng)濟智能化階段,又具體分為上下兩個階段,在前半段,人工智能的發(fā)展主要圍繞通用能力的開發(fā)和作為一種資源的AI能力的平臺化;在后半段,人工智能開始全面的產(chǎn)業(yè)化,行業(yè)應(yīng)用與商業(yè)化全面普及。
百度集團副總裁吳甜也表示,人工智能在和產(chǎn)業(yè)的結(jié)合正在快速發(fā)展。從飛槳與企業(yè)合作伙伴的實踐中,值得關(guān)注的有幾個具體趨勢,分別是AI應(yīng)用場景更加多元化和分散化,更深入與企業(yè)的業(yè)務(wù)系統(tǒng)結(jié)合呈現(xiàn)專業(yè)化的特點;自然語言處理應(yīng)用課題大量增多,顯示出企業(yè)更深層次的智能化需求在增加;很多應(yīng)用已經(jīng)走過了最初階段,開始研究更為前沿和深入的問題。
然而,隨著人工智能技術(shù)逐漸成為各行業(yè)實施數(shù)字化、智能化轉(zhuǎn)型的核心動力,企業(yè)在面對具體應(yīng)用場景的定制化AI開發(fā)中,不僅需要從零起步,自行跑通數(shù)據(jù)處理、算法開發(fā)、模型訓(xùn)練、模型部署、服務(wù)集成等多個階段,更需要開發(fā)者具有豐富的AI實戰(zhàn)經(jīng)驗,一系列的難題擺在迫切期待AI轉(zhuǎn)型的企業(yè)面前,也使AI落地成為一個充滿復(fù)雜性和挑戰(zhàn)性的系統(tǒng)工程。
針對這一現(xiàn)狀,飛槳“大航!庇媱澲,就包括最新發(fā)布的護航計劃——面向產(chǎn)業(yè)智能化升級的“護航”。
因此, “護航計劃”的核心是,未來三年,飛槳將投入10億元資金,支持10萬家企業(yè)智能化升級,與產(chǎn)業(yè)界一起培育百萬AI人才。將匯聚生態(tài)資源去扶持一批在AI產(chǎn)業(yè)落地方面深耕的企業(yè),技術(shù)賦能,輸出更多百度的行業(yè)落地經(jīng)驗,也與業(yè)界探討更深入的難點問題解法,共研共創(chuàng)。
在護航計劃中,首席AI架構(gòu)師培養(yǎng)計劃(AICA)顯得分外搶眼。
AI架構(gòu)師在一個企業(yè)的AI實踐中應(yīng)該處于一個什么位置?
簡單來說,AI架構(gòu)師就是一個企業(yè)里AI應(yīng)用的核心發(fā)動機。
按照吳甜的觀察,AI的產(chǎn)業(yè)化,分為AI先行者探路階段、AI工作坊應(yīng)用階段、AI工業(yè)大生產(chǎn)階段。目前,大部分企業(yè)處于第一階段,有少數(shù)進入了第二階段,也就是“工作坊階段”。
換言之,AI架構(gòu)師是支撐企業(yè)AI應(yīng)用三級跳的核心構(gòu)建者,這是百度著重打造這一體系培養(yǎng)的關(guān)鍵,這些架構(gòu)師將推動千行百業(yè)與AI大生態(tài)的對接。
從涉及的企業(yè)來看,由百度聯(lián)合深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室共同打造的首席AI架構(gòu)師培養(yǎng)計劃(AICA)在培養(yǎng)AI架構(gòu)師上持非常開放的態(tài)度,面對的企業(yè)既有網(wǎng)易云音樂、萬方數(shù)據(jù)、人民網(wǎng)、汽車之家這樣的典型互聯(lián)網(wǎng)企業(yè),也有中國聯(lián)通、浙江省能源集團、西南電子電信技術(shù)研究所、中海石油氣電集團這樣的國企,還有順豐、OPPO這樣出色的民企。
而培養(yǎng)課題涉及領(lǐng)域也更加廣泛,包括AI輔診系統(tǒng)、零售商品檢測識別、電力輸電線路相關(guān)模型研究和游戲內(nèi)聊天垃圾廣告識別等,涵蓋醫(yī)療、工業(yè)、電力、娛樂等多個領(lǐng)域。
“通過AICA的學(xué)習(xí)和實踐,自己對于AI技術(shù)和開發(fā)應(yīng)用流程整體把握能力,對實際業(yè)務(wù)進行技術(shù)抽象的能力,設(shè)計并實現(xiàn)高效AI落地方案能力均有了大幅度提升”,來自浙江省能源集團的朱凌風(fēng)表示。
無疑,這顯示AI技術(shù)正在從“垂直”走向“多元”,通用性技術(shù)的優(yōu)勢也逐漸顯現(xiàn)出來。而對于百度來說,在云、AI、互聯(lián)網(wǎng)融合發(fā)展的大趨勢下,百度形成了移動生態(tài)、百度智能云、智能交通、智能駕駛及更多人工智能領(lǐng)域前沿布局的多引擎增長新格局,在AI算力、算法、開放平臺、開發(fā)者生態(tài)等方面建立的領(lǐng)先優(yōu)勢,正轉(zhuǎn)化為“云智一體”的差異化競爭力,使之進入強勁增長的快車道。
而ACIA的培養(yǎng),不僅為行業(yè)輸血,也為百度蓄積的強大AI勢能加快產(chǎn)業(yè)化落地,提供了大量的“智能路由器”。
毫無疑問,對于吳甜描述的AI進入工業(yè)大生產(chǎn)的三階段來說,百度已經(jīng)不滿足于培養(yǎng)普通的應(yīng)用層人才,而是輸出能夠提升一家企業(yè)中對技術(shù)團隊具有AI影響力,能夠幫助企業(yè)從整體上構(gòu)建以AI為核心的技術(shù)體系,充分發(fā)揮AI技術(shù)對于業(yè)務(wù)的助力作用的高端復(fù)合型人才。
高端復(fù)合型AI人才的培養(yǎng)該走一條什么樣的路,世界范圍內(nèi)都沒有標(biāo)準(zhǔn)答案。但有業(yè)界觀察家指出,美國、歐洲的模式都各有優(yōu)勢,也各有弊端。歐美模式的優(yōu)勢是有大量的引領(lǐng)級人才和開山立派的宗師級研究者,但這些象牙塔里的大師的主要標(biāo)準(zhǔn)是發(fā)布論文數(shù)量,從某種程度上離產(chǎn)業(yè)實踐較遠。
而和谷歌的深度學(xué)習(xí)框架設(shè)計為“面向所有人”和臉書的框架“面向研究者”的定位都有所不同的是,百度的飛槳一開始就明確定義為“產(chǎn)業(yè)級”,目的就是指向AI技術(shù)應(yīng)用的產(chǎn)業(yè)落地,因此其高端復(fù)合人才的導(dǎo)向,亦明確指向產(chǎn)業(yè)應(yīng)用。
這是一片無人的海洋,需要在尋覓中找到方向。
3
領(lǐng)航,指向何方?
作為一個生態(tài)體系,AI離不開優(yōu)秀的開發(fā)者和優(yōu)秀的社區(qū)組織,所以,飛槳大航海計劃,也面向核心開發(fā)者推出了“領(lǐng)航”計劃。
百度CTO王海峰曾多次強調(diào)開源開放的重要性,他表示,開源開放的精神內(nèi)涵,已不僅是技術(shù)開發(fā)領(lǐng)域的協(xié)作機制,更是驅(qū)動技術(shù)創(chuàng)新和加速產(chǎn)業(yè)發(fā)展的核心動能。
開源平臺是與開發(fā)者們共建的。PPDE,是飛槳開發(fā)者技術(shù)專家計劃的縮寫,目前,全中國的PPDE不到200位,可謂每個都是很高的榮譽。他們不僅為飛槳產(chǎn)品社區(qū)貢獻技術(shù)力量,更是以實際行動在引領(lǐng)和推動開源社區(qū)的發(fā)展。
PPDE并不是一個技術(shù)榮譽,它更偏向榮譽獲得者對于產(chǎn)業(yè)的貢獻,因此,無論是推動技術(shù)應(yīng)用創(chuàng)新的全球飛槳開發(fā)者,或是推動開源社區(qū)發(fā)展的極客或者開源項目 Committer,還是科研機構(gòu)孜孜不倦鉆研的科學(xué)家,或桃李滿天下的高校老師,甚至是新興科技公司創(chuàng)始人、CTO、技術(shù)領(lǐng)袖,或是編程開發(fā)與技術(shù)分享兼?zhèn)涞募夹g(shù)博主、Up主,都可以加入PPDE計劃。
張林峰就是PPDE的一員。
從北大元培到普林斯頓,再次回到中國的他有了新的身份。作為深勢科技這家公司的聯(lián)合創(chuàng)始人和首席科學(xué)家,他和一群志同道合的伙伴正在以“多尺度建模+機器學(xué)習(xí)+高性能計算”的新范式,解決著微觀尺度的工業(yè)設(shè)計難題。
但是相比于自己創(chuàng)辦的企業(yè),張林峰更喜歡聊那個“因共同熱情與理想”聚集起來的開源新社區(qū)——DeepModeling。
DeepModeling開源社區(qū)始于張林峰學(xué)生時期所做的“深度勢能分子動力學(xué)”開源項目DeePMD-kit。從那時起,張林峰就熱衷于將基礎(chǔ)代碼、算法、架構(gòu)等根據(jù)開源協(xié)議進行共享,通過社區(qū)內(nèi)的群智協(xié)作,讓高門檻、高壁壘的不同學(xué)科碰撞思維,打通盲點。
對于現(xiàn)在的創(chuàng)業(yè),張林峰解釋說:“可以用底層的分子動力學(xué)舉個例子,比如我們需要描述一個化學(xué)反應(yīng)中,各原子間出現(xiàn)復(fù)雜的相互作用時,以前要么是通過更為復(fù)雜昂貴的量子力學(xué)計算求解,要么就簡單地憑經(jīng)驗拍腦袋猜會是怎樣的情況。但這個問題一旦被轉(zhuǎn)化到深度學(xué)習(xí)的語言里面,就變成了‘輸入原子位置’,然后‘求解原子間的相互作用結(jié)果’,也就是勢能面。充分考慮物理限制的深度學(xué)習(xí)模型相比傳統(tǒng)手段更高效準(zhǔn)確!
作為既有深厚的開源文化,又在技術(shù)上足夠靈活、拓展能力極強的深度學(xué)習(xí)平臺飛槳,能和深勢科技“走到一起”并不奇怪。
“科學(xué)計算以及物理模擬會是人工智能下一個非常重要的戰(zhàn)場,在這樣大的場景下,開源將是我們注定要選擇的模式!睆埩址逶赪AVE SUMMIT 2021深度學(xué)習(xí)開發(fā)者峰會的論壇上分享分子動力學(xué)與飛槳深度學(xué)習(xí)平臺的融合創(chuàng)新時,提出了自己的觀點。
不久前,飛槳已和DeepModeling開源社區(qū)的開發(fā)者們,就深度勢能分子動力學(xué)開源項目(DeePMD-kit)進行了跨領(lǐng)域深度合作。依托飛槳成熟的底層功能和動靜統(tǒng)一的開發(fā)體驗,開發(fā)者們實現(xiàn)了深度勢能分子動力學(xué)模型的構(gòu)建和運行。這一合作促進了雙方在開發(fā)者生態(tài)上的雙向融合,拓展了DeePMD-kit原有能力邊界,增強了在國產(chǎn)化硬件和大規(guī)模分布式訓(xùn)練上的能力,也讓飛槳支持的科學(xué)計算開源項目中增加了重量級的一員。
但PPED并不是大航海領(lǐng)航計劃的全部。
今年四月,浙江大學(xué)召開OpenKS(知目)知識計算引擎開源項目發(fā)布會,宣布浙大與合作單位研發(fā)的OpenKS知識計算引擎取得重大進展。中國工程院院士、國家新一代人工智能戰(zhàn)略咨詢委員會組長、浙江大學(xué)計算機學(xué)院教授潘云鶴說,本次發(fā)布的OpenKS,作為知識計算引擎項目中的基礎(chǔ)軟件架構(gòu),定義并豐富了知識計算的內(nèi)涵,是我國在大數(shù)據(jù)人工智能方向的又一次有益嘗試。
“可泛化的領(lǐng)域知識學(xué)習(xí)與計算引擎”是以莊越挺教授作為首席科學(xué)家的科技創(chuàng)新2030“新一代人工智能”首批重大項目,該項目由浙江大學(xué)牽頭,聯(lián)合北京大學(xué)等頂尖學(xué)術(shù)機構(gòu)和百度等行業(yè)領(lǐng)軍企業(yè)聯(lián)合建設(shè)。
需要劃重點的是,OpenKS基于百度飛槳,可實現(xiàn)模型的大規(guī)模分布式訓(xùn)練與圖計算,解決了從數(shù)據(jù)到知識,從知識到?jīng)Q策中的三大問題。旨在建立一整套可服務(wù)于知識密集型行業(yè)共性需求的知識計算工具、算法與系統(tǒng),幫助這些行業(yè)快速地構(gòu)建行業(yè)知識圖譜,提供行業(yè)相關(guān)的智能規(guī)劃與決策支持。
選擇百度飛槳,則是因為知識圖譜技術(shù)的研發(fā)應(yīng)用需要海量數(shù)據(jù)、龐大算力以及復(fù)雜的模型算法,而構(gòu)建知識圖譜底層平臺所需的技術(shù)要求高、周期長、投入大、收益慢。而基于飛槳深度學(xué)習(xí)平臺開展人工智能科學(xué)實驗或產(chǎn)品研發(fā),則可以避免在知識圖譜系統(tǒng)搭建中重復(fù)造輪子。
舉例來說,面對超大規(guī)模知識圖譜訓(xùn)練,隨著圖譜規(guī)模增大,數(shù)據(jù)量增多,對訓(xùn)練框架要求越來越高。針對分布式知識計算,OpenKS系統(tǒng)采用飛槳超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練技術(shù),支持百億圖譜分布式存儲和檢索,還支持百節(jié)點數(shù)據(jù)并行訓(xùn)練萬億稀疏參數(shù),進而學(xué)習(xí)大規(guī)模的知識圖譜。
對于飛槳特別擅長的產(chǎn)業(yè)應(yīng)用,在OpenKS的知識圖譜應(yīng)用場景里,如知識圖譜問答和推薦等方法,飛槳不僅提供了相應(yīng)的算法,還針對推薦場景提供了工業(yè)級數(shù)據(jù)處理和萬億稀疏模型訓(xùn)練能力,從而為打通學(xué)術(shù)界和工業(yè)界提供了有力的通路。
以上的兩個例子可以看出,在充滿了機遇與挑戰(zhàn)的大時代背景中,飛槳將持續(xù)在技術(shù)上不斷創(chuàng)新進步的同時,不斷探索分布式訓(xùn)練技術(shù)等的邊界,不斷擴展AI賦能的領(lǐng)域,做到與開發(fā)者共同成長進步,為產(chǎn)學(xué)研智能化進程貢獻著自己的力量。
正如王海峰所說,人工智能技術(shù)發(fā)展到今天,從科學(xué)研究的角度面臨的問題越來越復(fù)雜,但從應(yīng)用的角度實際上門檻在不斷降低。
作為“AI時代的操作系統(tǒng)”、百度大腦的技術(shù)底座,飛槳始終堅持開源的路線,保持對繁榮開源生態(tài)的建設(shè)投入。
一位深度參與飛槳工作的技術(shù)大牛這樣對筆者說:“如果一定要給近代科學(xué)和現(xiàn)代科學(xué)劃一個分水嶺,那就是研發(fā)的組織工作上,從研究者單槍匹馬的突破到大規(guī)模協(xié)同的存在,前者需要愛因斯坦天才的大腦,后者則可以依靠更多‘非天才’的分工與協(xié)同,飛槳始終強調(diào)開源的意義也正在于此,飛槳越開放,聚集的開發(fā)者越多,中國的AI生態(tài)就越可能出現(xiàn)跨越式突破”。
作為一位航海者的日記,我們或許將在飛槳的未來,或者未來的未來時再品讀這句話的深遠意義。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?