訂閱
糾錯
加入自媒體

復盤百度AI十年歷程:屬于百度AI的時代已經(jīng)啟幕

2021-03-26 20:28
Alter聊IT
關注

3月23日的演講中,李彥宏將回港上市定義為百度的“二次創(chuàng)業(yè)”。

對于百度來說,“二次創(chuàng)業(yè)”的說法絕非虛辭。2005年沖刺納斯達克時,百度還是一家純粹的搜索引擎企業(yè);時隔十六年后幫助百度叩開港交所大門的,則是深耕了十年之久的人工智能,百度已經(jīng)徹底成為一家AI生態(tài)型企業(yè)。

猶記得在2019年5月舉辦的第二屆數(shù)字中國建設峰會上,李彥宏在闡述百度AI的愿景時打了一個形象的比方:“互聯(lián)網(wǎng)是前菜,它的特點是快;人工智能才是主菜,需要溫火慢燉,但營養(yǎng)豐富。未來沒有一家企業(yè)可以聲稱與人工智能無關,吃不到這道主菜,將失去一個時代!

借著百度二次上市的契機,似乎有必要重新梳理下百度AI的十年歷程,如何從不被外界注意的新事物,逐步蛻變?yōu)榘俣鹊牡诙鲩L引擎,并幫助百度提前錨定了人工智能時代的市場站位。

鑒于篇幅的原因,本文主要分為四個章節(jié)。

01 育種

2009年,神經(jīng)網(wǎng)絡專家Hinton和他的兩個研究生將神經(jīng)網(wǎng)絡應用于語音的聲學建模,與行業(yè)內流行了30年的標準工具一較高下,在小詞匯量連續(xù)語音識別數(shù)據(jù)庫TIMIT上,獲得了語音識別競賽勝利。

于是深度學習像是打開了閘門的洪水,迅速從語音識別、圖像識別延伸到機器翻譯、語義理解等領域,極短的時間里就成了學術圈的主流。彼時中國互聯(lián)網(wǎng)還處于PC時代,流量紅利猶在,太平洋對岸的熱鬧未能觸動太多企業(yè),人工智能的應用還只是停留在科幻電影里的虛幻場景。

百度可能是國內最先“覺醒”的互聯(lián)網(wǎng)巨頭,在2010年初率先成立了“自然語言處理部門”,盡管最初的目的是為了服務搜索中產(chǎn)生的智能化需求;接下來不斷在語音、圖片等技術上布局,并敲定了在知識圖譜技術上長期投入的戰(zhàn)略。

到了2012年的時候,百度的AI戰(zhàn)略已經(jīng)初步成型,陸續(xù)成立了深度學習研究院IDL、人工智能實驗室。2014年百度開始涉足智能駕駛領域,先后推出了深度語音系統(tǒng)、百度大腦、度秘、 Apollo 自動駕駛平臺等技術體系,涉及自然語言處理、機器翻譯、語音、視覺、機器學習、深度學習、知識圖譜等核心技術。

也正是從2010年開始,百度的研發(fā)費用進入穩(wěn)步增長期。研發(fā)投入在營收中的占比,從早期的不足10%躍升到 2020 年的 21.4%,十年間的累計研發(fā)費用高達 1023 億元。甚至有好事者進行過這樣一組對比:2010年進軍人工智能后,百度的營收增長了14倍,研發(fā)費用的增長卻超過25倍。

上千億的研發(fā)資金似乎并未直接利好百度的營收,但帶來了遠比一時的利潤更有價值的硬實力:

根據(jù)國家工業(yè)信息安全發(fā)展研究中心發(fā)布的《2020人工智能中國專利技術分析報告》,在人工智能專利申請量和授權量方面,百度以9364件專利申請和2682件專利授權位居第一,并在深度學習、智能語音、自動駕駛等領域占據(jù)首位。

僅在2020年期間,百度被國際AI頂會收錄的論文達到260多篇,在CVPR、ECCV、NeurIPS、INTERSPEECH等全球頂級的人工智能學術會議或相關競賽上,百度AI問鼎冠軍近30次,斬獲了100多個行業(yè)權威獎項。

沉甸甸的數(shù)字背后,百度就像是一位勞作在田間地頭的“育種師”,親手開辟了一塊又一塊的試驗田。在外界沉迷于追逐風口瘋狂擴張的時候,百度的速度看起來有些“落后”,但育種師清楚的知道這些種子的價值在哪里

02 散播

2016年,人工智能的浪潮終于走出學術圈。在某場著名的公關事件后,人工智能逐漸成為大家茶余飯后的談資;蛟S很多人對人工智能的應用依舊陌生,但人工智能的進化速度徹底刷新了人們的傳統(tǒng)認知。

原本癡迷于移動互聯(lián)網(wǎng)船票的中國企業(yè)逐漸意識到,屬于人工智能的時代已經(jīng)不再遙遠,倘若和新的技術浪潮失之交臂,結果可能是災難性的,F(xiàn)實的殘酷在于,根據(jù)第一財經(jīng)等主流媒體的報道,中國AI人才的缺口可能有500萬的規(guī)模,并將隨著人工智能的產(chǎn)業(yè)化進程逐年增長。

百度開始有意調整自己的姿態(tài),從默默深耕的“育種師”,思考怎么將前沿的人工智能技術散播出去,避免重復造輪子等問題。

2016年9月的百度世界大會上,集視覺、語音、自然語言處理、知識圖譜、深度學習等技術于一體的百度大腦正式對外開放,并且每隔一段時間就會進行迭代,合作伙伴可以直接調用百度AI的核心能力。

同樣是在2016年,百度主導的深度學習框架PaddlePaddle(飛槳)上線,涵蓋了深度學習核心訓練和推理框架、基礎模型庫、端到端開發(fā)套件和豐富的工具組件,填補了中國開源深度學習框架的空白。

在云計算的戰(zhàn)場上,百度率先提出了“ABC”戰(zhàn)略,將人工智能(AI)、大數(shù)據(jù)(Big Data)和云計算(Cloud)融合在一起,將視覺、語音、語義理解等擅長的AI能力通過云計算服務帶到了企業(yè)級市場。

即便是不被外界重視的人才培養(yǎng)方面,百度在2016年與西安交通大學聯(lián)合開設了人工智能班,與中科院大學在人才培養(yǎng)、科學研究、數(shù)據(jù)開放、資源共享等方面達成合作,開啟了產(chǎn)學研一體化的篇章。

數(shù)據(jù)再一次證明了百度的遠見。

目前百度大腦已經(jīng)對外開放270多項AI能力,日調用量超過1萬億次;百度飛槳凝聚了265萬開發(fā)者、服務了10萬家企業(yè)、創(chuàng)建了超過34萬個模型;截止到2020年底,百度總計為社會培養(yǎng)了超過100萬AI人才……

更加有說服力的是百度創(chuàng)新的業(yè)務孵化。2016年之前百度的業(yè)務主要集中在移動互聯(lián)網(wǎng)的領域,目前已經(jīng)形成了以AI為核心的生態(tài)布局。比如信息流已經(jīng)是百度移動生態(tài)的核心組成,小度的月交互次數(shù)已經(jīng)達到75億次,Apollo旗下的Robotaxi和Robobus在國內多個城市接待的乘客數(shù)量已經(jīng)超過21萬。

回頭來看,將AI的種子散播出去注定了百度作為AI生態(tài)型企業(yè)的定位,畢竟技術只有落地才能發(fā)揮其最大的價值。

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號