一文讀懂:李彥宏掌舵下的百度AI如何開(kāi)花結(jié)果?
2018年7月4日,北京國(guó)家會(huì)議中心,這是百度轉(zhuǎn)型AI戰(zhàn)略以來(lái)舉辦的第二次百度AI開(kāi)發(fā)者大會(huì),相比第一屆,技術(shù)配方和味道愈發(fā)純正,而且今年的重點(diǎn)不再是樹(shù)旗造勢(shì),更多的是技術(shù)成果解讀和商業(yè)化探討。
在過(guò)去的一段時(shí)間內(nèi),很多人有這樣的質(zhì)疑?第一,陸奇親自操刀幫百度理順了AI航道后淡然離場(chǎng),對(duì)百度的影響大不大?之前大刀闊斧設(shè)定好的目標(biāo)路線還能否被繼續(xù)保持?第二,百度總是說(shuō)自己是AI公司,AI主要業(yè)務(wù)的真實(shí)情況怎么樣?如何去做商業(yè)轉(zhuǎn)化和技術(shù)變現(xiàn)?
因此,李彥宏特意用一場(chǎng)AI開(kāi)發(fā)者大會(huì)交了一份長(zhǎng)長(zhǎng)的答卷,用答卷去證明陸奇離開(kāi),百度并無(wú)大礙,并且自己能夠帶領(lǐng)一眾技術(shù)高管把AI戰(zhàn)略進(jìn)行的有聲有色,無(wú)人駕駛車(chē)量產(chǎn)、AI開(kāi)放平臺(tái)和芯片、智能小程序上線······一步一個(gè)亮點(diǎn),步步為營(yíng)形成技術(shù)體系和商業(yè)生態(tài)的閉環(huán)。
AI全棧技術(shù)布局:多模態(tài)深度語(yǔ)義理解+“昆侖”芯片
百度高級(jí)副總裁、AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰詳解了百度大腦3.0,從芯片到深度學(xué)習(xí)框架,百度大腦形成了技術(shù)、平臺(tái)和生態(tài)的AI全棧技術(shù)布局。
發(fā)布會(huì)上,李彥宏播放了一段電話(huà)錄音,一位即將參加開(kāi)發(fā)者大會(huì)的嘉賓與百度智能客服進(jìn)行了幾輪對(duì)話(huà),一問(wèn)一答非常自然,隨后揭曉,錄音中的這位客服并不是人,而是AI,它背后便是百度大腦的自然語(yǔ)言理解、語(yǔ)音識(shí)別與合成技術(shù)。
王海峰指出,百度AI能力的核心是百度大腦,而百度大腦3.0是百度AI能力的集大成者。8年前,基于多年的搜索技術(shù)積累,百度開(kāi)始布局AI,2016年9月正式發(fā)布“百度大腦”,如今,百度大腦的能力從1.0進(jìn)階到3.0。百度大腦1.0完成基礎(chǔ)能力搭建和核心技術(shù)初步開(kāi)放,2.0形成了完整的技術(shù)體系,開(kāi)放60多項(xiàng)AI核心能力,3.0的核心是“多模態(tài)深度語(yǔ)義理解”,同時(shí)開(kāi)放110多項(xiàng)AI能力,覆蓋算法層、感知層、認(rèn)知層、平臺(tái)層。
百度大腦3.0提出了“多模態(tài)深度語(yǔ)義理解”,“多模態(tài)深度語(yǔ)義理解”是指對(duì)文字、聲音、圖片、視頻等多模態(tài)的數(shù)據(jù)和信息進(jìn)行深層次多維度的語(yǔ)義理解,包括數(shù)據(jù)語(yǔ)義、知識(shí)語(yǔ)義、視覺(jué)語(yǔ)義、語(yǔ)音語(yǔ)義一體化和自然語(yǔ)言語(yǔ)義等多方面的語(yǔ)義理解技術(shù)。王海峰表示,“多模態(tài)深度語(yǔ)義理解不僅能讓機(jī)器聽(tīng)清、看清,更能理解它背后的含義,深度地理解真實(shí)世界,進(jìn)而更好地支撐各種應(yīng)用。”
數(shù)據(jù)語(yǔ)義化技術(shù)可以將大千世界中多元、異構(gòu)和多模態(tài)的三元空間大數(shù)據(jù),形成包含千億節(jié)點(diǎn)、萬(wàn)億關(guān)系的龐大數(shù)據(jù)語(yǔ)義網(wǎng)絡(luò),從中總結(jié)規(guī)律、提煉知識(shí)、發(fā)現(xiàn)價(jià)值,助力經(jīng)濟(jì)和社會(huì)發(fā)展。比如在新能源充電樁智能運(yùn)維中,結(jié)合百度的大數(shù)據(jù)、深度學(xué)習(xí)等技術(shù)進(jìn)行設(shè)備監(jiān)測(cè)、故障診斷等,可以顯著提升效率,節(jié)約成本。而多元語(yǔ)義知識(shí)方面,百度已經(jīng)構(gòu)建了包含數(shù)億實(shí)體、數(shù)千億級(jí)事實(shí)的龐大知識(shí)圖譜。除了基礎(chǔ)的由實(shí)體、屬性、關(guān)系構(gòu)成的實(shí)體圖譜,我們還針對(duì)不同的應(yīng)用場(chǎng)景和知識(shí)形態(tài),構(gòu)建了關(guān)注點(diǎn)圖譜、事件圖譜、多媒體圖譜、行業(yè)知識(shí)圖譜等多種圖譜。所有這些知識(shí),構(gòu)成了百度大腦的基礎(chǔ)。
視覺(jué)語(yǔ)義化可以讓機(jī)器從看清到看懂視頻,并提煉出結(jié)構(gòu)化語(yǔ)義知識(shí)。視覺(jué)語(yǔ)義化技術(shù)應(yīng)用于世界杯視頻解析,能夠全面識(shí)別視頻中的球員、裁判、球、以及球門(mén)、球場(chǎng)線等人、物和場(chǎng)景,可以捕捉射門(mén)、進(jìn)球、角球、任意球、換人等事件;谶@些語(yǔ)義化知識(shí),既可以完成機(jī)器人自動(dòng)解說(shuō),也可以進(jìn)行精彩片段集錦、以及各種數(shù)據(jù)統(tǒng)計(jì)分析等。而在實(shí)際生活的超市購(gòu)物場(chǎng)景中,百度的視覺(jué)語(yǔ)義化技術(shù)通過(guò)識(shí)別人物、動(dòng)作、物品并關(guān)聯(lián)時(shí)間序列,將數(shù)字化的視頻轉(zhuǎn)化為結(jié)構(gòu)化的語(yǔ)義知識(shí),既能實(shí)現(xiàn)顧客在無(wú)人超市購(gòu)物的完整體驗(yàn),還可以幫助商店經(jīng)營(yíng)者分析和優(yōu)化商店經(jīng)營(yíng)。
語(yǔ)音語(yǔ)義一體化和自然語(yǔ)言理解技術(shù)能讓機(jī)器準(zhǔn)確識(shí)別并理解人說(shuō)的話(huà),實(shí)現(xiàn)更自然的人機(jī)對(duì)話(huà)。王海峰現(xiàn)場(chǎng)對(duì)著百度地圖說(shuō)出了一長(zhǎng)串繞口令般的導(dǎo)航需求,百度地圖語(yǔ)音智能助手完美識(shí)別并給出最佳路線,李彥宏開(kāi)場(chǎng)播放的智能客服給參會(huì)者打電話(huà)的片段,其背后也是這些領(lǐng)先的AI技術(shù)在支撐。王海峰介紹,百度高噪聲環(huán)境Hand-free語(yǔ)音識(shí)別準(zhǔn)確率已提升了10個(gè)百分點(diǎn),語(yǔ)音語(yǔ)義一體化技術(shù)使得遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別準(zhǔn)確率提升了10個(gè)百分點(diǎn);在語(yǔ)音合成方面,WaveNet+拼接的情感語(yǔ)音合成技術(shù),使得流暢度和自然度也大幅提升。
王海峰以對(duì)話(huà)理解和閱讀理解為例,為大家介紹了領(lǐng)先的百度自然語(yǔ)言理解技術(shù)。百度的對(duì)話(huà)理解技術(shù)已經(jīng)積累多年,通過(guò)研發(fā)最新的深層注意力匹配模型,比已知的最好結(jié)果又提升了4.1%。在閱讀理解技術(shù)上,百度大腦已經(jīng)閱讀了千億量級(jí)的文章,相當(dāng)于6萬(wàn)個(gè)中國(guó)國(guó)家圖書(shū)館的藏書(shū),并由此積累了億級(jí)實(shí)體、千億事實(shí)的知識(shí)!巴ㄟ^(guò)持續(xù)獲取和積累知識(shí),百度大腦的理解能力不斷升級(jí),智能水平顯著提升,進(jìn)而能夠更好地服務(wù)用戶(hù)!蓖鹾7逭f(shuō)到。
百度大腦3.0提出“多模態(tài)深度語(yǔ)義理解”,背后有一套百度自主研發(fā)的深度學(xué)習(xí)框架PaddlePaddle,目前也迭代到3.0版本,包括完整的核心框架以及AIStudio、AutoDL、EasyDL等可以讓開(kāi)發(fā)者便捷獲取百度AI能力的平臺(tái)。
PaddlePaddle3.0核心框架對(duì)服務(wù)器版本以及移動(dòng)端版本進(jìn)行了全面優(yōu)化,可以靈活適用于廣泛的開(kāi)發(fā)需求。AutoDL能更高效自動(dòng)搜索神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),開(kāi)發(fā)者無(wú)需特殊硬件設(shè)備可以快速得到高質(zhì)量模型;EasyDL可以幫助開(kāi)發(fā)者零算法基礎(chǔ)訓(xùn)練業(yè)務(wù)定制模型,操作可視化,無(wú)需懂深度學(xué)習(xí);AI studio具有云端集成、簡(jiǎn)單易用、運(yùn)行高效和資源免費(fèi)的特點(diǎn),是集成“數(shù)據(jù)、算法、算力”的PaddlePaddle實(shí)訓(xùn)平臺(tái),一站式滿(mǎn)足使用者學(xué)習(xí)、技術(shù)進(jìn)階、學(xué)術(shù)研究需求。
百度大腦3.0首次將芯片納入技術(shù)體系,它使百度大腦具備了軟硬一體化能力,旨在帶動(dòng)百度大腦算力實(shí)現(xiàn)倍級(jí)增長(zhǎng)。百度自主研發(fā)了一款云端全功能AI芯片“昆侖”在會(huì)上首次公開(kāi)亮相!癆I芯片將與百度自主研發(fā)的PaddlePaddle深度學(xué)習(xí)框架深度結(jié)合,推動(dòng)AI技術(shù)生態(tài)快速發(fā)展。”王海峰表示。
“昆侖”定位是云端全功能AI芯片,采用了14nm三星工藝,具備260Tops性能,512GB/s內(nèi)存帶寬,100+瓦特功耗設(shè)計(jì),針對(duì)語(yǔ)音、NLP、圖像等進(jìn)行了專(zhuān)門(mén)優(yōu)化,同等性能下成本降低10倍,支持多個(gè)深度學(xué)習(xí)框架。
與谷歌做TPU的選擇一樣,百度自己做AI芯片有一定必然性,從2011年起,為了深度學(xué)習(xí)運(yùn)算的需要,百度開(kāi)始基于FPGA研發(fā)AI加速器,同期開(kāi)始使用GPU,在過(guò)去幾年中,百度對(duì)FPGA和GPU都進(jìn)行了大規(guī)模部署。AI應(yīng)用的爆發(fā),對(duì)算力的要求越來(lái)越高,基于傳統(tǒng)芯片的AI運(yùn)算加速,已經(jīng)不能滿(mǎn)足需求。在大規(guī)模AI運(yùn)算的實(shí)踐探索中,百度研發(fā)出了一款專(zhuān)門(mén)用于AI大規(guī)模運(yùn)算的芯片“昆侖”,據(jù)說(shuō)它的運(yùn)算能力比最新基于FPGA的AI加速器,性能提升了近30倍。
王海峰表示,百度大腦每天調(diào)用次數(shù)超過(guò)4千億次,調(diào)用的人中既有AI工程師,也有零“AI”基礎(chǔ)的初入門(mén)者,還有來(lái)自各行各業(yè)希望用AI創(chuàng)新業(yè)務(wù)、為業(yè)務(wù)轉(zhuǎn)型升級(jí)的企業(yè)。這些開(kāi)發(fā)者和合作伙伴雖然身份不同、目標(biāo)不同,但都能從百度找到了最適合的AI接入方式。
百度AI智能小程序,深耕移動(dòng)端掘金
百度副總裁、百度APP&信息流業(yè)務(wù)體系總負(fù)責(zé)人沈抖發(fā)布百度智能小程序,一邊是日益成熟的AI產(chǎn)業(yè),一邊是逐漸火爆的小程序熱潮,智能小程序是百度AI在移動(dòng)端深挖潛能的關(guān)鍵紐帶,與搜索+信息流進(jìn)一步串聯(lián)起來(lái)。
據(jù)介紹,百度智能小程序?qū)⒃诮衲?2月全面開(kāi)源,不僅可以全面接入百度大腦的AI能力,還要為用戶(hù)和開(kāi)發(fā)者打造一個(gè)開(kāi)放、智能化的移動(dòng)生態(tài),目前包括攜程、蘇寧易購(gòu)、唯品會(huì)、同程、春雨醫(yī)生、愛(ài)奇藝、優(yōu)信二手車(chē)、查違章等在內(nèi)的近百家企業(yè)成為首批加入智能小程序生態(tài)的合作伙伴,并將陸續(xù)推出各自的智能小程序。
百度智能小程序的開(kāi)放性體現(xiàn)在兩個(gè)層面。首先,開(kāi)發(fā)者只要簡(jiǎn)單修改幾行代碼,就可以將自己在其他平臺(tái)開(kāi)發(fā)的小程序接入百度智能小程序,百度智能小程序無(wú)縫運(yùn)行在百度系A(chǔ)pp(百度App、百度貼吧、百度網(wǎng)盤(pán)等)以及外部合作App(嗶哩嗶哩、58同城等)上,實(shí)現(xiàn)一端開(kāi)發(fā),多端可運(yùn)行。其次,百度還將開(kāi)放全域千億流量扶持開(kāi)發(fā)者,幫助他們快速沉淀精準(zhǔn)用戶(hù)。值得注意的是,百度流量與其他平臺(tái)不同的是,百度流量中天然存在大量與資訊、服務(wù)、工具等相關(guān)的需求,尤其是在百度信息流中,用戶(hù)看到的內(nèi)容都是根據(jù)興趣匹配推薦的,這些內(nèi)容可以激發(fā)用戶(hù)各類(lèi)需求,非常適合開(kāi)發(fā)者去挖掘。
沈抖強(qiáng)調(diào):“如今,AI已不再是‘錦上添花’,而是必備的技能。百度將開(kāi)放AI能力,讓開(kāi)發(fā)者重回業(yè)務(wù)理解與創(chuàng)意的賽道,專(zhuān)注于自己的業(yè)務(wù)邏輯!睋(jù)悉,來(lái)自百度大腦3.0的AI能力將全部開(kāi)放給智能小程序開(kāi)發(fā)者,這些能力包括語(yǔ)音、視覺(jué)、自然語(yǔ)言處理、知識(shí)圖譜、增強(qiáng)現(xiàn)實(shí)以及情景感知等類(lèi)別,其中部分能力甚至已經(jīng)封裝好,開(kāi)發(fā)者直接調(diào)用即可。
同時(shí),得益于百度的AI技術(shù),百度智能小程序可以基于大數(shù)據(jù)、意圖識(shí)別、興趣識(shí)別等技術(shù)精準(zhǔn)匹配各類(lèi)智能小程序用戶(hù),從而縮短用戶(hù)轉(zhuǎn)化途徑,為開(kāi)發(fā)者和合作伙伴進(jìn)一步提升商業(yè)效益。官方舉了幾個(gè)案例,接入百度智能小程序后,“查違章智能小程序”全網(wǎng)的DAU在50天內(nèi)增長(zhǎng)了370%,火車(chē)票智能小程序訂單轉(zhuǎn)化率在20天內(nèi)提升了44%,同時(shí)百度貼吧小程序上線以來(lái),用戶(hù)人均使用時(shí)長(zhǎng)增加了30%以上。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?