語(yǔ)義理解核心技術(shù)揭秘 百度AI快車(chē)道第五期開(kāi)營(yíng)
在這個(gè)日新月異的時(shí)代,人工智能被視為第四次工業(yè)革命的核心驅(qū)動(dòng)力。而深度學(xué)習(xí)技術(shù)的興起正推動(dòng)著人工智能進(jìn)入工業(yè)大生產(chǎn)階段,為人類創(chuàng)造更大的價(jià)值。
早在2016年的百度世界大會(huì)上,百度宣布飛槳(PaddlePaddle)開(kāi)源,這標(biāo)志著國(guó)內(nèi)首個(gè)也是目前唯一一個(gè)開(kāi)源開(kāi)放、功能完備的端到端深度學(xué)習(xí)平臺(tái)的誕生。飛槳是集核心框架、工具組件和服務(wù)平臺(tái)為一體的端到端開(kāi)源深度學(xué)習(xí)平臺(tái)。在飛槳的服務(wù)平臺(tái)層面,還有一個(gè)定制化訓(xùn)練和服務(wù)平臺(tái)EasyDL,它的目標(biāo),就是讓零算法基礎(chǔ)的用戶,也可以基于自身業(yè)務(wù)需求和數(shù)據(jù),快速訓(xùn)練專屬的定制化AI模型。
圖:百度飛槳全景圖
飛槳核心框架層開(kāi)放了開(kāi)發(fā)、訓(xùn)練、預(yù)測(cè)的一整套能力,并開(kāi)源70多個(gè)經(jīng)過(guò)真實(shí)業(yè)務(wù)場(chǎng)景驗(yàn)證的官方模型,包括視覺(jué)、自然語(yǔ)言、推薦等幾大核心技術(shù)領(lǐng)域。面向工業(yè)應(yīng)用的中文NLP工具集——飛槳自然語(yǔ)言處理模型庫(kù)(PaddleNLP),將自然語(yǔ)言處理領(lǐng)域的多種模型在任務(wù)層用一套共享骨架代碼實(shí)現(xiàn),網(wǎng)絡(luò)使用更加靈活。飛槳模型庫(kù)推出了在中文NLP任務(wù)上表現(xiàn)全面領(lǐng)先的中文語(yǔ)義理解模型——ERNIE,大幅增強(qiáng)了模型語(yǔ)義表示能力,在實(shí)際應(yīng)用中效果顯著。飛槳提供的視頻識(shí)別工具集,則覆蓋了主流實(shí)用的序列建模算法與端到端視頻識(shí)別模型,為開(kāi)發(fā)者提供解決視頻分類、視頻定位等一系列應(yīng)用技術(shù)方案。
基于飛槳的顯著優(yōu)勢(shì)和強(qiáng)大的功能,百度組織開(kāi)展了AI快車(chē)道——企業(yè)深度學(xué)習(xí)實(shí)戰(zhàn)營(yíng),相繼在北京和上海舉辦了“圖像檢索”、“目標(biāo)檢測(cè)”、“推薦系統(tǒng)”等專題課程,邀請(qǐng)到百度大腦技術(shù)生態(tài)和深度學(xué)習(xí)平臺(tái)的資深研發(fā)人員來(lái)分享百度深度學(xué)習(xí)的研究和應(yīng)用之路,干貨滿滿,卓有啟迪,讓大家親身感受到了深度學(xué)習(xí)實(shí)戰(zhàn)技能的重要性。如今實(shí)戰(zhàn)營(yíng)已經(jīng)開(kāi)展到第五期。此次實(shí)戰(zhàn)營(yíng)就“語(yǔ)義理解”專題進(jìn)行了講解與實(shí)踐,眾多開(kāi)發(fā)者深度參與相關(guān)技術(shù)方面的交流實(shí)踐活動(dòng)。
圖:百度AI快車(chē)道——“語(yǔ)義理解”專場(chǎng)
如果把人工智能的核心看作是認(rèn)知,那么認(rèn)知的核心技術(shù)之一就是“語(yǔ)義理解”。百度的語(yǔ)義理解技術(shù)既包含靈活通用、多層次的語(yǔ)義建模,也有特定任務(wù)上的語(yǔ)義適配。
近年來(lái),利用大規(guī)模無(wú)監(jiān)督語(yǔ)料訓(xùn)練得到通用語(yǔ)義來(lái)表示預(yù)訓(xùn)練模型,并在特定任務(wù)上進(jìn)行參數(shù)微調(diào),已經(jīng)取得了遠(yuǎn)超SOTA的效果。這種基于預(yù)訓(xùn)練的語(yǔ)義理解技術(shù)正受到越來(lái)越多的關(guān)注。
在AI快車(chē)道的交流學(xué)習(xí)中,百度大腦技術(shù)生態(tài)和自然語(yǔ)言處理部的資深研發(fā)人員首先針對(duì)飛槳全景進(jìn)行了介紹,隨后圍繞著“語(yǔ)義理解”介紹了NLP的發(fā)展現(xiàn)狀和過(guò)往模型情況,并分享了百度飛槳(PaddlePaddle)ERNIE模型。
據(jù)介紹,ERNIE是由百度自主開(kāi)發(fā)的知識(shí)增強(qiáng)語(yǔ)義理解模型。該模型可通過(guò)對(duì)詞、實(shí)體等語(yǔ)義單元的掩碼,使得模型學(xué)習(xí)完整概念的語(yǔ)義表示,學(xué)習(xí)真實(shí)世界的語(yǔ)義關(guān)系,解決了其他模型“主要聚焦在原始語(yǔ)言信號(hào)上,較少利用語(yǔ)義知識(shí)單元建!钡膯(wèn)題。
比如,在“哈爾濱是黑龍江的省會(huì),國(guó)際冰雪文化名城”這句話中, 谷歌的BERT 模型通過(guò)『哈』與『濱』的局部共現(xiàn),就可判斷出『爾』字,但模型并沒(méi)有學(xué)習(xí)與『哈爾濱』相關(guān)的知識(shí)。而百度的ERNIE 通過(guò)學(xué)習(xí)詞與實(shí)體的表達(dá),使模型能夠建模出『哈爾濱』與『黑龍江』的關(guān)系,可學(xué)到『哈爾濱』是 『黑龍江』的省會(huì)以及『哈爾濱』是個(gè)冰雪城市,從而增強(qiáng)了機(jī)器對(duì)于人類語(yǔ)言的理解。
活動(dòng)現(xiàn)場(chǎng),眾企業(yè)學(xué)員們積極互動(dòng)。其中一位來(lái)自醫(yī)療相關(guān)領(lǐng)域的學(xué)員表示,目前他所在的工作領(lǐng)域已經(jīng)運(yùn)用了NLP語(yǔ)義理解技術(shù),并有計(jì)劃將飛槳框架運(yùn)用到自己的實(shí)際業(yè)務(wù)中,此外還針對(duì)相關(guān)技術(shù)與講師進(jìn)行了問(wèn)答探討。
當(dāng)天的AI快車(chē)道的學(xué)習(xí)活動(dòng),還安排了具有挑戰(zhàn)性的實(shí)踐課,并以“訓(xùn)練業(yè)界領(lǐng)先的情感分類模型”為任務(wù)。在現(xiàn)場(chǎng),眾學(xué)員在指導(dǎo)下都完成了實(shí)操挑戰(zhàn),紛紛表示當(dāng)天的課程“體驗(yàn)的技術(shù)非常先進(jìn),干貨滿滿”。其中一位學(xué)員接受采訪時(shí)稱“來(lái)之前就知道百度是中文領(lǐng)域內(nèi)自然語(yǔ)言處理的領(lǐng)頭企業(yè),現(xiàn)在看果然不虛此行”。
圖:百度AI快車(chē)道第五期導(dǎo)師指導(dǎo)學(xué)員進(jìn)行實(shí)踐操作
百度 AI 快車(chē)道企業(yè)深度學(xué)習(xí)實(shí)戰(zhàn)營(yíng)是一個(gè)面向有 AI 技術(shù)需求企業(yè)的算法工程師、架構(gòu)師群體提供的快速應(yīng)用扶持計(jì)劃。依托百度自身深厚的深度學(xué)習(xí)技術(shù)實(shí)踐經(jīng)驗(yàn),為其他企業(yè)提供幫助。
該計(jì)劃的學(xué)習(xí)內(nèi)容囊括了 6 套工程實(shí)施與深度學(xué)習(xí)技術(shù)落地結(jié)合的詳細(xì)方案,覆蓋百度領(lǐng)先的 AI 技術(shù)和業(yè)務(wù)應(yīng)用場(chǎng)景的深入剖析,如 OCR、精密儀器質(zhì)檢、推薦排序經(jīng)典場(chǎng)景、遙感圖像處理等;诎俣壬疃葘W(xué)習(xí)框架飛槳的性能優(yōu)勢(shì)、模型優(yōu)勢(shì)、生態(tài)優(yōu)勢(shì)的解讀;百度自研和頂級(jí)學(xué)術(shù)會(huì)議魁首算法、預(yù)訓(xùn)練模型的詳細(xì)介紹,還有與案例和算法緊密相扣的在線實(shí)驗(yàn),以“短平快”的課程,進(jìn)行業(yè)務(wù)問(wèn)題定位、框架及算法的快速應(yīng)用培訓(xùn),為更多企業(yè)帶去深度學(xué)習(xí)技術(shù)和經(jīng)驗(yàn)分享。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
-
10 月之暗面,絕地反擊
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?