訂閱
糾錯
加入自媒體

語義理解核心技術(shù)揭秘 百度AI快車道第五期開營

2019-08-07 09:33
AI銳見
關(guān)注

在這個日新月異的時代,人工智能被視為第四次工業(yè)革命的核心驅(qū)動力。而深度學(xué)習(xí)技術(shù)的興起正推動著人工智能進入工業(yè)大生產(chǎn)階段,為人類創(chuàng)造更大的價值。

早在2016年的百度世界大會上,百度宣布飛槳(PaddlePaddle)開源,這標(biāo)志著國內(nèi)首個也是目前唯一一個開源開放、功能完備的端到端深度學(xué)習(xí)平臺的誕生。飛槳是集核心框架、工具組件和服務(wù)平臺為一體的端到端開源深度學(xué)習(xí)平臺。在飛槳的服務(wù)平臺層面,還有一個定制化訓(xùn)練和服務(wù)平臺EasyDL,它的目標(biāo),就是讓零算法基礎(chǔ)的用戶,也可以基于自身業(yè)務(wù)需求和數(shù)據(jù),快速訓(xùn)練專屬的定制化AI模型。

語義理解核心技術(shù)揭秘 百度AI快車道第五期開營

圖:百度飛槳全景圖

飛槳核心框架層開放了開發(fā)、訓(xùn)練、預(yù)測的一整套能力,并開源70多個經(jīng)過真實業(yè)務(wù)場景驗證的官方模型,包括視覺、自然語言、推薦等幾大核心技術(shù)領(lǐng)域。面向工業(yè)應(yīng)用的中文NLP工具集——飛槳自然語言處理模型庫(PaddleNLP),將自然語言處理領(lǐng)域的多種模型在任務(wù)層用一套共享骨架代碼實現(xiàn),網(wǎng)絡(luò)使用更加靈活。飛槳模型庫推出了在中文NLP任務(wù)上表現(xiàn)全面領(lǐng)先的中文語義理解模型——ERNIE,大幅增強了模型語義表示能力,在實際應(yīng)用中效果顯著。飛槳提供的視頻識別工具集,則覆蓋了主流實用的序列建模算法與端到端視頻識別模型,為開發(fā)者提供解決視頻分類、視頻定位等一系列應(yīng)用技術(shù)方案。

基于飛槳的顯著優(yōu)勢和強大的功能,百度組織開展了AI快車道——企業(yè)深度學(xué)習(xí)實戰(zhàn)營,相繼在北京和上海舉辦了“圖像檢索”、“目標(biāo)檢測”、“推薦系統(tǒng)”等專題課程,邀請到百度大腦技術(shù)生態(tài)和深度學(xué)習(xí)平臺的資深研發(fā)人員來分享百度深度學(xué)習(xí)的研究和應(yīng)用之路,干貨滿滿,卓有啟迪,讓大家親身感受到了深度學(xué)習(xí)實戰(zhàn)技能的重要性。如今實戰(zhàn)營已經(jīng)開展到第五期。此次實戰(zhàn)營就“語義理解”專題進行了講解與實踐,眾多開發(fā)者深度參與相關(guān)技術(shù)方面的交流實踐活動。

語義理解核心技術(shù)揭秘 百度AI快車道第五期開營

圖:百度AI快車道——“語義理解”專場

如果把人工智能的核心看作是認知,那么認知的核心技術(shù)之一就是“語義理解”。百度的語義理解技術(shù)既包含靈活通用、多層次的語義建模,也有特定任務(wù)上的語義適配。

近年來,利用大規(guī)模無監(jiān)督語料訓(xùn)練得到通用語義來表示預(yù)訓(xùn)練模型,并在特定任務(wù)上進行參數(shù)微調(diào),已經(jīng)取得了遠超SOTA的效果。這種基于預(yù)訓(xùn)練的語義理解技術(shù)正受到越來越多的關(guān)注。

在AI快車道的交流學(xué)習(xí)中,百度大腦技術(shù)生態(tài)和自然語言處理部的資深研發(fā)人員首先針對飛槳全景進行了介紹,隨后圍繞著“語義理解”介紹了NLP的發(fā)展現(xiàn)狀和過往模型情況,并分享了百度飛槳(PaddlePaddle)ERNIE模型。

據(jù)介紹,ERNIE是由百度自主開發(fā)的知識增強語義理解模型。該模型可通過對詞、實體等語義單元的掩碼,使得模型學(xué)習(xí)完整概念的語義表示,學(xué)習(xí)真實世界的語義關(guān)系,解決了其他模型“主要聚焦在原始語言信號上,較少利用語義知識單元建!钡膯栴}。

語義理解核心技術(shù)揭秘 百度AI快車道第五期開營

比如,在“哈爾濱是黑龍江的省會,國際冰雪文化名城”這句話中, 谷歌的BERT 模型通過『哈』與『濱』的局部共現(xiàn),就可判斷出『爾』字,但模型并沒有學(xué)習(xí)與『哈爾濱』相關(guān)的知識。而百度的ERNIE 通過學(xué)習(xí)詞與實體的表達,使模型能夠建模出『哈爾濱』與『黑龍江』的關(guān)系,可學(xué)到『哈爾濱』是 『黑龍江』的省會以及『哈爾濱』是個冰雪城市,從而增強了機器對于人類語言的理解。

活動現(xiàn)場,眾企業(yè)學(xué)員們積極互動。其中一位來自醫(yī)療相關(guān)領(lǐng)域的學(xué)員表示,目前他所在的工作領(lǐng)域已經(jīng)運用了NLP語義理解技術(shù),并有計劃將飛槳框架運用到自己的實際業(yè)務(wù)中,此外還針對相關(guān)技術(shù)與講師進行了問答探討。

當(dāng)天的AI快車道的學(xué)習(xí)活動,還安排了具有挑戰(zhàn)性的實踐課,并以“訓(xùn)練業(yè)界領(lǐng)先的情感分類模型”為任務(wù)。在現(xiàn)場,眾學(xué)員在指導(dǎo)下都完成了實操挑戰(zhàn),紛紛表示當(dāng)天的課程“體驗的技術(shù)非常先進,干貨滿滿”。其中一位學(xué)員接受采訪時稱“來之前就知道百度是中文領(lǐng)域內(nèi)自然語言處理的領(lǐng)頭企業(yè),現(xiàn)在看果然不虛此行”。

語義理解核心技術(shù)揭秘 百度AI快車道第五期開營

圖:百度AI快車道第五期導(dǎo)師指導(dǎo)學(xué)員進行實踐操作

百度 AI 快車道企業(yè)深度學(xué)習(xí)實戰(zhàn)營是一個面向有 AI 技術(shù)需求企業(yè)的算法工程師、架構(gòu)師群體提供的快速應(yīng)用扶持計劃。依托百度自身深厚的深度學(xué)習(xí)技術(shù)實踐經(jīng)驗,為其他企業(yè)提供幫助。

該計劃的學(xué)習(xí)內(nèi)容囊括了 6 套工程實施與深度學(xué)習(xí)技術(shù)落地結(jié)合的詳細方案,覆蓋百度領(lǐng)先的 AI 技術(shù)和業(yè)務(wù)應(yīng)用場景的深入剖析,如 OCR、精密儀器質(zhì)檢、推薦排序經(jīng)典場景、遙感圖像處理等;诎俣壬疃葘W(xué)習(xí)框架飛槳的性能優(yōu)勢、模型優(yōu)勢、生態(tài)優(yōu)勢的解讀;百度自研和頂級學(xué)術(shù)會議魁首算法、預(yù)訓(xùn)練模型的詳細介紹,還有與案例和算法緊密相扣的在線實驗,以“短平快”的課程,進行業(yè)務(wù)問題定位、框架及算法的快速應(yīng)用培訓(xùn),為更多企業(yè)帶去深度學(xué)習(xí)技術(shù)和經(jīng)驗分享。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號