平安金融壹賬通獲機(jī)器閱讀理解頂級(jí)賽事(SQuAD)世界第一
平安金融壹賬通又有重大突破!繼在人類情緒理解競(jìng)賽多次登頂之后, 平安金融壹賬通Gamma Lab又在另一項(xiàng)國(guó)際頂級(jí)賽事上斬獲第一。近日,在由斯坦福大學(xué)發(fā)起的機(jī)器閱讀理解競(jìng)賽(Stanford Question Answering Dataset,SQuAD)中,平安金融壹賬通以領(lǐng)先的技術(shù)脫穎而出,位列榜單第一位。
SQuAD被譽(yù)為自然語言處理領(lǐng)域金字塔尖的比賽,旨在促進(jìn)智能搜索引擎的發(fā)展。該賽事吸引了來自谷歌、微軟亞研院、阿里達(dá)摩院、科大訊飛、IBM以及復(fù)旦大學(xué)等最頂尖的企業(yè)及學(xué)校的激烈角逐。平安金融壹賬通Gamma Lab以集成模型EM=83.435%、F1=85.992%和單模型EM=81.347%、F1:84.560%分別位列集成模型和單模型世界第一。
SQuAD機(jī)器閱讀理解競(jìng)賽,是讓機(jī)器閱讀一篇文章,然后回答關(guān)于這篇文章的任何問題,旨在推動(dòng)智能搜索的發(fā)展。2016年,斯坦福大學(xué)從維基百科上隨機(jī)選取了500多篇文章,并進(jìn)一步細(xì)分成兩萬多個(gè)段落。隨后采用眾包的方式,由人類閱讀這些文章后,為每個(gè)段落提出五個(gè)問題,并對(duì)段落內(nèi)的答案進(jìn)行人工標(biāo)注,搭建了該項(xiàng)競(jìng)賽的數(shù)據(jù)集1.1。今年6月3日,斯坦福NLP團(tuán)隊(duì)對(duì)外宣稱, 機(jī)器閱讀理解數(shù)據(jù)集1.1完成一波更新,已搭建完成SQuAD 2.0。相較于SQuAD 1.1中的10萬問答,SQuAD 2.0又新增了5萬個(gè)人類撰寫的問題,而且問題不一定有對(duì)應(yīng)答案。參考下圖:
在SQuAD1.1數(shù)據(jù)集當(dāng)中,閱讀理解的主要難點(diǎn)是上下文的語義理解。所提問題的答案并不能靠簡(jiǎn)單的近鄰或相似度對(duì)答案進(jìn)行匹配,而是需要通過NLP的語義分析,在考慮前后文信息后從全文中尋找到最合適的答案位置。想要做好這一點(diǎn),需要算法能力達(dá)到人類閱讀理解的思考水平。在此基礎(chǔ)上,SQuAD2.0中新增的無答案的混淆問題進(jìn)一步提升了該任務(wù)的難度。一個(gè)問題所對(duì)應(yīng)的段落中有一定概率不存在正確結(jié)果,即要算法判斷是否能夠回答,并在此基礎(chǔ)上準(zhǔn)確回答問題?梢哉fSQuAD數(shù)據(jù)集2.0的任務(wù)在不斷逼近人類閱讀理解的思考方式,同時(shí)也大幅提高了競(jìng)賽的難度。金融壹賬通Gamma Lab在本次競(jìng)賽中所獲得的成績(jī),已經(jīng)非常接近人類水平,體現(xiàn)了世界最高水平的智能搜索能力。
早在今年年初,平安金融壹賬通就已經(jīng)謀劃布局基于機(jī)器閱讀理解技術(shù)的商業(yè)落地其,自主研發(fā)的AskBob智能搜索框架,使用了最先進(jìn)的機(jī)器閱讀理解技術(shù),覆蓋了醫(yī)療、銀行、保險(xiǎn)、投資等各大金融垂直領(lǐng)域,為知識(shí)密集型行業(yè)提供更高效更智能的搜索解決方案,極大提高了從業(yè)人員的工作效率。不僅如此, Gamma Lab還推出了一款智能音箱——Gamma智能銷售助手,也搭載了最新的機(jī)器閱讀理解技術(shù), 無需任何人工干預(yù),上傳一篇保險(xiǎn)文檔,即可進(jìn)行任何問題的語音交互問答。閱讀理解模塊只需秒級(jí)即可完成文檔的理解,問答準(zhǔn)確率為91.35%,平均業(yè)務(wù)時(shí)間可縮短30%。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?