看IBM的AI辯論家項(xiàng)目(Project Debater)有多可怕
IBM的辯論家項(xiàng)目(Project Debater)打造了一個(gè)對(duì)話(huà)類(lèi)AI,旨在和一個(gè)人類(lèi)辯手進(jìn)行正式辯論。盡管Project Debater在最后一場(chǎng)辯論中落敗于人類(lèi)辯手,但是在這次失敗之前,它一直霸占著最佳辯手的位置。它的亮點(diǎn)很多,而且確鑿無(wú)疑地進(jìn)入了自然語(yǔ)言處理(NLP)系統(tǒng)的“恐怖谷”,它的表現(xiàn)非常接近人類(lèi),它的失誤水準(zhǔn)令人尷尬。
IBM這個(gè)項(xiàng)目的亮點(diǎn)在于,它是在一系列舊硬件上訓(xùn)練并交付“辯論家”的,并沒(méi)有使用GPU等硬件加速器。鑒于現(xiàn)在市場(chǎng)上已經(jīng)存在很多可用的深度學(xué)習(xí)硬件加速器,所以“辯論家”的會(huì)話(huà)AI功能肯定會(huì)在未來(lái)的幾年內(nèi)具有很大的提升空間。當(dāng)然,這也可能會(huì)加劇社會(huì)不滿(mǎn),因?yàn)槿藗冊(cè)絹?lái)越搞不清楚他們是在和人類(lèi)交談還是和人工智能對(duì)話(huà)。
“辯論家”項(xiàng)目的初始提案脫胎于2011年出現(xiàn)的單個(gè)PPT幻燈片。由于提交內(nèi)容有限,而且挑戰(zhàn)項(xiàng)目的難度比較大,IBM管理層經(jīng)過(guò)了大約一年的仔細(xì)考慮時(shí)間才最終批準(zhǔn)了該項(xiàng)目。2012年,IBM研究院建立了一個(gè)項(xiàng)目團(tuán)隊(duì),正式啟動(dòng)“辯論家”項(xiàng)目開(kāi)發(fā)。實(shí)際上,該項(xiàng)目的實(shí)質(zhì)性工作時(shí)在2014年展開(kāi)的。
怎么訓(xùn)練一組深度學(xué)習(xí)模型,使它可以進(jìn)行辯論呢?要知道,展開(kāi)一場(chǎng)辯論要比進(jìn)行一次簡(jiǎn)單的采訪(fǎng)復(fù)雜多了。IBM研究院將這項(xiàng)訓(xùn)練任務(wù)劃分成了三個(gè)子任務(wù):聽(tīng)力理解、建模人類(lèi)的爭(zhēng)論、由數(shù)據(jù)驅(qū)動(dòng)的演講稿生成和表達(dá)。
聽(tīng)力理解
IBM將聽(tīng)力理解定義為“從一長(zhǎng)串連續(xù)的口語(yǔ)中提取隱藏在其中的關(guān)鍵概念和聲明的能力”。IBM教“辯論家”針對(duì)隨機(jī)選擇的主題進(jìn)行辯論,但是它的前提是,所選主題必須涵蓋在在系統(tǒng)里面多達(dá)4億篇文章(100億句話(huà))中得到過(guò)充分報(bào)道的話(huà)題中,其中大部分文章來(lái)自于知名報(bào)紙和雜志。
“辯論家”實(shí)現(xiàn)高水平聽(tīng)力理解能力的一個(gè)關(guān)鍵要素是它的聲明檢測(cè)引擎。該聲明檢測(cè)引擎能夠在一個(gè)句子中找到個(gè)別聲明的確切邊界(如果給定的句子里確實(shí)給出過(guò)聲明的話(huà)。IBM的聲明檢測(cè)引擎中有三個(gè)級(jí)聯(lián)的深度學(xué)習(xí)模型:
1、查找?guī)в新暶鞯木渥樱?/p>
2、在該句子中找到聲明的邊界;
3、確定存在聲明和已經(jīng)找到合適的聲明邊界的可信度。
建模人類(lèi)的爭(zhēng)論
IBM創(chuàng)建了所謂的“獨(dú)特知識(shí)圖表”,以幫助“辯論家”模擬人類(lèi)爭(zhēng)論和面臨困境的世界。一旦給“辯論家”提供了一個(gè)辯論主題,它就會(huì)在其知識(shí)圖表中展開(kāi)搜索,尋找最為相關(guān)的原則論據(jù)來(lái)支持或者反對(duì)這項(xiàng)主題。知識(shí)圖表模型使得“辯論家”可以建模出許多不同辯論之間的共性。
數(shù)據(jù)驅(qū)動(dòng)的演講稿生成和表達(dá)
“辯論家”從知識(shí)圖表中找出相關(guān)論據(jù)后,將所選擇的這些論點(diǎn)組合成一個(gè)帶有說(shuō)服性的完整敘述,這些論述的長(zhǎng)短符合為其分配的發(fā)言時(shí)間。然后,它會(huì)寫(xiě)出一個(gè)演講稿,并在適當(dāng)?shù)臅r(shí)候清晰地、針對(duì)性地(也可以加入一些幽默成分)表達(dá)出來(lái)。
IBM強(qiáng)調(diào),自然語(yǔ)言處理中的演講稿生成和表達(dá)是“辯論家”的顯著特征。不過(guò),我們相信,理解人類(lèi)的言語(yǔ)才將是將AI限制在不可思議的“恐怖谷”中或者超越它的關(guān)鍵技術(shù)。
請(qǐng)注意,OpenAI的文本預(yù)測(cè)模型在某一個(gè)方面和IBM的“辯論家”執(zhí)行了相似的角色,它們都寫(xiě)了文稿,不過(guò)它們也有一定的區(qū)別。OpenAI的所有新聞報(bào)道都是以完成為目的,“辯論家”則是支持或反駁某個(gè)觀(guān)點(diǎn),此外,OpenAI沒(méi)有正式辯論賽的時(shí)間限制。
復(fù)雜的模型集合
IBM研究院表示,“辯論家”由數(shù)十種深度學(xué)習(xí)和機(jī)器學(xué)習(xí)模型組成,具體數(shù)量取決于對(duì)模型的分類(lèi)和計(jì)算方式。他們表示,在辯論期間使用的模型總數(shù)遠(yuǎn)遠(yuǎn)低于100個(gè)。
“辯論家”的開(kāi)發(fā)遇到了機(jī)器學(xué)習(xí)領(lǐng)域的經(jīng)典挑戰(zhàn)。由于需要把那么多基礎(chǔ)底層的AI模型編排組合在一起,集合的復(fù)雜性增加了。每個(gè)AI模型都要經(jīng)過(guò)經(jīng)過(guò)自己的訓(xùn)練過(guò)程,許多模型使用的配置和設(shè)置方法都各自不同。一些模型使用監(jiān)督式學(xué)習(xí)技術(shù),其它模型使用無(wú)監(jiān)督學(xué)習(xí)技術(shù)。IBM研究院沒(méi)有談到訓(xùn)練所有這些模型累計(jì)花費(fèi)了多少時(shí)間。
“辯論家”項(xiàng)目的大部分研究和開(kāi)發(fā)工作都是在IBM研究院位于以色列海法的實(shí)驗(yàn)室中完成的。IBM表示,為了訓(xùn)練“辯論家”,IBM通過(guò)其平臺(tái)負(fù)載共享設(shè)施(LSF)軟件協(xié)調(diào)調(diào)用了10臺(tái)聯(lián)想系統(tǒng)x3650 M5服務(wù)器。在研究的過(guò)程中,IBM研究院還在海法使用了一個(gè)GPFS集群進(jìn)行數(shù)據(jù)存儲(chǔ)。該本地存儲(chǔ)運(yùn)行在一個(gè)雙節(jié)點(diǎn)的IBM頻譜可視化(SVC)集群上,使用了IBM的SAN64B-6存儲(chǔ)網(wǎng)絡(luò)。
IBM還沒(méi)有公開(kāi)討論他們?cè)谟?xùn)練“辯論家”模型時(shí)使用的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)框架。IBM曾經(jīng)表示,一旦可以把這項(xiàng)技術(shù)商業(yè)化到可以供客戶(hù)使用的程度,他們將發(fā)布更多的軟件和硬件細(xì)節(jié)信息。
需要注意的是,訓(xùn)練“辯論家”的復(fù)雜模型集合的工作時(shí)是在四分之一個(gè)未加速的x86服務(wù)器機(jī)架上進(jìn)行的,該服務(wù)器機(jī)架包含了大約200個(gè)處理器內(nèi)核。這也表明,人工智能研究通常并不需要使用最新最好的硬件,技術(shù)上的創(chuàng)新和研發(fā)時(shí)間可以抵消大部分巨額預(yù)算。
“辯論家”的復(fù)雜性-對(duì)辯論的重新審視
“辯論家”的反駁論據(jù)是由獨(dú)立的深度學(xué)習(xí)模型創(chuàng)建出來(lái)的,而不是在辯論中創(chuàng)建出這種開(kāi)放性的論點(diǎn)。在這個(gè)完整的反駁論據(jù)集合中會(huì)用到幾種模型。反駁論證系統(tǒng)通常是一個(gè)比創(chuàng)建開(kāi)放性論據(jù)使用的模型集合更長(zhǎng)的級(jí)聯(lián)模型。
“辯論家”會(huì)為辯論雙方都實(shí)施聲明檢測(cè)。這使得系統(tǒng)能夠自動(dòng)構(gòu)建出兩組論據(jù),并確定辯論對(duì)手可能會(huì)使用那些論據(jù)聲明。然后,系統(tǒng)會(huì)在辯論期間交叉性地檢查對(duì)手可能使用的聲明和實(shí)際使用的聲明。下面是該流程的一部分說(shuō)明:
確定每個(gè)聲明是否反對(duì)或者支持“辯論家”當(dāng)前的觀(guān)點(diǎn);
確定對(duì)手是否在最近的反駁中使用了任何自動(dòng)檢測(cè)到的聲明;
尋找論據(jù)來(lái)反駁對(duì)手已經(jīng)表達(dá)過(guò)的聲明主張;
找到支持自己當(dāng)前論點(diǎn)的證據(jù);
將這些證據(jù)進(jìn)一步整合成表達(dá)正確且有說(shuō)服力的陳述中;
確定是否已經(jīng)在辯論的早期階段聲明了某個(gè)論據(jù)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線(xiàn)會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線(xiàn)下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠(chǎng)展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠(chǎng)紛紛入局,百度、阿里、字節(jié)搶奪Agent話(huà)語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 5 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 6 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠(chǎng)為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷(xiāo)中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單