av和黑人在线播放,国产美女高潮抽搐在线播放,亚洲色成人网站WWW永久

看IBM的AI辯論家項目（Project Debater）有多可怕

2019-04-10 10:13

IBM的辯論家項目（Project Debater）打造了一個對話類AI，旨在和一個人類辯手進(jìn)行正式辯論。盡管Project Debater在最后一場辯論中落敗于人類辯手，但是在這次失敗之前，它一直霸占著最佳辯手的位置。它的亮點很多，而且確鑿無疑地進(jìn)入了自然語言處理（NLP）系統(tǒng)的“恐怖谷”，它的表現(xiàn)非常接近人類，它的失誤水準(zhǔn)令人尷尬。

IBM這個項目的亮點在于，它是在一系列舊硬件上訓(xùn)練并交付“辯論家”的，并沒有使用GPU等硬件加速器。鑒于現(xiàn)在市場上已經(jīng)存在很多可用的深度學(xué)習(xí)硬件加速器，所以“辯論家”的會話AI功能肯定會在未來的幾年內(nèi)具有很大的提升空間。當(dāng)然，這也可能會加劇社會不滿，因為人們越來越搞不清楚他們是在和人類交談還是和人工智能對話。

“辯論家”項目的初始提案脫胎于2011年出現(xiàn)的單個PPT幻燈片。由于提交內(nèi)容有限，而且挑戰(zhàn)項目的難度比較大，IBM管理層經(jīng)過了大約一年的仔細(xì)考慮時間才最終批準(zhǔn)了該項目。2012年，IBM研究院建立了一個項目團(tuán)隊，正式啟動“辯論家”項目開發(fā)。實際上，該項目的實質(zhì)性工作時在2014年展開的。

怎么訓(xùn)練一組深度學(xué)習(xí)模型，使它可以進(jìn)行辯論呢？要知道，展開一場辯論要比進(jìn)行一次簡單的采訪復(fù)雜多了。IBM研究院將這項訓(xùn)練任務(wù)劃分成了三個子任務(wù)：聽力理解、建模人類的爭論、由數(shù)據(jù)驅(qū)動的演講稿生成和表達(dá)。

聽力理解

IBM將聽力理解定義為“從一長串連續(xù)的口語中提取隱藏在其中的關(guān)鍵概念和聲明的能力”。IBM教“辯論家”針對隨機(jī)選擇的主題進(jìn)行辯論，但是它的前提是，所選主題必須涵蓋在在系統(tǒng)里面多達(dá)4億篇文章（100億句話）中得到過充分報道的話題中，其中大部分文章來自于知名報紙和雜志。

“辯論家”實現(xiàn)高水平聽力理解能力的一個關(guān)鍵要素是它的聲明檢測引擎。該聲明檢測引擎能夠在一個句子中找到個別聲明的確切邊界（如果給定的句子里確實給出過聲明的話。IBM的聲明檢測引擎中有三個級聯(lián)的深度學(xué)習(xí)模型：

1、查找?guī)в新暶鞯木渥樱?/p>

2、在該句子中找到聲明的邊界；

3、確定存在聲明和已經(jīng)找到合適的聲明邊界的可信度。

建模人類的爭論

IBM創(chuàng)建了所謂的“獨特知識圖表”，以幫助“辯論家”模擬人類爭論和面臨困境的世界。一旦給“辯論家”提供了一個辯論主題，它就會在其知識圖表中展開搜索，尋找最為相關(guān)的原則論據(jù)來支持或者反對這項主題。知識圖表模型使得“辯論家”可以建模出許多不同辯論之間的共性。

數(shù)據(jù)驅(qū)動的演講稿生成和表達(dá)

“辯論家”從知識圖表中找出相關(guān)論據(jù)后，將所選擇的這些論點組合成一個帶有說服性的完整敘述，這些論述的長短符合為其分配的發(fā)言時間。然后，它會寫出一個演講稿，并在適當(dāng)?shù)臅r候清晰地、針對性地（也可以加入一些幽默成分）表達(dá)出來。

IBM強(qiáng)調(diào)，自然語言處理中的演講稿生成和表達(dá)是“辯論家”的顯著特征。不過，我們相信，理解人類的言語才將是將AI限制在不可思議的“恐怖谷”中或者超越它的關(guān)鍵技術(shù)。

請注意，OpenAI的文本預(yù)測模型在某一個方面和IBM的“辯論家”執(zhí)行了相似的角色，它們都寫了文稿，不過它們也有一定的區(qū)別。OpenAI的所有新聞報道都是以完成為目的，“辯論家”則是支持或反駁某個觀點，此外，OpenAI沒有正式辯論賽的時間限制。

復(fù)雜的模型集合

IBM研究院表示，“辯論家”由數(shù)十種深度學(xué)習(xí)和機(jī)器學(xué)習(xí)模型組成，具體數(shù)量取決于對模型的分類和計算方式。他們表示，在辯論期間使用的模型總數(shù)遠(yuǎn)遠(yuǎn)低于100個。

“辯論家”的開發(fā)遇到了機(jī)器學(xué)習(xí)領(lǐng)域的經(jīng)典挑戰(zhàn)。由于需要把那么多基礎(chǔ)底層的AI模型編排組合在一起，集合的復(fù)雜性增加了。每個AI模型都要經(jīng)過經(jīng)過自己的訓(xùn)練過程，許多模型使用的配置和設(shè)置方法都各自不同。一些模型使用監(jiān)督式學(xué)習(xí)技術(shù)，其它模型使用無監(jiān)督學(xué)習(xí)技術(shù)。IBM研究院沒有談到訓(xùn)練所有這些模型累計花費了多少時間。

“辯論家”項目的大部分研究和開發(fā)工作都是在IBM研究院位于以色列海法的實驗室中完成的。IBM表示，為了訓(xùn)練“辯論家”，IBM通過其平臺負(fù)載共享設(shè)施（LSF）軟件協(xié)調(diào)調(diào)用了10臺聯(lián)想系統(tǒng)x3650 M5服務(wù)器。在研究的過程中，IBM研究院還在海法使用了一個GPFS集群進(jìn)行數(shù)據(jù)存儲。該本地存儲運行在一個雙節(jié)點的IBM頻譜可視化（SVC）集群上，使用了IBM的SAN64B－6存儲網(wǎng)絡(luò)。

IBM還沒有公開討論他們在訓(xùn)練“辯論家”模型時使用的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)框架。IBM曾經(jīng)表示，一旦可以把這項技術(shù)商業(yè)化到可以供客戶使用的程度，他們將發(fā)布更多的軟件和硬件細(xì)節(jié)信息。

需要注意的是，訓(xùn)練“辯論家”的復(fù)雜模型集合的工作時是在四分之一個未加速的x86服務(wù)器機(jī)架上進(jìn)行的，該服務(wù)器機(jī)架包含了大約200個處理器內(nèi)核。這也表明，人工智能研究通常并不需要使用最新最好的硬件，技術(shù)上的創(chuàng)新和研發(fā)時間可以抵消大部分巨額預(yù)算。

“辯論家”的復(fù)雜性－對辯論的重新審視

“辯論家”的反駁論據(jù)是由獨立的深度學(xué)習(xí)模型創(chuàng)建出來的，而不是在辯論中創(chuàng)建出這種開放性的論點。在這個完整的反駁論據(jù)集合中會用到幾種模型。反駁論證系統(tǒng)通常是一個比創(chuàng)建開放性論據(jù)使用的模型集合更長的級聯(lián)模型。

“辯論家”會為辯論雙方都實施聲明檢測。這使得系統(tǒng)能夠自動構(gòu)建出兩組論據(jù)，并確定辯論對手可能會使用那些論據(jù)聲明。然后，系統(tǒng)會在辯論期間交叉性地檢查對手可能使用的聲明和實際使用的聲明。下面是該流程的一部分說明：

確定每個聲明是否反對或者支持“辯論家”當(dāng)前的觀點；

確定對手是否在最近的反駁中使用了任何自動檢測到的聲明；

尋找論據(jù)來反駁對手已經(jīng)表達(dá)過的聲明主張；

找到支持自己當(dāng)前論點的證據(jù)；

將這些證據(jù)進(jìn)一步整合成表達(dá)正確且有說服力的陳述中；

確定是否已經(jīng)在辯論的早期階段聲明了某個論據(jù)。

1 2 下一頁>