訂閱
糾錯
加入自媒體

衡量人工智能的現(xiàn)實標(biāo)準(zhǔn)

人類歷史上,每一項新技術(shù)的出現(xiàn),必然會伴隨著各種探討、反思甚至針鋒相對的爭論。面對人工智能這一帶有全局性、革命性的技術(shù)浪潮的逐步興起,人們的興奮、質(zhì)疑以及顧慮就更加多元化。其中有的比較感性,比如討論人工智能會不會代替人類。這其實是在用人工智能與自然智能(Natural Intelligence)進(jìn)行比較。

對于自然智能,有各種各樣的研究和著作,包括有人提出人腦內(nèi)部的機(jī)理其實是量子計算。對于人工智能,目前還沒有一個大家都能夠接受的定義。在這個階段,沒有必要去過分追求哪個標(biāo)準(zhǔn)定義比較正確。我們不妨務(wù)實地來討論:現(xiàn)在的技術(shù)能允許我們做出什么樣的智能體系。

有兩種類型的計算系統(tǒng)被人類叫作人工智能。

第一種,本質(zhì)上相當(dāng)于“智能計算系統(tǒng)”(ICS)的子系統(tǒng)框架。它將數(shù)據(jù)作為輸入,從數(shù)據(jù)中提取信息并建立模型,將我們關(guān)心的某些現(xiàn)象轉(zhuǎn)化為知識。我們稱這種類型的人工智能系統(tǒng)為“通用智能系統(tǒng)”(General AI),并定義“通用智能”的意思是一臺機(jī)器獲取知識和實現(xiàn)目標(biāo)的能力。

第二種,指具有類似人類的認(rèn)知能力,能感知(“看”“聽”“感覺”),它們可以越來越多地推理和計劃,它們可以用感覺運動控制移動。我們稱這種類型的人工智能系統(tǒng)為“認(rèn)知智能系統(tǒng)”(Cognitive AI),是具有感知、推理、規(guī)劃和感覺運動控制能力的機(jī)器。

人工智能系統(tǒng)的另一個二分法是“狹義AI”(Narrow AI)和“廣義AI”(Strong AI)!皬V義AI”是使用相同的算法來解決一大類問題的系統(tǒng)。原則上,“廣義AI”系統(tǒng)可以學(xué)習(xí)和適應(yīng)以解決新的問題,而無須人為干預(yù)!蔼M義AI”系統(tǒng)使用特定算法來解決特定問題,如下棋、識圖等。

總而言之,表1是對人工智能系統(tǒng)狀態(tài)的概述,并且是一個務(wù)實和可行的定義。

表1 人工智能系統(tǒng)狀態(tài)

通用人工智能系統(tǒng)的核心能力就是通過運用算法、計算體系,把知識從數(shù)據(jù)里提取出來。一旦有了知識,我們就可以做很多事情。我們可以預(yù)測,可以解決自動化問題,可以解決任何需要解決的問題。因為知識告訴我們?nèi)擞惺裁葱枨,社會有什么要求,有了知識我們就可以找到答案。所以,人工智能發(fā)展的第一個層次就是通用人工智能。

最近幾年深度學(xué)習(xí)的突破主要是在感知層面,特別是視覺和語音識別,還有自然語言的理解。但這只是起步,接下來要做的是認(rèn)知上的,因為感知只是把外部世界通過光感、聲音的振動,或者語言的交流,變成可以被系統(tǒng)識別的符號。最重要的還是理解它的意義是什么。系統(tǒng)看到一幅圖片,可以知道有什么樣的物體或人在里面,他們在做什么事情。

目前幾乎所有能見到的做人工智能的公司可以分別放在四個象限里面。大部分公司做的其實是“狹義AI”!蔼M義AI”只解決一個問題,或者解決一個到兩個比較窄的問題,下圍棋、打牌或者開汽車都是“狹義AI”。與之相對應(yīng),“廣義AI”用同樣一個系統(tǒng),可以解決所有的問題,那就與人的智能類似了。“廣義AI”是人工智能發(fā)展的長期目標(biāo),其真正實現(xiàn)至少還需要二三十年的時間。

現(xiàn)在,百度、谷歌、微軟、臉書等公司都在朝著“廣義AI”的方向努力。判斷人工智能的能力,或者判別是否真正是人工智能的標(biāo)準(zhǔn)仍然是,人類是否因此知道更多,做到更多,體驗更多。比如,百度基于海量的搜索數(shù)據(jù)做的很多技術(shù)分析,以前靠人去做幾乎不可能,而現(xiàn)在通過人工智能計算技術(shù),我們得出了許許多多前所未有的知識和結(jié)論,人類因此而知道更多,也能因此去做很多前所未有的判斷,去實現(xiàn)更多不可能的功業(yè)。如具有代表性的無人駕駛技術(shù)、自然語言交互技術(shù),使得人類的運動方式、感官方式都在逐漸發(fā)生變化。以前人類用眼睛來看、用耳朵來聽,以后我們可能不需要眼睛也可以看到,不需要耳朵也能聽到,人類將逐步擁有新的感知方式,也將體驗嶄新的世界。

因此,一切做人工智能的公司是否名副其實,都可以從以上角度來衡量:它屬于四個象限中的哪一塊?有沒有實力讓人類和機(jī)器一起知道更多,做到更多,體驗更多?

美國和中國都有很多公司說自己是人工智能公司。有的公司說云計算是人工智能,有的說大數(shù)據(jù)是人工智能,但這些都只是人工智能系統(tǒng)的一部分,最終判斷人工智能實力的是大數(shù)據(jù)、云計算、算法、訓(xùn)練時間及其總投入以及軟硬件綜合實力等。

這種實力不是一蹴而就的,也無法一概而論。地上本沒有路,在披荊斬棘的道路上有不同的角色,也有不同的站點,每個人、每個企業(yè)達(dá)到的程度都不一樣。有人剛起步,有人身后已經(jīng)留下大片果實。

百度大腦可以看作人工智能綜合實力的一個典型,對它的能力分解,能使我們更明晰人工智能行業(yè)的入門門檻及基本標(biāo)準(zhǔn)。如果一家號稱人工智能的公司以下能力皆不具備,那只能說這家公司還沒準(zhǔn)備好真正進(jìn)入這個領(lǐng)域。

百度大腦是硬件基礎(chǔ)、數(shù)據(jù)基礎(chǔ)和算法能力的緊密結(jié)合,是云計算、大數(shù)據(jù)和人工智能的三位一體,是百度技術(shù)戰(zhàn)略的核心。云計算是基礎(chǔ)設(shè)施、大數(shù)據(jù)是燃料、人工智能是發(fā)動機(jī),聯(lián)合驅(qū)動著“互聯(lián)網(wǎng)的物理化”,將數(shù)字世界的互聯(lián)網(wǎng)技術(shù)和商業(yè)模式又送回到物理世界,全面改變社會。

云計算,名字在云端,卻是百度大腦最底層、最實體的部分,是IaaS(Infrastructure as a Service,基礎(chǔ)設(shè)施服務(wù))。

百度大腦的超強(qiáng)計算能力就來源于這一層,是高性能計算硬件的集團(tuán)軍。這個集團(tuán)軍擁有數(shù)十萬臺服務(wù)器,并且采用先進(jìn)的集群操作系統(tǒng)來統(tǒng)一管理,堪稱人工智能超級計算機(jī)。

為了深度學(xué)習(xí)訓(xùn)練的需要,百度自主研發(fā)了GPU和FPGA(現(xiàn)場可編程門陳列)異構(gòu)計算服務(wù)器,單機(jī)可擴(kuò)展至64塊GPU/FPGA卡,對比傳統(tǒng)服

務(wù)器密度提升16倍,一臺服務(wù)器即可完成千億數(shù)據(jù)模型訓(xùn)練;百度開創(chuàng)性地研制了基于FPGA的人工智能處理器,提供10Tops的計算性能,相對主流的20核服務(wù)器,計算效率提升60倍,在人工智能和大數(shù)據(jù)應(yīng)用上,可以達(dá)到普通服務(wù)器4~8倍的性能。

但百度的優(yōu)勢不只是單臺機(jī)器的優(yōu)秀,更在于優(yōu)良的系統(tǒng),優(yōu)秀個體的集成形成強(qiáng)大的總體作戰(zhàn)能力。針對GPU集群的智能調(diào)度和資源管理系統(tǒng),可以實現(xiàn)計算、存儲和網(wǎng)絡(luò)資源的池化管理和動態(tài)調(diào)度,計算集群整體效率和平均使用率達(dá)到80%。將異構(gòu)硬件用于線上產(chǎn)品,用戶請求時延降至1/5,計算效率提升數(shù)十倍。

這個系統(tǒng)涵蓋了國內(nèi)最大的GPU/FPGA集群(全新的芯片技術(shù)),最大的HADOOP/SPARK集群(全新的并發(fā)數(shù)據(jù)處理技術(shù))和運營效率最高的數(shù)據(jù)中心[全新的異構(gòu)計算技術(shù)、整機(jī)柜服務(wù)器技術(shù)、100G RDMA(遠(yuǎn)程直接數(shù)據(jù)存。┩ㄐ偶夹g(shù)和運維技術(shù)],可謂馬力十足,提供了開發(fā)人工智能所需的計算能力。

它同樣燃料充足;诙嗄攴⻊(wù)于大規(guī)模業(yè)務(wù),比如通過搜索和視頻技術(shù),百度積累了大量的數(shù)據(jù):萬億級網(wǎng)頁數(shù)據(jù),數(shù)十億次搜索數(shù)據(jù),百億級視頻、圖像和語音數(shù)據(jù),百億級定位數(shù)據(jù)等。數(shù)據(jù)就是人工智能算法的燃料,是發(fā)展人工智能的又一基礎(chǔ)條件。

讓硬件與燃料結(jié)合的是優(yōu)秀的算法和模型。百度匯聚了全球頂級科學(xué)家和工程師,在理論和實踐方面持續(xù)創(chuàng)新,搭建了全球最大的深度神經(jīng)網(wǎng)絡(luò),支持萬億級參數(shù)、千億級樣本、千億級特征訓(xùn)練,神經(jīng)網(wǎng)絡(luò)層數(shù)遠(yuǎn)遠(yuǎn)突破100層。

硬件動力、數(shù)據(jù)燃料和算法靈魂的結(jié)合,才產(chǎn)生出百度的PaaS(Platform as a Service,平臺服務(wù))。百度PaaS與眾不同之處在于,人工智能作為一種橫向的服務(wù)貫穿全平臺。通過深度學(xué)習(xí)和機(jī)器學(xué)習(xí)技術(shù),結(jié)合超強(qiáng)計算、海量數(shù)據(jù)和優(yōu)秀算法,在語音、圖像、自然語言處理等方面擁有杰出的能力,打造出獨特的知識圖譜、用戶畫像和商業(yè)邏輯,并且向用戶全面開放。用戶可以非常方便地使用各種算法模塊、開發(fā)工具、數(shù)據(jù)引擎為自身的商業(yè)目的服務(wù)。我們形象地把不同的平臺稱作天算、天像和天工,分別針對智能大數(shù)據(jù)、智能多媒體和智能物聯(lián)網(wǎng)這三個領(lǐng)域提供服務(wù)。

在最上層的SaaS(Software as a Service,軟件服務(wù)),百度的人工智能很容易凝結(jié)成許多垂直行業(yè)解決方案,滲透到各行各業(yè)。但我們更追求與合作伙伴一起打造智能產(chǎn)業(yè)生態(tài),例如教育云、金融云、交通云、物流云等。我們認(rèn)為,對智能產(chǎn)業(yè)生態(tài)的構(gòu)建能力也是判定人工智能價值的重要標(biāo)準(zhǔn)。

在硬件、數(shù)據(jù)、算法之上還有一個重要的衡量標(biāo)準(zhǔn),那就是人工智能企業(yè)的文化,即人工智能企業(yè)的“軟實力”。搜索技術(shù)是人工智能的先驅(qū),也是最早的互聯(lián)網(wǎng)數(shù)字化世界的門戶,其開發(fā)流程和技術(shù)核心為未來的人工智能奠定了基礎(chǔ)。首先,搜索引擎必須與很大規(guī)模的數(shù)據(jù)打交道;其次,搜索引擎必須同時有大規(guī)模的機(jī)器學(xué)習(xí),人工來做是不可能的事,因為數(shù)據(jù)規(guī)模太大了;最后,也是最根本的一點,搜索引擎的開發(fā)流程和工程開發(fā)文化與人工智能系統(tǒng)的開發(fā)是非常吻合的,都以數(shù)據(jù)為主,通過抽取其中的特征、模式,然后用這個模式給用戶帶來價值。人們在搜索業(yè)務(wù)中結(jié)成的協(xié)作關(guān)系,形成的業(yè)務(wù)能力和工作習(xí)慣,都很適合人工智能業(yè)務(wù)發(fā)展,與海量數(shù)據(jù)一樣,積淀為人工智能企業(yè)的文化。所以陸奇在微軟的做法是,培養(yǎng)人才先從Bing開始。你做過Bing,你到其他什么部門都可以做,那些技術(shù)在搜索看來都是很簡單的技術(shù)。這個文化當(dāng)然并不完美,但正如神經(jīng)網(wǎng)絡(luò)一樣,可以在正確的方法指引下不斷發(fā)展完善。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號