訂閱
糾錯
加入自媒體

難以“馴服”AI?IBM為企業(yè)提出了這些建議

IBM的研究人員認為,由于概率性編程模式和混亂的數(shù)據(jù),目前AI對企業(yè)而言難以駕馭,日前,IBM的沃森和阿爾馬登研究中心發(fā)布了一篇題目為《刻畫機器學習過程:一個成熟度框架》的論文,提出許多充滿希望的建議,同時也暗示了一個實質(zhì)性的問題:這家藍色巨人是否能提出“馴服”AI這匹野獸的方法使其適用于企業(yè)的軟件生命周期和業(yè)務(wù)流程呢?

IBM研究人員給出的建議是,需要仔細考慮機器學習的多個階段,包括管理者應(yīng)該如何為神經(jīng)網(wǎng)絡(luò)模型“設(shè)定目標”、如何為神經(jīng)網(wǎng)絡(luò)的輸入構(gòu)建數(shù)據(jù)管道(data pipeline)的示例、以及如何不斷迭代和改進AI模型。另外,受管制產(chǎn)業(yè)需要特別注意一些地方,比如數(shù)據(jù)血統(tǒng):所使用的數(shù)據(jù)的“合法性”是什么?

AI對企業(yè)的挑戰(zhàn)在于機器學習編程和傳統(tǒng)軟件編程之間的本質(zhì)區(qū)別:傳統(tǒng)的軟件應(yīng)用程序是確定性的,但機器學習模型是概率性的。另外,使用混雜的數(shù)據(jù)來開發(fā)神經(jīng)網(wǎng)絡(luò),這對企業(yè)而言并不合適。然而,截至目前關(guān)于機器學習建模的學術(shù)文獻并沒有提出如何使機器學習為企業(yè)工作的解決方案。

為了使AI達到適用于企業(yè)的成熟度,IBM的科學家建議將機器學習和大量有關(guān)諸如“應(yīng)用生命周期管理”的文獻保持一致,并擴展此類術(shù)語的含義以適應(yīng)AI的新特性。IBM提出,一個機器學習的生命周期涵蓋了各個階段,企業(yè)必須在持續(xù)基礎(chǔ)上不斷為完成某個階段的工作做好準備。

研究人員借鑒了Watts Humphrey在20世紀80年代對軟件能力成熟度模型(Capability Maturity Model,CMM)的定義,CMM是對軟件組織在定義、實施、度量、控制和改善其軟件過程的實踐中各個發(fā)展階段的描述,其假設(shè)是:只要持續(xù)建立有效的軟件工程過程的基礎(chǔ)結(jié)構(gòu),不斷改進管理的實踐和過程,就可以克服軟件生產(chǎn)中的困難。

這項工作最原始的貢獻是研究人員關(guān)于神經(jīng)網(wǎng)絡(luò)應(yīng)根據(jù)一個特定行業(yè)的特殊性進行開發(fā)的建議,而為了找到AI的業(yè)務(wù)用例,企業(yè)需要定制行業(yè)和領(lǐng)域通用的機器學習模型,并針對特殊的情況提供特殊的數(shù)據(jù)。

顯然,IBM正在試圖解決一個棘手的問題,事實上,機器學習的很多方面并無法與簡潔規(guī)范的CMM相協(xié)調(diào),尤其是深度學習。比如,IBM建議在企業(yè)內(nèi)部監(jiān)督下建立一套AI服務(wù)數(shù)據(jù)引導(dǎo)系統(tǒng)(AI Service Data Lead),在工作開始時,用于訓(xùn)練機器的數(shù)據(jù)被貼上ground truth(參考標準,即用于有監(jiān)督訓(xùn)練的訓(xùn)練集的分類準確性)的標簽,然而仍然有許多未受監(jiān)督的機器學習試圖在神經(jīng)網(wǎng)絡(luò)設(shè)計中遠離ground truth。

也許最令人望而卻步的前景是,在IBM看來,企業(yè)有責任確保神經(jīng)網(wǎng)絡(luò)不存在偏差,而偏差正是令整個AI社區(qū)都抓耳撓腮的棘手問題。IBM在論文中表示,負責開發(fā)神經(jīng)網(wǎng)絡(luò)的人員需要保證最后建立的模型是公正、透明、沒有偏差的。

最后,盡管IBM的建議看起來頗為自信,但似乎現(xiàn)階段的機器學習尚處在一種“未開化”的狀態(tài),正如論文的結(jié)尾所描述的那樣,“企業(yè)對采用AI模型猶豫不決的另外一個原因就是,他們發(fā)現(xiàn)AI模型就像一個不透明的黑匣子,這點尤其在用深度學習技術(shù)對模型進行訓(xùn)練時更加突出。”

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點。刊用本站稿件,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號