MM1313极品精品,久久精品国产亚洲AⅤ日韩,综合色区亚洲熟妇P

難以“馴服”AI？IBM為企業(yè)提出了這些建議

2018-11-16 08:37

IBM的研究人員認為，由于概率性編程模式和混亂的數(shù)據(jù)，目前AI對企業(yè)而言難以駕馭，日前，IBM的沃森和阿爾馬登研究中心發(fā)布了一篇題目為《刻畫機器學習過程：一個成熟度框架》的論文，提出許多充滿希望的建議，同時也暗示了一個實質(zhì)性的問題：這家藍色巨人是否能提出“馴服”AI這匹野獸的方法使其適用于企業(yè)的軟件生命周期和業(yè)務(wù)流程呢？

IBM研究人員給出的建議是，需要仔細考慮機器學習的多個階段，包括管理者應(yīng)該如何為神經(jīng)網(wǎng)絡(luò)模型“設(shè)定目標”、如何為神經(jīng)網(wǎng)絡(luò)的輸入構(gòu)建數(shù)據(jù)管道（data pipeline）的示例、以及如何不斷迭代和改進AI模型。另外，受管制產(chǎn)業(yè)需要特別注意一些地方，比如數(shù)據(jù)血統(tǒng)：所使用的數(shù)據(jù)的“合法性”是什么？

AI對企業(yè)的挑戰(zhàn)在于機器學習編程和傳統(tǒng)軟件編程之間的本質(zhì)區(qū)別：傳統(tǒng)的軟件應(yīng)用程序是確定性的，但機器學習模型是概率性的。另外，使用混雜的數(shù)據(jù)來開發(fā)神經(jīng)網(wǎng)絡(luò)，這對企業(yè)而言并不合適。然而，截至目前關(guān)于機器學習建模的學術(shù)文獻并沒有提出如何使機器學習為企業(yè)工作的解決方案。

為了使AI達到適用于企業(yè)的成熟度，IBM的科學家建議將機器學習和大量有關(guān)諸如“應(yīng)用生命周期管理”的文獻保持一致，并擴展此類術(shù)語的含義以適應(yīng)AI的新特性。IBM提出，一個機器學習的生命周期涵蓋了各個階段，企業(yè)必須在持續(xù)基礎(chǔ)上不斷為完成某個階段的工作做好準備。

研究人員借鑒了Watts Humphrey在20世紀80年代對軟件能力成熟度模型（Capability Maturity Model，CMM）的定義，CMM是對軟件組織在定義、實施、度量、控制和改善其軟件過程的實踐中各個發(fā)展階段的描述，其假設(shè)是：只要持續(xù)建立有效的軟件工程過程的基礎(chǔ)結(jié)構(gòu)，不斷改進管理的實踐和過程，就可以克服軟件生產(chǎn)中的困難。

這項工作最原始的貢獻是研究人員關(guān)于神經(jīng)網(wǎng)絡(luò)應(yīng)根據(jù)一個特定行業(yè)的特殊性進行開發(fā)的建議，而為了找到AI的業(yè)務(wù)用例，企業(yè)需要定制行業(yè)和領(lǐng)域通用的機器學習模型，并針對特殊的情況提供特殊的數(shù)據(jù)。

顯然，IBM正在試圖解決一個棘手的問題，事實上，機器學習的很多方面并無法與簡潔規(guī)范的CMM相協(xié)調(diào)，尤其是深度學習。比如，IBM建議在企業(yè)內(nèi)部監(jiān)督下建立一套AI服務(wù)數(shù)據(jù)引導(dǎo)系統(tǒng)（AI Service Data Lead），在工作開始時，用于訓(xùn)練機器的數(shù)據(jù)被貼上ground truth（參考標準，即用于有監(jiān)督訓(xùn)練的訓(xùn)練集的分類準確性）的標簽，然而仍然有許多未受監(jiān)督的機器學習試圖在神經(jīng)網(wǎng)絡(luò)設(shè)計中遠離ground truth。

也許最令人望而卻步的前景是，在IBM看來，企業(yè)有責任確保神經(jīng)網(wǎng)絡(luò)不存在偏差，而偏差正是令整個AI社區(qū)都抓耳撓腮的棘手問題。IBM在論文中表示，負責開發(fā)神經(jīng)網(wǎng)絡(luò)的人員需要保證最后建立的模型是公正、透明、沒有偏差的。

最后，盡管IBM的建議看起來頗為自信，但似乎現(xiàn)階段的機器學習尚處在一種“未開化”的狀態(tài)，正如論文的結(jié)尾所描述的那樣，“企業(yè)對采用AI模型猶豫不決的另外一個原因就是，他們發(fā)現(xiàn)AI模型就像一個不透明的黑匣子，這點尤其在用深度學習技術(shù)對模型進行訓(xùn)練時更加突出。”