難以“馴服”AI?IBM為企業(yè)提出了這些建議
IBM的研究人員認為,由于概率性編程模式和混亂的數(shù)據(jù),目前AI對企業(yè)而言難以駕馭,日前,IBM的沃森和阿爾馬登研究中心發(fā)布了一篇題目為《刻畫機器學習過程:一個成熟度框架》的論文,提出許多充滿希望的建議,同時也暗示了一個實質(zhì)性的問題:這家藍色巨人是否能提出“馴服”AI這匹野獸的方法使其適用于企業(yè)的軟件生命周期和業(yè)務(wù)流程呢?
IBM研究人員給出的建議是,需要仔細考慮機器學習的多個階段,包括管理者應(yīng)該如何為神經(jīng)網(wǎng)絡(luò)模型“設(shè)定目標”、如何為神經(jīng)網(wǎng)絡(luò)的輸入構(gòu)建數(shù)據(jù)管道(data pipeline)的示例、以及如何不斷迭代和改進AI模型。另外,受管制產(chǎn)業(yè)需要特別注意一些地方,比如數(shù)據(jù)血統(tǒng):所使用的數(shù)據(jù)的“合法性”是什么?
AI對企業(yè)的挑戰(zhàn)在于機器學習編程和傳統(tǒng)軟件編程之間的本質(zhì)區(qū)別:傳統(tǒng)的軟件應(yīng)用程序是確定性的,但機器學習模型是概率性的。另外,使用混雜的數(shù)據(jù)來開發(fā)神經(jīng)網(wǎng)絡(luò),這對企業(yè)而言并不合適。然而,截至目前關(guān)于機器學習建模的學術(shù)文獻并沒有提出如何使機器學習為企業(yè)工作的解決方案。
為了使AI達到適用于企業(yè)的成熟度,IBM的科學家建議將機器學習和大量有關(guān)諸如“應(yīng)用生命周期管理”的文獻保持一致,并擴展此類術(shù)語的含義以適應(yīng)AI的新特性。IBM提出,一個機器學習的生命周期涵蓋了各個階段,企業(yè)必須在持續(xù)基礎(chǔ)上不斷為完成某個階段的工作做好準備。
研究人員借鑒了Watts Humphrey在20世紀80年代對軟件能力成熟度模型(Capability Maturity Model,CMM)的定義,CMM是對軟件組織在定義、實施、度量、控制和改善其軟件過程的實踐中各個發(fā)展階段的描述,其假設(shè)是:只要持續(xù)建立有效的軟件工程過程的基礎(chǔ)結(jié)構(gòu),不斷改進管理的實踐和過程,就可以克服軟件生產(chǎn)中的困難。
這項工作最原始的貢獻是研究人員關(guān)于神經(jīng)網(wǎng)絡(luò)應(yīng)根據(jù)一個特定行業(yè)的特殊性進行開發(fā)的建議,而為了找到AI的業(yè)務(wù)用例,企業(yè)需要定制行業(yè)和領(lǐng)域通用的機器學習模型,并針對特殊的情況提供特殊的數(shù)據(jù)。
顯然,IBM正在試圖解決一個棘手的問題,事實上,機器學習的很多方面并無法與簡潔規(guī)范的CMM相協(xié)調(diào),尤其是深度學習。比如,IBM建議在企業(yè)內(nèi)部監(jiān)督下建立一套AI服務(wù)數(shù)據(jù)引導(dǎo)系統(tǒng)(AI Service Data Lead),在工作開始時,用于訓(xùn)練機器的數(shù)據(jù)被貼上ground truth(參考標準,即用于有監(jiān)督訓(xùn)練的訓(xùn)練集的分類準確性)的標簽,然而仍然有許多未受監(jiān)督的機器學習試圖在神經(jīng)網(wǎng)絡(luò)設(shè)計中遠離ground truth。
也許最令人望而卻步的前景是,在IBM看來,企業(yè)有責任確保神經(jīng)網(wǎng)絡(luò)不存在偏差,而偏差正是令整個AI社區(qū)都抓耳撓腮的棘手問題。IBM在論文中表示,負責開發(fā)神經(jīng)網(wǎng)絡(luò)的人員需要保證最后建立的模型是公正、透明、沒有偏差的。
最后,盡管IBM的建議看起來頗為自信,但似乎現(xiàn)階段的機器學習尚處在一種“未開化”的狀態(tài),正如論文的結(jié)尾所描述的那樣,“企業(yè)對采用AI模型猶豫不決的另外一個原因就是,他們發(fā)現(xiàn)AI模型就像一個不透明的黑匣子,這點尤其在用深度學習技術(shù)對模型進行訓(xùn)練時更加突出。”

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?