訂閱
糾錯(cuò)
加入自媒體

使用人工智能技術(shù)不要陷入數(shù)據(jù)量的泥潭

機(jī)器學(xué)習(xí)算法經(jīng)常被描述為數(shù)據(jù)饑餓。但調(diào)研機(jī)構(gòu)Gartner公司的Erick Brethenoux最近表示,對(duì)于某些人工智能用例來(lái)說,企業(yè)首席信息官在開始應(yīng)用時(shí)應(yīng)該考慮數(shù)據(jù)質(zhì)量,而不是數(shù)量。

在最近的一個(gè)網(wǎng)絡(luò)研討會(huì)上,Brethenoux提出了一個(gè)新的研究方案,他斷言:“企業(yè)的規(guī)模和數(shù)據(jù)量都不利于企業(yè)使用這些人工智能技術(shù)!

這是他提供給開始采用人工智能技術(shù)的公司的一個(gè)建議。以下將詳細(xì)介紹為什么Brethenoux強(qiáng)調(diào)某些用例中突出的數(shù)據(jù)質(zhì)量而不是數(shù)量,以及為什么他認(rèn)為從業(yè)務(wù)問題開始是至關(guān)重要的原因。他還向已經(jīng)為人工智能做好準(zhǔn)備的客戶提出了五個(gè)問題。

清潔數(shù)據(jù)優(yōu)于大量數(shù)據(jù)

Brethenoux在網(wǎng)絡(luò)研討會(huì)期間給出一個(gè)令人驚訝的提示:企業(yè)在決定是否使用人工智能技術(shù)時(shí),數(shù)據(jù)量并不是一個(gè)很好的經(jīng)驗(yàn)法則。他舉了一個(gè)小型區(qū)域銀行客戶的例子,該客戶使用人工智能不僅實(shí)現(xiàn)個(gè)性化貸款,而且還開始向小額貸款客戶提供新服務(wù)。

他說,“他們擁有的數(shù)據(jù)量并不大。但是,這些數(shù)據(jù)的質(zhì)量必須是無(wú)可挑剔的!

Brethenoux重申了這一點(diǎn)。他說,“企業(yè)擁有的數(shù)據(jù)越多,通常就越能找到有趣的相關(guān)性,但沒有必要通過擁有大量的數(shù)據(jù)才能找到有趣的東西!比绻枰髽I(yè)人工智能團(tuán)隊(duì)可以利用來(lái)自提供商的外部數(shù)據(jù)來(lái)彌補(bǔ)內(nèi)部數(shù)據(jù)不足。

另一方面,低質(zhì)量數(shù)據(jù)可能會(huì)觸發(fā)瘋狂的算法追逐。而加拿大的一家保險(xiǎn)公司想要根據(jù)保險(xiǎn)公司的工作地點(diǎn)來(lái)衡量保險(xiǎn)公司的風(fēng)險(xiǎn)時(shí),其分析產(chǎn)生了垃圾結(jié)果。根據(jù)Brethenoux的說法,事實(shí)證明,其距離數(shù)據(jù)分別以英里和公里為標(biāo)記,使結(jié)果出現(xiàn)了偏差。

雖然數(shù)據(jù)質(zhì)量很重要,但他表示,企業(yè)首席信息官不應(yīng)該被迫去清理每一項(xiàng)數(shù)據(jù),并推遲啟動(dòng)。

“企業(yè)最終要做的就是不斷清理,而且從機(jī)器學(xué)習(xí)或預(yù)測(cè)分析的角度來(lái)看,很多數(shù)據(jù)可能對(duì)企業(yè)嘗試做的事情沒有幫助!彼f,“這就是企業(yè)堅(jiān)持從一個(gè)用例開始的原因!

專注于業(yè)務(wù)問題

為了引入人工智能技術(shù),企業(yè)首席信息官應(yīng)該從業(yè)務(wù)問題入手,努力尋求解決方案。重點(diǎn)是業(yè)務(wù)問題!坝美⒉皇且粋(gè)好主意,而是一個(gè)商業(yè)案例。”Brethenoux說。

他建議首席信息官與企業(yè)進(jìn)行溝通,找出問題的癥結(jié)所在,然后將問題“范圍縮小”為他們可以在幾周內(nèi)完成的事情。Brethenoux說,這就是首席信息官們?nèi)绾闻宄麄儾恢朗裁,以及他們需要關(guān)注什么的方式。

這一建議部分來(lái)自于他的觀察,即“以資產(chǎn)為中心的公司”,例如制造業(yè)或能源公司,在人工智能技術(shù)方面取得了比“以服務(wù)為中心的公司”(如營(yíng)銷公司)更多的成功。

“大多數(shù)以資產(chǎn)為中心的組織正在處理以工程為中心的文化,這些文化從用例開始,并返回解決問題所需的數(shù)據(jù)和技術(shù)!彼诰W(wǎng)絡(luò)研討會(huì)上說。Brethenoux表示,在以服務(wù)為中心的公司中,這一過程經(jīng)常發(fā)生逆轉(zhuǎn):數(shù)據(jù)專業(yè)人員在數(shù)據(jù)中找到趨勢(shì)或相關(guān)性,然后尋找問題。

Brethenoux闡述了這一點(diǎn),并補(bǔ)充說,以服務(wù)為中心的企業(yè)有時(shí)會(huì)因缺乏關(guān)注而受到影響,而將人工智能技術(shù)引入企業(yè)時(shí)可能會(huì)面臨問題。

他說,“當(dāng)企業(yè)開始處理更多的數(shù)據(jù)和問題時(shí),解決問題的方法并不那么嚴(yán)謹(jǐn)!

提出的五個(gè)問題

當(dāng)客戶告訴Brethenoux想要使用人工智能來(lái)解決問題時(shí),他提出了五個(gè)問題,以確定人工智能是否是適當(dāng)?shù)男袆?dòng)方案,以及客戶是否準(zhǔn)備沿著人工智能路徑前進(jìn)。問題如下:

(1)業(yè)務(wù)用例是什么? Brethenoux表示,這個(gè)過程應(yīng)該包括描述預(yù)期和期望的結(jié)果,以及確定如果引入人工智能技術(shù)將如何衡量業(yè)務(wù)價(jià)值。

(2)企業(yè)具有必要的技能嗎?企業(yè)首席信息官可能不需要雇傭大批數(shù)據(jù)科學(xué)家。Brethenoux建議他們從評(píng)估內(nèi)部技能開始,并考慮培訓(xùn)合格的數(shù)據(jù)工程師或主題專家。他還建議舉辦“黑客大會(huì)”來(lái)幫助發(fā)掘人才。“或者企業(yè)可以采取這些措施:聘請(qǐng)顧問,在短期內(nèi)幫助企業(yè)走出困境,并推動(dòng)這些努力!彼f。

(3)企業(yè)有必要的數(shù)據(jù)嗎?企業(yè)可能不需要他們想象的那么多的數(shù)據(jù),但他們需要數(shù)據(jù),并且它應(yīng)該是合理的。當(dāng)Brethenoux要求一家大型保險(xiǎn)公司想要拍攝事故的現(xiàn)場(chǎng)照片,并預(yù)測(cè)索賠的類型和費(fèi)用時(shí),他收到了一堆照片,該公司花費(fèi)兩個(gè)月的時(shí)間對(duì)這些圖像進(jìn)行數(shù)字化、整理和標(biāo)記。“當(dāng)企業(yè)解決其試圖解決的用例時(shí),需要確保擁有適當(dāng)?shù)臄?shù)據(jù)!彼f。

(4)企業(yè)需要什么樣的技術(shù)?業(yè)務(wù)問題將推動(dòng)技術(shù)決策。 Brethenoux引用了幾種成熟的人工智能技術(shù)——從概率推理(如機(jī)器學(xué)習(xí)被確定為最成熟的技術(shù))到基于代理的編程(被認(rèn)為是最不成熟的技術(shù))。

(5)企業(yè)如何組織團(tuán)隊(duì)?一旦企業(yè)有了一些概念上的證據(jù),就應(yīng)該考慮這樣的團(tuán)隊(duì)?wèi)?yīng)該在哪里實(shí)施,團(tuán)隊(duì)?wèi)?yīng)該向誰(shuí)報(bào)告,以及如何支持團(tuán)隊(duì)來(lái)提高其技能和技術(shù)。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)