一覽群智胡健:先成為頭牌,再造AI軟件生態(tài)
落地場景與完全信息
采訪中,胡健向i黑馬&黑智講了一個場景落地的故事。這個場景是金融行業(yè)中的國際結(jié)算業(yè)務(wù)。
國際結(jié)算業(yè)務(wù)不是銀行的最核心的業(yè)務(wù),但是業(yè)務(wù)量大,每年有幾百億元的收入,而且痛點足夠痛,該業(yè)務(wù)要求審核人員看得懂英文,看得懂合同,是相關(guān)專業(yè)的碩士。銀行一年需要付給一位審核員20、30萬的工資,而且還不一定可以留得住人。
于是,一覽群智便和某銀行一起打造該業(yè)務(wù)的解決方案。期間遇到了很多困難,比如幾萬種不同格式的票據(jù),甚至還一些票據(jù)有遮擋,怎么樣將票據(jù)變成文本結(jié)構(gòu)化信息?這就牽涉到識別OCR、識別票據(jù)等。這需要對不同非結(jié)構(gòu)化數(shù)據(jù)做OCR。其次,識別完之后,需要抽取信息、分詞等。這個階段,一覽群智要給出各種字段,識別合同內(nèi)涵,比如這份合同講的是一件什么樣的事情?通過報關(guān)單上的“無破損”描述判定物品“外觀完好”等;第三,一覽群智還需要解決語義理解的問題。其中還會牽涉到知識圖譜。別無捷徑,通過大量的數(shù)據(jù)讓機器學(xué)會具體的審核邏輯。
“邏輯很簡單,像人做一些腦力勞動的工作一樣,首先能夠看得懂是什么,將圖片變成文字,并將文字變成結(jié)構(gòu)化信息,再把結(jié)構(gòu)化信息跟專家業(yè)務(wù)產(chǎn)品銜接,這就是知識圖譜,最終去做決策,這是標(biāo)準(zhǔn)的認知過程!边@個過程中,胡健提到針對不同行業(yè),構(gòu)建一個類似于專家的規(guī)則系統(tǒng),有一個與或非的邏輯!斑@個規(guī)則系統(tǒng)要被抽象得非常靈活。規(guī)則系統(tǒng)與知識圖譜結(jié)合的過程中,漸漸地被抽象成一套模具工廠;原來的知識圖譜只適用于單一的業(yè)務(wù)場景,當(dāng)它應(yīng)用于不同類型的場景,就被進一步抽象。每抽象一下,能解決面臨的多場景或者多業(yè)務(wù)的問題。但突然又來了十幾個不同場景,就會發(fā)現(xiàn)原來的知識圖譜或者規(guī)則系統(tǒng)還是有問題,那就需要再次抽象。這就跟達爾文的進化論一樣。適者生存,不斷進化,滿足不同需求。如此,產(chǎn)品越來越好用!
如何沉淀專家經(jīng)驗?如何構(gòu)建規(guī)則系統(tǒng)?以公安領(lǐng)域的反洗錢為例,一覽群智有著類似的實踐。一般反洗錢偵查中,警察會查一查大的進出口資金的流向,設(shè)置一些規(guī)則,篩選出現(xiàn)金流出的TOP10的帳戶,并過濾掉正常帳戶,剩下幾個只進不出的黑洞帳戶,或者進出一致的通道帳戶。順藤摸瓜,就能找到背后的主使者。一覽群智將這些專家經(jīng)驗配置到模型工廠里,把所有數(shù)據(jù)變成因子,變成與或非,或者決策分析的因子,然后拼出一個決策樹。一個決策樹就是一個經(jīng)驗。規(guī)則系統(tǒng)的建立加上專家經(jīng)驗輔助決策,才能夠產(chǎn)生化學(xué)反應(yīng),讓普通民警具備經(jīng)偵專家的能力。
據(jù)公開資料介紹,一覽群智落地的領(lǐng)域除了金融行業(yè),還有公共安全和媒體情報。在這些領(lǐng)域,一覽群智有專門的專家團隊解決行業(yè)know-h(huán)ow問題。一覽群智的商業(yè)化戰(zhàn)略一直在碰撞中,“為什么人工智能落地難?因為要不斷碰撞。首先先用邏輯篩選一遍,這個邏輯是技術(shù)的邏輯,是商業(yè)的邏輯,也是與客戶業(yè)務(wù)相關(guān)的邏輯;其次,這些邏輯都符合,才有可能產(chǎn)生10個商業(yè)可能性。拿給客戶,被斃掉9個,只剩下1個,那就先做!
上述案例,有一個不可回避的前提是:目前人工智能的技術(shù)限制,F(xiàn)階段,人工智能只能解決一些偏重復(fù)式的工作。前面提到的國際結(jié)算業(yè)務(wù)便是偏重復(fù)式的、相對閉環(huán)的場景。在閉環(huán)場景里,一覽群智可以知道所有可能的情況。這和張鈸院士提到的人工智能落地的幾個經(jīng)濟中的完全性經(jīng)濟有相似之處。
而在公共安全領(lǐng)域落地的案例,與國際結(jié)算業(yè)務(wù)相比,與人機協(xié)同相關(guān),更加復(fù)雜。在一個大的任務(wù)里人的腦子有限、計算能力有限、存儲能力有限、加工處理能力有限,而機器可以做這些工作。胡健指出,所謂“機器”指的是“把一些大容量的數(shù)據(jù)全部整干凈”。機器弱點也是明顯的,它無法做出判斷。機器只能對一些已經(jīng)出現(xiàn)過的,并生成技能樹的相關(guān)情況,做出判斷。比如找出涉嫌洗錢的嫌疑人,但這不是最終判斷。人會看一下為什么會認為他有嫌疑?機器的建議再加上人的經(jīng)驗和知覺,做出最終的判斷。人是有常識的,但機器不知道這些。這些常識需要長年累月的積累。
“我們必須遵從人工智能現(xiàn)階段的技術(shù)發(fā)展特征,找到最適合的方式去落地!边@是一覽群智的落地思路!拔覀儽M量做一些確定性的、相對封閉的、完全信息的場景。而且這個場景的數(shù)據(jù)又是準(zhǔn)備好的,且解決完之后,又能夠產(chǎn)生商業(yè)價值,有諸多前提。層層限制之下,真正適合AI落地的領(lǐng)域并不多。沒辦法,圈了一下,就這么多。這也是AI公司扎堆落地的原因!

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?