訂閱
糾錯
加入自媒體

數(shù)據(jù)科學平臺,Cool!但并不孤獨

2020-04-10 16:02
云報
關(guān)注

一提到“數(shù)據(jù)科學家”,都覺得這是一項很酷的職業(yè);而一說到“數(shù)據(jù)科學”,雖然僅僅一字之差,卻讓人心生敬畏,感覺有些晦澀甚至是距離感。但是,偏偏有這樣一家中國的數(shù)據(jù)科學平臺提供商成了Gartner發(fā)布的“Cool Vendors in AI for Fintech in Asia/Pacific”報告中備受推崇的一家“酷公司”,而且是中國大陸地區(qū)唯一入選的企業(yè),它就是九章云極。

九章云極身上的“酷元素”

生活中,我們形容一個人酷,可能是因為他標新立異的穿著打扮、特立獨行的做事風格,又或是冷冷的帶一絲傲嬌的氣質(zhì)。九章云極的“酷”究竟表現(xiàn)在哪里呢?

九章云極這個名字本身就透露著一股文藝范兒,極富中國韻味,再細細品味,九章就是九章算法,云極便是云計算與極=,獨特的專業(yè)韻味此為一酷。九章云極DataCanvas數(shù)據(jù)科學平臺產(chǎn)品的吉祥物是一只可愛的花栗鼠,叫做“八斗”,有才高八斗之意,這聽起來也挺酷。九章云極為不同的客戶人群提供各種智能化的業(yè)務(wù)場景,比如信貸資格的審查、預(yù)測事故風險、人群分布預(yù)警等,諸如此類的智能化應(yīng)用是不是也挺酷?

數(shù)據(jù)科學平臺是一條逐漸升溫的新賽道。以前,人們對數(shù)據(jù)科學平臺的概念認知不清,想酷也酷不起來。2017年,Gartner給出了數(shù)據(jù)科學平臺的明確定義, 提出了數(shù)據(jù)科學平臺不可或缺的四大要素:“數(shù)據(jù)、算法、數(shù)據(jù)科學家、業(yè)務(wù)價值”。

數(shù)據(jù)科學平臺,Cool!但并不孤獨

九章云極聯(lián)合創(chuàng)始人兼CEO方磊

“相比以往,企業(yè)客戶對數(shù)據(jù)科學平臺的理解確實更加深入。面向具體的業(yè)務(wù)場景,在數(shù)據(jù)的基礎(chǔ)上加載算法,解決企業(yè)的實際業(yè)務(wù)問題,這才是數(shù)據(jù)科學平臺的真正價值所在!本耪略茦O聯(lián)合創(chuàng)始人兼CEO方磊指出,“專注于數(shù)據(jù)科學平臺這條賽道,我們引領(lǐng)未來的發(fā)展方向。DataCanvas數(shù)據(jù)科學平臺形成了獨有的“四庫”方法論,深入而靈活地應(yīng)用機器學習、深度學習算法,為各行各業(yè)的客戶帶來新的價值。這可能是Gartner最看重的我們身上的‘酷’元素吧!

從簡化應(yīng)用到提升價值

“用數(shù)據(jù)解決業(yè)務(wù)問題,都屬于數(shù)據(jù)科學的范疇。”方磊一語中的。

很多時候,我們?nèi)菀讓?shù)據(jù)科學與BI(商業(yè)智能)混淆。其實,BI的主要工作是數(shù)據(jù)的歸類和展示,不涉及算法,旨在讓人幫助人更好地理解業(yè)務(wù),并間接地解決業(yè)務(wù)問題。數(shù)據(jù)科學的不同之處在于,它以算法為核心,直接解決業(yè)務(wù)問題。舉個例子,在處理車險理賠時通常需要上傳一些相關(guān)照片,然而有人會別有用心地上傳PS后的照片。面對這種情況,BI只是匯總最后的統(tǒng)計數(shù)據(jù),告訴你歷史上出現(xiàn)過多少次這種造假行為,而數(shù)據(jù)科學平臺則在照片上傳時,通過算法和分析,直接指出哪些照片是PS過的。“BI最終還是要依賴人進行分析,而數(shù)據(jù)科學平臺通過在數(shù)據(jù)上加載算法,在具體的業(yè)務(wù)場景中實現(xiàn)閉環(huán),并以自動化的方式解決業(yè)務(wù)問題!狈嚼诮忉屨f。

數(shù)據(jù)科學平臺,Cool!但并不孤獨

DataCanvas數(shù)據(jù)科學平臺

大數(shù)據(jù)、人工智能等應(yīng)用剛興起時,因為業(yè)務(wù)場景、技術(shù)實現(xiàn)上的復(fù)雜性,所以無論是廠商還是企業(yè)用戶,都將降低應(yīng)用門檻作為突破口。這是數(shù)據(jù)科學平臺從0到1的演進過程,這項工作九章云極做了四五年,并掙得了第一桶金。在應(yīng)用壁壘降低到一定程度后,積累了大量專業(yè)技術(shù)人員,以前可能只有數(shù)據(jù)科學家能完成的工作,現(xiàn)在具備一定技術(shù)能力的人也可以完成,生態(tài)發(fā)展被提上了議事日程,數(shù)據(jù)科學平臺的發(fā)展也過渡到從1到100的躍升階段。在這個階段,就要針對具體的業(yè)務(wù)場景,依靠算法,提升解決業(yè)務(wù)問題的能力,創(chuàng)造新的價值。正是在這樣的背景下,2019年初,九章云極創(chuàng)新性地提出了DataCanvas“四庫”——模型倉庫、特征倉庫、模版?zhèn)}庫和AutoML Recipe倉庫的技術(shù)組合,可以有效解決行業(yè)AI建設(shè)的三大難題,包括經(jīng)驗及業(yè)務(wù)知識融合、模型資產(chǎn)共享和臺運維管理,以及場景化知識遷移。

“四庫”是九章云極歸納出的一套方法論,它將行業(yè)經(jīng)驗、業(yè)務(wù)知識和數(shù)據(jù)科學技術(shù)有效結(jié)合,直接降低客戶對資源的依賴和AI建設(shè)的成本。方磊表示,數(shù)據(jù)科學平臺落地的一個核心是場景模板化,這樣才能在客戶中快速復(fù)制和交換共享。如果能把九章云極的“四庫”方法論變成行業(yè)標準,無疑將加速這一進程;凇八膸臁,DataCanvas未來還會有重大的版本升級。

“在不同的發(fā)展階段,需要解決的主要矛盾也不同。從0到1的階段,要實現(xiàn)簡化,而在從1到100的階段,產(chǎn)生價值才是最重要的,這就要求模型更準。為此,必須將業(yè)務(wù)的Know-How加入進來!狈嚼谝孕∥⑵髽I(yè)信貸分析為例,其模型非常復(fù)雜,但仍有大量信貸知識不在模型中,比如隱形負債因素等,而這些知識和業(yè)務(wù)Know-How很多就來自人的經(jīng)驗和積累,只有將它們?nèi)谌肽P,才能讓模型更準確,從而更好地挖掘業(yè)務(wù)價值。

通向AI的主流路徑

按照傳統(tǒng)的廠商分類方法,九章云極會被歸到大數(shù)據(jù)廠商陣營。但是最近兩年,人工智能成了九章云極的一個新標簽。比如,Gartner的“Cool Vendors in AI for Fintech in Asia/Pacific”報告,主要研究的對象是亞太地區(qū)將AI增強創(chuàng)新成功商用在金融科技領(lǐng)域的新興企業(yè),九章云極之所以能夠入圍,就是因為它在金融領(lǐng)域AI應(yīng)用方面具有很強的創(chuàng)新能力。再比如,在IDC發(fā)布的《IDC MarketScape:中國機器學習開發(fā)平臺廠商評估》研究報告中,九章云極也位于主要廠商位置。

“AI的定義十分寬泛,機器學習、深度學習都屬于AI的范疇。但是AI也分成多個學派,比如其中的符號學派,不借助數(shù)據(jù),僅憑符號就能推導(dǎo)出結(jié)果!痹诜嚼诳磥,AI是一種狀態(tài)、一個目標,而數(shù)據(jù)科學是達到這一目標的主流方式和路徑。

與很多AI應(yīng)用類廠商不同,九章云極是一個平臺廠商。從2014年開始推出產(chǎn)品,經(jīng)歷了公有云、私有云等不同的交付方式,九章云極在AI應(yīng)用方面的差異化定位更加清晰。通常來說,數(shù)據(jù)處理要經(jīng)過四個主要環(huán)節(jié),先建立數(shù)據(jù)倉庫,然后進行數(shù)據(jù)治理,接下來實現(xiàn)商業(yè)智能,最后是借助訓練出的模型,自動化地解決業(yè)務(wù)問題。相關(guān)廠商也按照這四個部分進行分類、匯聚。九章云極就處于整個數(shù)據(jù)價值鏈條的最后端,也是實現(xiàn)價值的關(guān)鍵。

Gartner從2017年起才將數(shù)據(jù)科學平臺作為專門的研究領(lǐng)域,在此之前,九章云極執(zhí)著地走過了一段孤獨的路程。但是,方磊并不認為數(shù)據(jù)科學平臺是一條孤獨的賽道。在國外,數(shù)據(jù)科學早就形成了一個成熟的生態(tài),廠商間的并購不斷,估值70億美元的數(shù)據(jù)科學平臺企業(yè)讓人艷羨。

與國外相比,中國在數(shù)據(jù)科學領(lǐng)域還有較大差距,主要體現(xiàn)在:美國現(xiàn)有兩三百萬名數(shù)據(jù)科學家,很多公司都有專門的數(shù)據(jù)科學團隊,有的還設(shè)立了CDO(首席數(shù)據(jù)官)的職位,但是中國的數(shù)據(jù)科學家稀缺,人才成了瓶頸;美國的客戶具備較強的技術(shù)能力,傾向于在標準化的軟件產(chǎn)品之上自己進行集成和開發(fā),而中國客戶更喜歡端到端的解決方案和服務(wù),有時還需要廠商提供具體的模型,這是生態(tài)和應(yīng)用不成熟的一種表現(xiàn)。

為了滿足中國客戶的需求,九章云極一方面為大型企業(yè)客戶提供平臺化的產(chǎn)品;另一方面除了為中小企業(yè)客戶提供整體解決方案以外,還提供具體的模型!拔覀兩喜慌銎髽I(yè)的業(yè)務(wù),下不碰企業(yè)的數(shù)據(jù),而是專注于提供數(shù)據(jù)科學平臺和模型!狈嚼诒硎荆皵(shù)據(jù)科學平臺的重心在算法上,而不是簡單地提供數(shù)據(jù)統(tǒng)計和匯總功能。從數(shù)據(jù)到業(yè)務(wù),數(shù)據(jù)科學平臺是中間的橋梁,將逐步深入到各個場景中!

企業(yè)客戶從自己需求的角度看數(shù)據(jù)科學平臺,會有不同的理解。比如,從業(yè)務(wù)的角度,有人認為數(shù)據(jù)科學平臺就是一個模型工廠;從管理的角度,有人將數(shù)據(jù)科學平臺當成管理數(shù)據(jù)科學家的OA,可以更好地將數(shù)據(jù)科學家組織起來,發(fā)揮其價值。不管如何描述數(shù)據(jù)科學平臺,各行業(yè)已經(jīng)達成了一個基本共識:借助數(shù)據(jù)科學平臺,可以找到業(yè)務(wù)的價值點。

從“酷”到主流

在數(shù)據(jù)科學平臺的賽道上,九章云極是不是要跑得再快一些?方磊認為:“to B類型的企業(yè)還是要依靠積累效應(yīng)。2019年,我們完成了新一輪融資,并且連續(xù)保持年增長100%。未來,我們?nèi)詫凑兆约旱墓?jié)奏發(fā)展!

不僅數(shù)據(jù)科學家這一職業(yè)酷,數(shù)據(jù)科學這項事業(yè)更酷,他們都是為了智能世界的明天更加美好。但在方磊看來,什么時候人們不再談?wù)摂?shù)據(jù)科學、數(shù)據(jù)科學家酷不酷這個話題,就說明數(shù)據(jù)科學已經(jīng)成了主流,被各行各業(yè)的用戶所接納,以九章云極為代表的數(shù)據(jù)科學平臺廠商的好日子才算是真正到來。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號