Databricks 崛起啟示錄
02超級(jí)加倍
讓所有人感到意外的是,2019年后,Databricks以絕無(wú)僅有的加速度在增長(zhǎng)。
截至2021年2月,公司已經(jīng)籌集了近20億美元資金,包括由富蘭克林鄧普頓領(lǐng)投的10億美元G輪融資,此時(shí)Databricks估值已經(jīng)達(dá)到280億美元;在經(jīng)過(guò)最新輪融資后,Databricks380億的身價(jià)與三年前的62億相比暴增了近13倍。
基本面決定價(jià)值,價(jià)值決定價(jià)格,如果將Databricks的成功僅歸結(jié)于對(duì)技術(shù)犀利的洞察,借助了巨人的肩膀和好運(yùn)氣,這還遠(yuǎn)遠(yuǎn)不夠;陂_(kāi)源的創(chuàng)新是Databricks成長(zhǎng)的關(guān)鍵,從大數(shù)據(jù)領(lǐng)域殺入云計(jì)算和AI,它的產(chǎn)品矩陣?yán)锇―eltaLake、MLflow、Koalas以及開(kāi)源分析引擎Spark等殺傷利器。
其中,超過(guò)80%的用戶(hù)使用Delta Lake;MLFlow為數(shù)據(jù)科學(xué)家提供了標(biāo)準(zhǔn)化的開(kāi)源框架,下載量以每月80萬(wàn)的速度增長(zhǎng),擁有比Spark更多的用戶(hù);而Koalas可以讓數(shù)據(jù)科學(xué)家在筆記本電腦上使用Pandas編程,調(diào)用幾個(gè)API就可以將工作部署到大型的分布式Spark集群上,把Pandas社區(qū)的數(shù)據(jù)科學(xué)創(chuàng)新帶給了Spark用戶(hù)。
幫助其他企業(yè)構(gòu)建自己的AI能力,透露出了Databricks的野心:從BI到AI,構(gòu)建一個(gè)企業(yè)AI平臺(tái),因?yàn)镚hodsi認(rèn)為,在企業(yè)計(jì)算領(lǐng)域,行業(yè)還沒(méi)有出現(xiàn)頭部的企業(yè)AI平臺(tái)。
除了軟件產(chǎn)品本身,Databricks的業(yè)務(wù)模式也有所不同。
傳統(tǒng)的開(kāi)源商業(yè)模式是軟件免費(fèi),廠(chǎng)商收取支持和服務(wù)費(fèi)用,這在on-prem里或許可行,但在云的世界就不一定了。Databricks在開(kāi)發(fā)、軟件運(yùn)行、運(yùn)營(yíng)和托管方面向客戶(hù)收費(fèi),采用SaaS開(kāi)源的盈利模式,客戶(hù)可以在本地開(kāi)源平臺(tái)下載免費(fèi)的基礎(chǔ)軟件,同時(shí)也可以下載開(kāi)源公司打造的其他付費(fèi)版本。
不高估開(kāi)源,也不低估市場(chǎng),Ghodsi說(shuō):“在云端托管開(kāi)源項(xiàng)目并把它們租給用戶(hù),客戶(hù)流失率更低,利潤(rùn)增長(zhǎng)更快”。SaaS租賃模式下,Databricks的核心知識(shí)產(chǎn)權(quán)沒(méi)有存放在它所贊助的開(kāi)源軟件項(xiàng)目中,而是在它用來(lái)監(jiān)管云端軟件的工具中,這樣避免了泄露的風(fēng)險(xiǎn)。
根據(jù)報(bào)告,Databricks最新ARR (年度經(jīng)常性收入)達(dá)到6億美元,相當(dāng)于Snowflake同財(cái)年12億營(yíng)業(yè)收入的一半,截至目前,后者市值近670億美元,如果按照兩倍之比來(lái)簡(jiǎn)單預(yù)估,Databricks380億的估值也比較合理。以新估值計(jì)算,Databricks的價(jià)值是當(dāng)前ARR的63倍,相較于2020年的4.25億美元,ARR近30%的增長(zhǎng)率讓投資者對(duì)它未來(lái)的收入十分看好。
圖:Snowflake與Databricks定價(jià)對(duì)比(來(lái)源:官網(wǎng))
另一方面,通過(guò)對(duì)比官網(wǎng)收費(fèi)方式發(fā)現(xiàn),雖然是平臺(tái)租出服務(wù)器的計(jì)算資源,但這些服務(wù)器整個(gè)系統(tǒng)都建立在主要的云廠(chǎng)商的基礎(chǔ)服務(wù)上。以Snowflake(左)為例,同樣是以每秒粒度使用的計(jì)算資源付費(fèi),Snowflake是平臺(tái)和云廠(chǎng)商打包收費(fèi)方式,客戶(hù)對(duì)底層服務(wù)界面(如EC2)和上游的Snowflake的成本花費(fèi)要一次性付清,但比例是怎樣無(wú)從得知,而打包之后Snowflake需要支付給云廠(chǎng)商另外成本,這在無(wú)形中增加了費(fèi)用風(fēng)險(xiǎn)。
Databricks(右)的玩法是分開(kāi)收費(fèi),用戶(hù)的賬單主要分為兩部分:常規(guī)的底層云廠(chǎng)商服務(wù)器租用成本,以及Databricks在這些服務(wù)器上的功能費(fèi)用?蛻(hù)使用底層器時(shí),費(fèi)用單獨(dú)付給云廠(chǎng)商,并不算在Databricks的營(yíng)收里。
所以如果對(duì)比營(yíng)收,比如2020年的Snowflake營(yíng)收近6億,但刨去付給云廠(chǎng)商的費(fèi)用,和Databricks4億多的營(yíng)收相比,也差不了多少。而這既是Databricks毛利率比Snowflake高的原因,也是前者賺錢(qián)能力強(qiáng)的體現(xiàn)。有觀點(diǎn)猜測(cè)Databricks遲遲不上市的原因,如果根據(jù)Ghodsi的說(shuō)法,是為了避免二級(jí)市場(chǎng)所帶來(lái)的波動(dòng),或許收費(fèi)方式被迫改變等不可預(yù)測(cè)因素也在里面。
03天時(shí)地利人和
根據(jù)官網(wǎng)顯示,除了為數(shù)據(jù)科學(xué)家、數(shù)據(jù)領(lǐng)導(dǎo)者與數(shù)據(jù)工程師提供角色解決方案,Databricks還利用大數(shù)據(jù)和AI為廣告和營(yíng)銷(xiāo)、通訊服務(wù)商、教育、能源、聯(lián)邦政府、金融、醫(yī)療等13類(lèi)行業(yè)提供服務(wù)。
從類(lèi)別數(shù)量上,Databricks要多于Snowflake,此時(shí)全球已經(jīng)有7000 多家組織(包括荷蘭銀行、康泰納仕、H&M 集團(tuán)、再生元和殼牌)依靠 Databricks 實(shí)現(xiàn)大規(guī)模數(shù)據(jù)工程、協(xié)作數(shù)據(jù)科學(xué)、全生命周期機(jī)器學(xué)習(xí)和業(yè)務(wù)分析。
通常情況下,企業(yè)客戶(hù)在進(jìn)行數(shù)據(jù)架構(gòu)時(shí),第三方平臺(tái)提供數(shù)據(jù)湖方案,在數(shù)據(jù)湖中做一些常見(jiàn)的數(shù)據(jù)工程;同時(shí)會(huì)有一個(gè)數(shù)據(jù)倉(cāng)庫(kù),存放相當(dāng)于數(shù)據(jù)湖5%-10%的結(jié)構(gòu)化數(shù)據(jù),來(lái)做BI等簡(jiǎn)單的數(shù)據(jù)分析。
但由于數(shù)據(jù)分裂在兩個(gè)系統(tǒng)上,針對(duì)同一個(gè)客戶(hù)問(wèn)題分析,不同團(tuán)隊(duì)有不同權(quán)限,因而會(huì)看到不同版本的同一份數(shù)據(jù),當(dāng)?shù)贸霾煌Y(jié)論后,做商業(yè)決策的團(tuán)隊(duì)不相信數(shù)據(jù),進(jìn)而導(dǎo)致底層數(shù)據(jù)平臺(tái)失信,這是個(gè)很致命的問(wèn)題。
將結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)結(jié)合到一個(gè)地方,讓客戶(hù)在不移動(dòng)底層數(shù)據(jù)的情況下執(zhí)行數(shù)據(jù)科學(xué)和商業(yè)智能工作,是大數(shù)據(jù)發(fā)展的一個(gè)關(guān)鍵變化。于是,Databricks決定力推Lakehouse,能夠直接在數(shù)據(jù)湖的低成本存儲(chǔ)上,實(shí)現(xiàn)類(lèi)似于數(shù)據(jù)倉(cāng)中的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)管理的功能,可支持BI到AI所有的工作流。
從Databricks的網(wǎng)頁(yè)介紹上看,無(wú)論是數(shù)據(jù)工程、數(shù)據(jù)科學(xué),還是機(jī)器學(xué)習(xí)都要依靠Lakehouse運(yùn)行,加上過(guò)去使用低成本對(duì)象存儲(chǔ)的數(shù)據(jù)湖的訪(fǎng)問(wèn)速度很慢,如今DB SQL提高了分析質(zhì)量和性能,使數(shù)據(jù)湖在大數(shù)據(jù)集上的處理與數(shù)據(jù)倉(cāng)庫(kù)相媲美。
“Lakehouse是一個(gè)新賽道,這是一場(chǎng)地盤(pán)爭(zhēng)奪戰(zhàn)”,H輪融資之后,Ghodsi表示,這筆資金將主要用于加速Lakehouse的產(chǎn)品創(chuàng)新和市場(chǎng)開(kāi)拓。與此同時(shí),Databricks透露保留所有主要公共云的選擇和靈活性,并將Lakehouse發(fā)展成傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的替代品。
越來(lái)越多的企業(yè)樂(lè)于看到Databricks的實(shí)力和發(fā)展?jié)摿Γ@和它本身的商業(yè)邏輯有關(guān),業(yè)內(nèi)傳統(tǒng)企業(yè)如Teradata在營(yíng)收額上雖高過(guò)Databricks好幾個(gè)身位,但市值仍徘徊在40多億美元。大劑量的資金注入后,Databricks選擇并購(gòu)來(lái)填補(bǔ)產(chǎn)品路線(xiàn)圖中的空白或不足,重點(diǎn)是機(jī)器學(xué)習(xí)和數(shù)據(jù)初創(chuàng)公司,以及擴(kuò)大與云公司的合作伙伴關(guān)系。
“云、開(kāi)源、機(jī)器學(xué)習(xí),這三個(gè)方面已成為每家企業(yè)戰(zhàn)略的核心。我們真的很幸運(yùn)能夠處在這三大趨勢(shì)的中心位置上!盙hodsi在接受采訪(fǎng)時(shí)說(shuō)到。如果說(shuō)2019年前看好Databricks的小部分風(fēng)投是賭趨勢(shì),如今匆匆進(jìn)場(chǎng)的其他機(jī)構(gòu)也并沒(méi)有遲到,因?yàn)樵谒麄冄劾铮@家獨(dú)角獸仍具備難以估量的增長(zhǎng)能力。
本文系新眸原創(chuàng)
原文標(biāo)題 : 「數(shù)據(jù)新星」Databricks 崛起啟示錄

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線(xiàn)下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線(xiàn)會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線(xiàn)自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?