国产又黄又爽又色视频,啦啦啦电影中文免费完整版,农民人伦一区二区三区

文|新眸葉靜

編輯|桑明強

在數據庫領域，如果問當下誰最火，那Databricks一定排得上號。

去年8月，距離10億美元的G輪融資剛過去7個月，Databricks再次獲得16億美元H輪融資，身價搖身一變成380億美元，成為外界一致認為的超級獨角獸。一直以來，數據領域備受關注，如果從2007年開始計算，全球的數據量至今已經膨脹了近200倍，數字化被寫入戰(zhàn)略規(guī)劃成了各類行業(yè)的共識。

在數據量井噴的背景下，上云趨勢也越來越明確，以Snowflake、Databricks為代表的大數據公司應運而生，前者基于AmazonS3打造了云端的數據倉庫，后者除了推出Lakehouse（湖倉一體），現(xiàn)在又押寶機器學習，試圖包管數據在抵達機器學習之前的所有流程。

不同的是，Databricks已經從原來的infra向更廣泛場景延伸，和昔日的伙伴Snowflake同臺競技。與此同時，以AWS為代表的云巨頭，也都曾戰(zhàn)略性投資過Databricks，但現(xiàn)在也都在自研數據分析套件，競合關系漸趨白熱化，讓數據基礎設施的戰(zhàn)火撲朔迷離。

從0到1

企業(yè)的性格往往被它的創(chuàng)始人和技術背景所決定。

十幾年前在UC Berkley的AI實驗室里，Ghodsi和伙伴發(fā)起Spark項目：做一個能夠更輕松處理大量數據和機器算法的引擎，并且開源了代碼。相比較多數開源項目，面向的都是底層技術性強要求的infra工程師，spark面向更廣泛的客戶群，同時在上層加了很多的新的API，降低了技術門檻。

因為沒有優(yōu)秀的開發(fā)者社區(qū)運營和推廣團隊，Spark變現(xiàn)比較難，之后團隊成員決定成立Databricks，以商業(yè)化方式推動Spark社區(qū)發(fā)展。即便Spark是過去硅谷的頂流產品，但這并沒有讓AWS等巨頭買賬，他們選擇繞過Databricks，直接將Spark集成到自己的產品里。在Databricks賣產品還不如辦Spark峰會收入高的時候，Amazon EMR已經針對Spark實現(xiàn)了幾億營收。

Databricks創(chuàng)始團隊走了一條不被大眾熟知的激進的路：云。

雖然不管對公司還是客戶來說，云可以更快部署，也更容易維護，但正如聯(lián)合創(chuàng)始人Reynold Xin所說，大部分的人知道云是未來，但絕不是現(xiàn)在。當時只有小部分風投注資這家初創(chuàng)企業(yè)，New Enterprise Associates的投資者Pete Sonsini說：“我們在Databricks的軟件收入為零時投資，認為他們會在大流行中加速發(fā)展，也許是一兩個月，每個人都無法及時知道會發(fā)生什么”。和Databricks一樣，他們也在賭未來。

圖：Databricks年度融資及估值變動

2013到2015這三年，雖然有硅谷風投支持，Databricks也借力這些資金吸引人才，推出了基于云端的簡化大數據處理平臺Databricks Cloud，但不管是招主管、找融資還是見客戶，Databricks都會被質疑：真的不支持on-prem嗎？

因為背靠Spark，很多客戶甚至愿意年付幾千萬美金讓Databricks提供咨詢定制化項目，但Databricks做的是一個給數據工程師的平臺,這是當時大部分公司聞所未聞的玩法,也是前幾年商途不順的原因之一。值得一提的是，彼時的云界開源前輩Cloudera曾改名“Cloud Era”，可在當時的市場情況下，最終還是轉向了on-prem做定制和售后支持才得以存活。

在這種邏輯下，云廠商把開源軟件拿來經過簡單的封裝，再作為服務賣出去。由于這個過程只需要簡單的部署和調試，工程成本極低，定價也不高，巨頭從中賺走了大部分，這對Databricks來說相當于吸血，怎樣和有錢有人的云巨頭對抗，是Databricks亟需在技術上打造的壁壘。

他們賭的另一條路，是不做數倉。

彼時數據倉庫競爭過于激烈，以亞馬遜為首的巨頭占據了大部分市場份額，Databricks繼續(xù)小眾打法：避開紅海，嘗試切入一個新興卻可能會有爆炸性增長的小市場，針對數據科學家、數據工程師和AI的方向做產品。

開源小公司的優(yōu)勢在于更懂項目，迭代更快，能夠聚焦、死磕產品性能，而公有云大廠很難在單一方向投入最好的工程師。隨著數據量的爆發(fā)，云的生態(tài)優(yōu)勢逐漸被認可，加上當時市面上也沒有大量競品，這給Databricks的產品帶來了機會。

另一方面，在2019年微軟投資Databricks之前，正巧CEO納德拉推動云為先的戰(zhàn)略，兩家合作的Azure Databricks進入了微軟的企業(yè)許可協(xié)議。微軟從一個大數據競爭劣勢的云產品搖身成為業(yè)界領先，形成了云巨頭三足鼎立的局面；因為幾乎所有大企業(yè)都和微軟有ELA，共生效應之下，客戶原本買云買Office的預算自然流向了Databricks。

有人將Databricks創(chuàng)始團隊比作一群幸運的加州嬉皮士RD，他們信仰技術，信仰來源，信仰共享和長期主義，這些也都成為了Databricks的底色。

超級加倍

讓所有人感到意外的是，2019年后，Databricks以絕無僅有的加速度在增長。

截至2021年2月，公司已經籌集了近20億美元資金，包括由富蘭克林鄧普頓領投的10億美元G輪融資，此時Databricks估值已經達到280億美元；在經過最新輪融資后，Databricks380億的身價與三年前的62億相比暴增了近13倍。

基本面決定價值，價值決定價格，如果將Databricks的成功僅歸結于對技術犀利的洞察，借助了巨人的肩膀和好運氣，這還遠遠不夠?；陂_源的創(chuàng)新是Databricks成長的關鍵，從大數據領域殺入云計算和AI，它的產品矩陣里包括DeltaLake、MLflow、Koalas以及開源分析引擎Spark等殺傷利器。

其中，超過80%的用戶使用Delta Lake；MLFlow為數據科學家提供了標準化的開源框架，下載量以每月80萬的速度增長，擁有比Spark更多的用戶；而Koalas可以讓數據科學家在筆記本電腦上使用Pandas編程，調用幾個API就可以將工作部署到大型的分布式Spark集群上，把Pandas社區(qū)的數據科學創(chuàng)新帶給了Spark用戶。

幫助其他企業(yè)構建自己的AI能力，透露出了Databricks的野心：從BI到AI，構建一個企業(yè)AI平臺，因為Ghodsi認為，在企業(yè)計算領域，行業(yè)還沒有出現(xiàn)頭部的企業(yè)AI平臺。

除了軟件產品本身，Databricks的業(yè)務模式也有所不同。

傳統(tǒng)的開源商業(yè)模式是軟件免費，廠商收取支持和服務費用，這在on-prem里或許可行，但在云的世界就不一定了。Databricks在開發(fā)、軟件運行、運營和托管方面向客戶收費，采用SaaS開源的盈利模式，客戶可以在本地開源平臺下載免費的基礎軟件，同時也可以下載開源公司打造的其他付費版本。

不高估開源，也不低估市場，Ghodsi說：“在云端托管開源項目并把它們租給用戶，客戶流失率更低，利潤增長更快”。SaaS租賃模式下，Databricks的核心知識產權沒有存放在它所贊助的開源軟件項目中，而是在它用來監(jiān)管云端軟件的工具中，這樣避免了泄露的風險。

根據報告，Databricks最新ARR (年度經常性收入)達到6億美元，相當于Snowflake同財年12億營業(yè)收入的一半，截至目前，后者市值近670億美元，如果按照兩倍之比來簡單預估，Databricks380億的估值也比較合理。以新估值計算，Databricks的價值是當前ARR的63倍，相較于2020年的4.25億美元，ARR近30%的增長率讓投資者對它未來的收入十分看好。

圖：Snowflake與Databricks定價對比（來源：官網）

另一方面，通過對比官網收費方式發(fā)現(xiàn)，雖然是平臺租出服務器的計算資源，但這些服務器整個系統(tǒng)都建立在主要的云廠商的基礎服務上。以Snowflake（左）為例，同樣是以每秒粒度使用的計算資源付費，Snowflake是平臺和云廠商打包收費方式，客戶對底層服務界面（如EC2）和上游的Snowflake的成本花費要一次性付清，但比例是怎樣無從得知，而打包之后Snowflake需要支付給云廠商另外成本，這在無形中增加了費用風險。

Databricks（右）的玩法是分開收費，用戶的賬單主要分為兩部分：常規(guī)的底層云廠商服務器租用成本，以及Databricks在這些服務器上的功能費用?？蛻羰褂玫讓悠鲿r，費用單獨付給云廠商，并不算在Databricks的營收里。

所以如果對比營收，比如2020年的Snowflake營收近6億，但刨去付給云廠商的費用，和Databricks4億多的營收相比，也差不了多少。而這既是Databricks毛利率比Snowflake高的原因，也是前者賺錢能力強的體現(xiàn)。有觀點猜測Databricks遲遲不上市的原因，如果根據Ghodsi的說法，是為了避免二級市場所帶來的波動，或許收費方式被迫改變等不可預測因素也在里面。

天時地利人和

根據官網顯示，除了為數據科學家、數據領導者與數據工程師提供角色解決方案，Databricks還利用大數據和AI為廣告和營銷、通訊服務商、教育、能源、聯(lián)邦政府、金融、醫(yī)療等13類行業(yè)提供服務。

從類別數量上，Databricks要多于Snowflake，此時全球已經有7000 多家組織（包括荷蘭銀行、康泰納仕、H&M 集團、再生元和殼牌）依靠 Databricks 實現(xiàn)大規(guī)模數據工程、協(xié)作數據科學、全生命周期機器學習和業(yè)務分析。

通常情況下，企業(yè)客戶在進行數據架構時，第三方平臺提供數據湖方案，在數據湖中做一些常見的數據工程；同時會有一個數據倉庫，存放相當于數據湖5%-10%的結構化數據，來做BI等簡單的數據分析。

但由于數據分裂在兩個系統(tǒng)上，針對同一個客戶問題分析，不同團隊有不同權限，因而會看到不同版本的同一份數據，當得出不同結論后，做商業(yè)決策的團隊不相信數據，進而導致底層數據平臺失信，這是個很致命的問題。

將結構化和非結構化數據結合到一個地方，讓客戶在不移動底層數據的情況下執(zhí)行數據科學和商業(yè)智能工作，是大數據發(fā)展的一個關鍵變化。于是，Databricks決定力推Lakehouse，能夠直接在數據湖的低成本存儲上，實現(xiàn)類似于數據倉中的數據結構和數據管理的功能，可支持BI到AI所有的工作流。

從Databricks的網頁介紹上看，無論是數據工程、數據科學，還是機器學習都要依靠Lakehouse運行，加上過去使用低成本對象存儲的數據湖的訪問速度很慢，如今DB SQL提高了分析質量和性能，使數據湖在大數據集上的處理與數據倉庫相媲美。

“Lakehouse是一個新賽道，這是一場地盤爭奪戰(zhàn)”，H輪融資之后，Ghodsi表示，這筆資金將主要用于加速Lakehouse的產品創(chuàng)新和市場開拓。與此同時，Databricks透露保留所有主要公共云的選擇和靈活性，并將Lakehouse發(fā)展成傳統(tǒng)數據倉庫的替代品。

越來越多的企業(yè)樂于看到Databricks的實力和發(fā)展?jié)摿Γ@和它本身的商業(yè)邏輯有關，業(yè)內傳統(tǒng)企業(yè)如Teradata在營收額上雖高過Databricks好幾個身位，但市值仍徘徊在40多億美元。大劑量的資金注入后，Databricks選擇并購來填補產品路線圖中的空白或不足，重點是機器學習和數據初創(chuàng)公司，以及擴大與云公司的合作伙伴關系。

“云、開源、機器學習，這三個方面已成為每家企業(yè)戰(zhàn)略的核心。我們真的很幸運能夠處在這三大趨勢的中心位置上?！盙hodsi在接受采訪時說到。如果說2019年前看好Databricks的小部分風投是賭趨勢，如今匆匆進場的其他機構也并沒有遲到，因為在他們眼里，這家獨角獸仍具備難以估量的增長能力。

文|新眸葉靜

編輯|桑明強

在數據庫領域，如果問當下誰最火，那Databricks一定排得上號。

從0到1

企業(yè)的性格往往被它的創(chuàng)始人和技術背景所決定。

Databricks創(chuàng)始團隊走了一條不被大眾熟知的激進的路：云。

圖：Databricks年度融資及估值變動

他們賭的另一條路，是不做數倉。

有人將Databricks創(chuàng)始團隊比作一群幸運的加州嬉皮士RD，他們信仰技術，信仰來源，信仰共享和長期主義，這些也都成為了Databricks的底色。

超級加倍

讓所有人感到意外的是，2019年后，Databricks以絕無僅有的加速度在增長。

除了軟件產品本身，Databricks的業(yè)務模式也有所不同。

圖：Snowflake與Databricks定價對比（來源：官網）

天時地利人和

越來越多的企業(yè)樂于看到Databricks的實力和發(fā)展?jié)摿?，這和它本身的商業(yè)邏輯有關，業(yè)內傳統(tǒng)企業(yè)如Teradata在營收額上雖高過Databricks好幾個身位，但市值仍徘徊在40多億美元。大劑量的資金注入后，Databricks選擇并購來填補產品路線圖中的空白或不足，重點是機器學習和數據初創(chuàng)公司，以及擴大與云公司的合作伙伴關系。

歷史搜索全部刪除

熱門搜索

“數據新星”Databricks 崛起啟示錄

從0到1

超級加倍

天時地利人和

評論

“數據新星”Databricks 崛起啟示錄

從0到1

超級加倍

天時地利人和