Databricks:打造数据国度的“金砖四国”
Databricks,一個并不算熟悉的名字,是大數(shù)據(jù)國度的后起之星。成立不夠一年,但卻陣容強大,創(chuàng)始人都是開源圈子里面的重要級人物,值得關(guān)注。從公司名Databricks似乎就能看出一些深意——data(數(shù)據(jù))+bricks(金磚四國)。不知道,在數(shù)據(jù)國度里Databricks是否具有“金磚四國”的發(fā)展前景呢?
可以先從公司的創(chuàng)始背景談起,打開Databricks官網(wǎng),“We're working to revolutionize what you can do with big data“映入眼簾。其格外簡約不能再簡約,可以用清新的字眼來描述網(wǎng)站來看,這一行字相信解讀為公司創(chuàng)立的最初想法和終極目標(biāo)似乎不為過。
Databricks是由Apache Spark的創(chuàng)始人建立的,成立于2013年年中,公司重于研發(fā)尖端系統(tǒng),以從大數(shù)據(jù)中獲取價值。Databricks認(rèn)為大數(shù)據(jù)仍存在很大部分尚未開發(fā)的機遇,這也就是他們所要做的,通過改革來尋找到底大數(shù)據(jù)可以幫助人們做些什么。
?
加州大學(xué)伯克利分校,攝于2013年
也許正是基于此背景,Databricks目前的陣容對于大數(shù)據(jù)領(lǐng)域來說有不少亮點。團隊人員均是開源圈子內(nèi)的重量級人物,他們都熱衷于“增值開源軟件”:任職CEO 的Ion Stoica是UC Berkeley計算機教授、AMPLab聯(lián)合創(chuàng)始人,同時也是Conviva公司的聯(lián)合創(chuàng)始人(位于后排右三);CTO Matei Zaharia 是Apache Spark的創(chuàng)作者,同時也是麻省理工學(xué)院計算機科學(xué)系的助理教授(位于后排左三);UC Berkeley計算機科學(xué)教授Scott Shenker。同時也是知名SDN公司Nicira的聯(lián)合創(chuàng)始人及前CEO(位于后排右二);值得一提的是聯(lián)合創(chuàng)始人辛湜先生(英文名Reynold Xin,新浪微博為@hashjoin)還是一名中國人,無疑會帶給Databricks公司多一分的中國色彩,他同時也是Spark的核心成員(位于前排左二)。
對于這家新興的大數(shù)據(jù)公司,最好奇的就是他所擁有的大數(shù)據(jù)產(chǎn)品到底是什么呢?可以這么說,如果將Databricks公司的產(chǎn)品說成是Spark社區(qū),其實不如說Databricks主要服務(wù)于Spark。這一點我們從其團隊的主要成員不難看出。按照辛湜先生在媒體訪問中所說,Databricks的目標(biāo)是從Spark開始,構(gòu)建一系列更強大、更簡單的大數(shù)據(jù)分析處理工具盒平臺。
不錯,從其對外公布的官方博客中,這一點也得到了印證。3月18日宣布Databricks“認(rèn)證Spark”項目主要用于那些建立在Apache Spark平臺頂部上的應(yīng)用,其實就是確保被認(rèn)證的應(yīng)用與許多Spark發(fā)行的商業(yè)支持一起使用。Databricks CEO Ion Stoica表示在此次項目中,Databricks將處理與認(rèn)證的Apache在各商業(yè)版本中的兼容性任務(wù),并能夠很快確定其初始設(shè)置的分派是否滿足此條件。
這里,可以順便一起回顧下Apache Spark,它是一個開源數(shù)據(jù)處理引擎,用于構(gòu)建高效率的、易用的和復(fù)雜分析的Hadoop數(shù)據(jù),最初是成立于2009年的加州大學(xué)伯克利分校(UC Berkeley)AMPLab,正式開源是在2010年。正如Apache Spark做到100%的開源,Databricks也依舊遵循此規(guī)則。目前Spark已經(jīng)發(fā)展成為大數(shù)據(jù)領(lǐng)域最大的開發(fā)者社區(qū),有超過來自30個組織的100多個貢獻者。不得不說注入如此基因的Databricks,絕對會更“親民”。
迄今為止,這家極盡低調(diào)的公司Databricks,可以用神秘的大數(shù)據(jù)公司來形容。但在其成立不到一年的時間內(nèi),還是獲得了Andreessen Horowitz 1400萬美元投資。Andreessen Horowitz曾先后投資了Groupon、Skype、Zynga、Foursquare和Facebook等著名的互聯(lián)網(wǎng)公司,外媒BusinessInsider曾將他譽為硅谷最具權(quán)威的50個天使投資人之一。
同時,Databricks還有個同樣在大數(shù)據(jù)領(lǐng)域不容小覷的合作伙伴。從去年(2013年)Hadoop World會議上,就爆出Cloudera決定提供Apache?Spark的全企業(yè)級支持,這也就意味著Databricks將成為Cloudera的第一個合作伙伴。Cloudera最近也是新聞不斷,剛斬獲了1.6億美元 的融資,上市消息不斷傳出。
合作方式主要是Databricks幫助Cloudera提供支持,雖然目前Databricks僅以類似OEM的關(guān)系獲益,該協(xié)議僅限于擴展Apache Spark,不會發(fā)布任何商業(yè)版本的Databricks。但正如Cloudera公司聯(lián)合創(chuàng)始人兼CTO Amr Awadallah所說,此次合作將是作為Cloudera所有感興趣的客戶創(chuàng)新的樞紐,無疑這將為這家新興創(chuàng)業(yè)公司贏得業(yè)界內(nèi)的信譽。
此外,Databricks對于中國市場也很是看重,從主要創(chuàng)始人多次參加相關(guān)活動足以看出。近期就有一個機會,期待的伙伴們或許可以親臨現(xiàn)場。本月19日Databricks受邀參加“2014中國Spark技術(shù)峰會”(Spark Summit China 2014),屆時期待Databricks公司成員Andy Konwinski的發(fā)言。
溫馨提示:想要快速了解Databricks的網(wǎng)友,可火速點擊http://stor-age.zdnet.com.cn/special/big_data_Databricks
原文發(fā)布時間為:2014年04月08日 本文作者:林利 本文來自云棲社區(qū)合作伙伴至頂網(wǎng),了解相關(guān)信息可以關(guān)注至頂網(wǎng)。總結(jié)
以上是生活随笔為你收集整理的Databricks:打造数据国度的“金砖四国”的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 前端笔记1 HTML基础
- 下一篇: 水下SLAM论文!!!