大数据技术有哪些
2018年注定是大數據的時代,很多企業都紛紛向數據轉型,對于大數據技術人才也是求賢若渴。對于大數據工程師崗位,我們需要掌握哪些技術才能勝任?今天給大家分享的是大數據工程師的技能樹,讓你對大數據工程師有一個基本的了解。
1. 什么是大數據工程師
數據工程師這個概念其實很模糊,不同的人和公司對它賦予的含義也區別很大,在這里,我們大概聊一下一般意義上的大數據工程師在工作中會做什么?
集群運維:安裝、測試、運維各種大數據組件
數據開發:細分一點的話會有ETL工程師、數據倉庫工程師等
數據系統開發:偏重Web系統開發,比如報表系統、推薦系統等
?
這里面有很多內容其實是十分重要的,下面大致聊一下每一塊內容大致需要學什么,以及側重點。
2. 集群運維
大數據工程師,基本上是離不開集群搭建,比如hadoop、Spark、Kafka,不要指望有專門的運維幫你搞定,新組件的引入一般都要自己來動手的。
因此這就要求數據工程師了解各種大數據的組件。
由于要自己的安裝各種開源的組件,就要求數據工程師要具備的能力: Linux 。要對Linux比較熟悉,能各種自己折騰著玩。
由于現在的大數據生態系統基本上是 JVM 系的,因此在語言上,就不要猶豫了,JVM系的Java和Scala基本上跑不掉,Java基本上要學的很深,Scala就看情況了。
3. ETL
ETL 在大數據領域主要體現在各種數據流的處理。這一塊一方面體現在對一些組件的了解上,比如Sqoop、Flume、Kafka、Spark、MapReduce;另一方面就是編程語言的需要,Java、Shell和Sql是基本功。
4. 系統開發
我們大部分的價值最后都會由系統來體現,比如報表系統和推薦系統。因此就要求有一定的系統開發能力,最常用的就是 Java Web 這一套了,當然Python也是挺方便的。
需要注意的是,一般數據開發跑不掉的就是各種提數據的需求,很多是臨時和定制的需求,這種情況下, Sql 就跑不掉了,老老實實學一下Sql很必要。
????大數據工程師相對于其他it技術人而言,是比較全能型人才,需要掌握的知識技術也比較多,未來的路還很長,一定要持續學習哦!
總結
- 上一篇: 单向流动的拓扑结构_单向流与乱流净化工程
- 下一篇: 图解数据中心冷热电三联供原理