大学刚毕业,零基础大数据如何入门?
這篇文章中,本文作者將針對三種不同的、想要進入數(shù)據(jù)科學領(lǐng)域的人群,給出自己的經(jīng)驗,幫助他們迅速有效入行。無論是軟件工程師、應(yīng)屆畢業(yè)生,還是完全初學者,都要問自己一個關(guān)鍵問題:什么樣的職業(yè)軌跡最接近你。如果你是想成功入門數(shù)據(jù)分析師或數(shù)據(jù)可視化專家,那么這將是協(xié)助你走上正確的職業(yè)軌跡的最好方法。
雖然沒有適合每個人的萬能解決方案,但這三類建議值得想轉(zhuǎn)行的你一看。
一、如果你是零基礎(chǔ)小白新手上路
如果你剛剛進入數(shù)據(jù)科學領(lǐng)域,請記住這一點:這個領(lǐng)域發(fā)展很快,我在這里給出的建議基本上在你工作時已經(jīng)過時了。能滿足2017年招聘崗位要求的建議策略,在如今可能就不滿足,而今天的數(shù)據(jù)科學領(lǐng)域招聘標準與一兩年后的標準之間的差異可能更大。
對大數(shù)據(jù)以及人工智能概念都是模糊不清的,該按照什么線路去學習,學完往哪方面發(fā)展,想深入了解,想學習的同學歡迎加入大數(shù)據(jù)學習qq群:458345782,有大量干貨(零基礎(chǔ)以及進階的經(jīng)典實戰(zhàn))分享給大家,并且有清華大學畢業(yè)的資深大數(shù)據(jù)講師給大家免費授課,給大家分享目前國內(nèi)最完整的大數(shù)據(jù)高端實戰(zhàn)實用學習流程體系 。從java和linux入手,其后逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相關(guān)知識一一分享!
因此,如果你打算在數(shù)據(jù)科學領(lǐng)域發(fā)展事業(yè),并且沒有編程經(jīng)驗和STEM(科學Science,科技Technology,工程Engineering,數(shù)學Mathematics四門學科英文首字母的縮寫)背景,那么這里有一些建議:
首先要保持開放的心態(tài)。如果你是一個新手,那么你實際上并不知道什么是數(shù)據(jù)科學,所以它完全有可能不是你想要的工作領(lǐng)域。請與LinkedIn上的一些數(shù)據(jù)科學家進行聯(lián)系,請他們喝咖啡并向他們請教;并關(guān)注數(shù)據(jù)科學播客。要成為數(shù)據(jù)科學家需要花費大量的時間和精力,如果僅因你自認為駕馭數(shù)據(jù)科學很酷,然后就一頭扎進去,這并不是冒險的好理由。請確保充分了解數(shù)據(jù)科學中不好的方面,比如數(shù)據(jù)整理,以及構(gòu)建數(shù)據(jù)生產(chǎn)流水線,而這些工作占了數(shù)據(jù)科學家日常工作的大部分時間。
如果你決定要從事數(shù)據(jù)科學領(lǐng)域的工作,那太好了!你首先要做的是學習Python。盡快在MOOC(大規(guī)模網(wǎng)絡(luò)公開課平臺即慕課)上選擇相關(guān)的課程項目。當熟悉Python基本用法后,請學習如何使用Jupyter otebooks工具,并選學一些數(shù)據(jù)科學領(lǐng)域的網(wǎng)絡(luò)公開課。
如果你是完全從零開始的,一開始就以高級的數(shù)據(jù)科學職位為目標可能不太好,選擇一些入門級的職位比較好,比如數(shù)據(jù)可視化或數(shù)據(jù)分析職業(yè)的需求量很大,并且市場需求也大。這些崗位的人員通常與數(shù)據(jù)科學家一起工作,一旦你積累了相關(guān)經(jīng)驗,就為今后的勝任更高級的數(shù)據(jù)科學相關(guān)職位奠定了基礎(chǔ)。
如何包裝個人品牌:如果你已經(jīng)準備好申請工作,你可能會驚訝地發(fā)現(xiàn)個人品牌在數(shù)據(jù)科學中非常重要。由于你沒有任何專業(yè)經(jīng)驗,或者沒有計算機科學專業(yè)的研究生學位,你也許會擔心個人亮點不足。但實際上這可能是最大的優(yōu)勢所在:如自學成才的開發(fā)人員/數(shù)據(jù)科學家,這些將成為公司可以利用的快速學習和努力工作的優(yōu)點。但問題是,你背負著去實現(xiàn)那個形象的重擔:這是一座陡峭的山需要你去攀登,但是回報肯定是值得的。
二:如果你已經(jīng)是一枚軟件工程師
在我遇到的專業(yè)數(shù)據(jù)科學家中約有20%是軟件工程師,一方面,他們有從編寫程序到形成產(chǎn)品的工作經(jīng)驗,是開發(fā)團隊中難得的經(jīng)驗人才。另一方面,對于全棧開發(fā)人員的需求很多,使得公司比較愿意朝著全棧工程師方向培養(yǎng)軟件工程師,即使他們的錄用通知上寫的職位是“數(shù)據(jù)科學”。所以你要避免被當作軟件工程師而不是數(shù)據(jù)科學家。
其他一些建議:
首先可以先往更注重后端/數(shù)據(jù)庫的方向上靠。把深化對數(shù)據(jù)生成線流水線的認識作為良好的開端,可以幫助你建立關(guān)鍵的數(shù)據(jù)處理技能;當然也可以幫你重塑自己,把自己塑造成一個經(jīng)驗豐富的數(shù)據(jù)管理者。
機器學習工程可能是更容易過渡到數(shù)據(jù)科學領(lǐng)域的,因為它和該領(lǐng)域的研究內(nèi)容最接近。你可以先著手部署模型或?qū)⑺鼈兗傻浆F(xiàn)有應(yīng)用程序,因為這可以充分利用你的現(xiàn)有技能,這是邁出第一步的好方法,反正以后你總是可以投入更多精力到模型開發(fā)中的。
為了讓招聘人印象深刻,你很可能需要建立機器學習或數(shù)據(jù)科學項目。那么利用你的軟件工程技能,把這些項目集成到可以向招聘人員和技術(shù)主管展示的應(yīng)用程序中。這會特別有效,因為它很直觀,并體現(xiàn)了你作為一個全棧數(shù)據(jù)科學家的潛力。
要記住的是:在過渡期,你的薪資極大可能會變少。即使是高級軟件工程師換到數(shù)據(jù)科學領(lǐng)域時,通常也是要先過渡到初級職位的,但令人驚訝的是,他們中的很多人在做決定時并沒有考慮這個因素,然而拿到的薪資少了,卻又失望。
如何包裝個人品牌:一個最簡單的方法就是充分利用你的軟件開發(fā)經(jīng)驗。作為初級職員,已經(jīng)知道如何編寫干凈、文檔齊全的代碼,以及如何與他人協(xié)作,這是大多數(shù)職位申請者不具備的。如果要真正做到善于寫“干凈的產(chǎn)品代碼”,你還需要盡可能多的去學習數(shù)據(jù)科學領(lǐng)域中類似的好案例。
三、如果你是相關(guān)專業(yè)的應(yīng)屆畢業(yè)生,新CS、數(shù)學或物理學畢業(yè)生
如果你是應(yīng)屆理科本科,碩士或博士畢業(yè)生,那么你統(tǒng)計學和數(shù)學基礎(chǔ)可能很好。但你可能從來沒有申請過真正的工作職位,也不知道如何準備面試。而且就算你在讀期間一直有編碼,但很可能無法編寫干凈、組織良好的代碼。
所以要記住以下幾點:
你在讀期間所學的R是不夠的。如果你是一名物理學家,并且賭定要用MATLAB或Mathematica的技能找到工作,那這可能不太會如愿;所以學習Python吧。
你可能需要盡快學習這些你沒接觸過的東西:協(xié)作版本控制(學習如何用GitHub與其他人一起工作)、容器化(學習如何使用Docker)和開發(fā)(學習如何用AWS或類似的服務(wù)在云上部署模型)。另外,sql也是必須的。
學習Python中的測試驅(qū)動開發(fā),如何使用文檔字符串,如何對代碼進行模塊化,以及如何使用Jupyter筆記本(如果還不會的話)。
如果你的領(lǐng)域特別注重數(shù)學,那么深度學習可能是一個很好的探索方向。但你可能會發(fā)現(xiàn),從更傳統(tǒng)的“scikit-learn”類型的數(shù)據(jù)科學開始起步,再過渡到深度學習可能更容易。最重要的是要入行,并盡快開始編程。
如何包裝個人品牌::特別是如果你學的是數(shù)學或物理專業(yè),那么最好的策略是要呈現(xiàn)出自己是具有深厚理論知識的人。要做到這一點,你需要能夠自信地解釋各種模型是如何工作的,最好要熟悉文獻中最新的熱點(特別是如果你的目標是深度學習的話)。
當然我所提供的建議并不能涵蓋所有職業(yè)。對于軟件工程師而言,他們確實比其他人走的遠一些,一些有數(shù)學基礎(chǔ)的初學者可能是最適合的深度學習的研究者。但是以上這些建議能為你的技能精進提供一個好的起點。對大數(shù)據(jù)以及人工智能概念都是模糊不清的,該按照什么線路去學習,學完往哪方面發(fā)展,想深入了解,想學習的同學歡迎加入大數(shù)據(jù)學習qq群:458345782,有大量干貨(零基礎(chǔ)以及進階的經(jīng)典實戰(zhàn))分享給大家,并且有清華大學畢業(yè)的資深大數(shù)據(jù)講師給大家免費授課,給大家分享目前國內(nèi)最完整的大數(shù)據(jù)高端實戰(zhàn)實用學習流程體系 。從java和linux入手,其后逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相關(guān)知識一一分享!
轉(zhuǎn)載于:https://blog.51cto.com/14217196/2398229
總結(jié)
以上是生活随笔為你收集整理的大学刚毕业,零基础大数据如何入门?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 梦到亲戚搬家是什么意思啊
- 下一篇: 智能商业大会构造信息化交流平台