工作总结-基于R的数据分析
終于有那么一丟丟時間,可以來把關于R語言編程的工作梳理一下。
總體來說,工作內容主要是將公司已有的excel模板的數據分析內容轉為R語言形式,目前寫了四個產品的數據清洗和分析代碼。
在這中間,學習到了很多新知識。對接下來,編程之路的走向有了初步的規劃。對數據分析這塊也增加了認識吧。
關于新知識:
1、較大數據的處理來說,學習了data.table包,感覺是非常強大的。
所做的工作是將之前基于data frame的計算代碼轉成了data.table的形式來進行運算,效率是有提升的。因為data.table本身的DT[ ]是具有一定功能的,當然更多的功能還在繼續學習中。
2、數據整理,進一步熟練了tidyr,dplyr等r包的使用。
比如使用seperate來實現excel中的分列功能。
使用merge來實現excel中的vlookup功能。
多種方法來剔除缺失值,比如按照缺失比例刪除等?;蛱蕹囟ǖ臄祿?#xff0c;這里主要基于filter系列的函數進行,例如filter_at等。
關于時間在R語言里的轉換等問題也進行了整理。
3、數據分析思路上,更多的考慮使用簡小的代碼,而非使用過多的for循環等。
關于數值計算,要考慮矩陣化運算。
4、還有tidyverse這個加載包的神器,開發者當然是哈德利大神,簡直是我偶像了。
5、還有其他一些零零碎碎的內容就不細說了。
更多的使用pply函數。
能不用循環就不用,盡量尋找哈德利大神寫的種種函數,哈哈這個也很重要哦。
總的來說,還是需要投機取巧一些的。
關于接下來的學習路徑:
1、advanced R和R數據科學兩本書要刷完,第一本年底前看完吧,第二本的話11月底。
2、R中常做的統計分析要自己做一個總結,這個可以參考R語言實戰的介紹。
3、關于測量學方面的知識,可以將R IRT那本書作為參考。大概看一遍吧,完成期限為年底前。
數據分析:
這依然是我的興趣方向,因為從數據中看到很多問題真的很有意思。
但是近段時間的了解,感覺數據分析在職業的上升通道上是有瓶頸的。
因此數據分析作為工具,用的好,當然好,但主攻它對個人來說,價值似乎沒有那么高。當然我說的只是普通的數據分析,AI那些屬于另一個世界了。
所以,還是需要發散思路,廣開視角吧,不要把自己限制在自己的安逸區了,當然不能忽視提高自己這方面的技能。
目前的目標還是把R&數據分析搞個底朝天吧。
?
就近期的工作心境來說,似乎緊張的次數變少了,現在幾乎沒有了,這是好事嗎,也不盡然,畢竟不緊張在一定程度上也說明了不太關注。
但就工作內容的完成情況來說,個人是滿意的,畢竟每個工作都在最大能力內做到自己滿意了。通過這段時間的工作,感覺自己能力也有不少提高吧,特別是在調研能力和PPT制作&匯報能力上(入職以來感覺每周都要報告。。。讓人頭冷)。
啊對,我還要練習英語口語。希望一個月之后能有個提高吧。
?
轉載于:https://www.cnblogs.com/JoAnnal/p/9799726.html
總結
以上是生活随笔為你收集整理的工作总结-基于R的数据分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: .NET 中 如果一个Task A正在a
- 下一篇: 域选项