数据分析常用知识体系
數據分析常用知識體系
【數據獲取】
一、獲取原始數據
1、從數據庫?/?數據倉庫中獲取(數據庫?+?數據倉庫?+ SQL提數)
2、爬蟲爬取(R語言爬蟲?+ Python爬蟲)
3、手工整理(問卷數據錄入、數據表制作等)
二、獲取整理好的數據
1、數據資源下載(統計局、經管之家等)
2、數據資源調取(R語言內置數據集、Python內置數據集)
【數據預處理】
一、數據庫
1、常用數據庫基礎知識(Mysql、sqlServer、Oracle、Hbase + Hive)
2、SQL語句(數據查詢select from、數據去重distinct、數據限制where、數據排序order by、數據順序desc + asc、數據分組group by、數據過濾having、數據鎖定limit、條件關聯and + or + in / not in、通配符like + _、計算字段count + max + avg等、子查詢、表聯結inner join + left join + right join、插入數據insert into、創建表create、更新數據update、刪除數據delete、刪除表drop)
二、EXCEL
1、工作表處理(格式設置、數據編輯)
2、數據查看(篩選、排序、查找替換、分類匯總、數據透視表、數據透視圖)
3、函數(vlookup、計算函數等)?+?圖表制作(基礎圖形?+?改進圖形)
三、R
1、數據讀寫(讀取csv文件、讀取txt文件等)
2、數據查看(查看數據整體情況View、查看數據前幾行head和后幾行tail、查看數據的維度dim、查看數據的類型class、查看數據中各變量的基礎情況str、查看數據長度length)
3、數據檢查與基本處理(數據轉換as.vector + as.data.frame、數據連接rbind + cbind等)
4、數據運算(數學運算、統計運算、函數運算)
5、數據清洗(缺失值、異常值、數據格式化)
四、Python
同上述R語言,但為Python代碼
【數據建模分析】
一、常用業務模型
1、通用業務模型(RFM?、AARRR、5W2H、波士頓矩陣、波特五力模型、4P理論等)
2、行業專用模型(教育行業、互聯網行業、交通行業、醫藥行業等)
二、常用數學?/?統計?/?機器學習知識
1、描述統計(平均數、中位數、眾數、方差、標準差、分位數、極差、偏度、峰度等)
2、推斷統計(區間估計、假設檢驗、方差分析、回歸分析)
3、常用模型(關聯規則、決策樹、聚類分析、神經網絡、SVM、隨機森林等)
4、模型評價(混淆矩陣、ROC曲線等)
三、R
上述各模型的R代碼
四、Python
上述各模型的Python代碼
——————————————————★
互聯網數據分析崗位求職備戰手冊
總結
以上是生活随笔為你收集整理的数据分析常用知识体系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android 超级简单的沉浸式状态栏
- 下一篇: html制作文字效果,使用backgro