大数据学习首页
感謝@吳彬彬老師-網易數據分析師
1.線上指導
識別異常:
邏輯回歸分析
欺詐分析和預測建模:
簡單應用場景:表示出哪些訂單是欺詐的,給它打上標簽
可以實現上述應用的還可以借鑒:
神經網絡,邏輯回歸,SVM,線性回歸等等
推薦書籍:
《數據挖掘:概念與技術》
大數據企業的應用一般都是通過多模型的對比,然后經過優化迭代的方式。
除了推薦的書籍外,還可以借鑒商業公司的《數據咨詢報告》。掌握各個行業的方法論,這樣有利于數據建模和程序設計,本人是電力行業的,會在之后的階段中更新一下對電力行業的相關分析,到時候會有通知。
實現場景:網易云音樂
keywords: 推薦
經常在職業招聘網站上面看到這兩個字樣,就網易云音樂而言,它是多種模型的混合。
1.用戶搜索意圖的識別算法
思路:
音樂標簽的意圖推薦。
實現相同的效果還有遺傳算法和簡單的加權權重算法
設計商業智能應用:
- 業務分析
- 咨詢項目
- 數據挖掘項目
- 精細化營銷項目
2.Action
1.Hadoop方向
Hadoop問題集錦
Hadoop操作記錄(1)—單機(偽分布)
Hadoop操作記錄(2)—完全分布式
3.資源收集
1.閱讀完成
1.七種最常見的Hadoop和Spark項目
2.看完你就牛了!2014年大數據行業深度梳理總結
3.盤點大數據生態圈,那些繁花似錦的開源項目
4.數據科學家應該掌握的5個工具
5.數據科學家應該掌握的5個工具(英文版)
6.數據可視化專題站(OUR D3.JS)
7.2015 Bossie評選:最佳開源大數據工具
8.大數據集
2.網站地址收集
1.36大數據
2.百度開放云
3.Hadoop權威指南(書籍)官方網站
4.紫數-大數據門戶
總結
- 上一篇: PDF编辑器哪个好,怎么在PDF中添加图
- 下一篇: 2019年密码与安全新技术讲座-课程总结