特征处理
學自 極客時間 《深度學習推薦系統實戰》
特征分為兩類:
- 類別特征(性別、地理位置、季節、天氣、風格)
- 數值型特征(年齡、收入、點擊量、點擊率)
類別特征經過 One-Hot 編碼后放入特征向量、或者 多個的特征值采用 Multi-Hot 編碼
數值特征直接放到特征向量上
- 數值特征有時候,分布跨度很大(比如點擊量 0 - 無窮大),我們需要將其歸一化至 [0,1] 之間,避免其掩蓋其它的特征
- 歸一化不能改變特征值的分布,可以進行分桶,用桶 ID 作為特征
總結
- 上一篇: 天池 在线编程 最小的行程(动态规划)
- 下一篇: LeetCode 1224. 最大相等频