【机器学习-数据科学】第三节:数据分析实例 分析MovieLens电影数据
生活随笔
收集整理的這篇文章主要介紹了
【机器学习-数据科学】第三节:数据分析实例 分析MovieLens电影数据
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
數據分析實例 分析MovieLens電影數據
- 導入數據
- 數據合并
- 按性別查看各個電影的平均評分
- 活躍電影排行榜
電影投票數據
grouplens.org/datasets/movielens
把文件放到這個路徑下
導入數據
數據合并
按性別查看各個電影的平均評分
查看男女評分差別最大的
按照diff去排序 找出分歧最大的就好啦
活躍電影排行榜
評分個數
這些就是最熱門的電影(前十大熱門電影)
下面找評分最高的電影
但是現在結果是很多評分高的用戶少的不知名的電影排行很高
為了解決這個問題
先看一下前十大熱門電影的評分
前二十大高分電影
下面看一下前二十大高分電影的熱度,我們用前二十大電影作為索引
我們用前二十大熱門電影作為索引
我們為了避免上面問題的出現,我們首先要找熱度比較高的電影,有足夠的評分次數
然后用熱度足夠高的電影去找到這個評分
我們再來看一下前二十啊
總結
以上是生活随笔為你收集整理的【机器学习-数据科学】第三节:数据分析实例 分析MovieLens电影数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Python基础知识-pycharm版
- 下一篇: oracle如何检查是否rac,Orac