python数据挖掘电影评分分析_Pyhon数据分析项目——男女电影评分差异比较
《用
Python
玩轉(zhuǎn)數(shù)據(jù)》數(shù)據(jù)分析項(xiàng)目
一、程序功能
基于
MovieLens
100k
數(shù)據(jù)集中男性女性對(duì)電影的評(píng)分來(lái)判斷男性還是女性電影
評(píng)分的差異性更大。
二、數(shù)據(jù)來(lái)源
數(shù)據(jù)集下載:
http://files.grouplens.org/datasets/movielens/ml-100k.zip
數(shù)據(jù)含義:
u.data
表示
100k
條評(píng)分記錄,每一列的數(shù)值含義是:
user?id?|?item?id?|?rating?|?timestamp
u.user
表示用戶的信息,每一列的數(shù)值含義是:
user?id?|?age?|?gender?|?occupation?|?zip?code
u.item
文件表示電影的相關(guān)信息,每一列的數(shù)值含義是:
movie/item?id?|?movie?title?|?release?date?|?video?release?date?|IMDb?URL?|?unknown?|
Action?|?Adventure?|?Animation?|?Children's?|?Comedy?|?Crime?|?Documentary?|?Drama?|
Fantasy?|Film-Noir?|?Horror?|?Musical
|?Mystery?|?Romance?|?Sci-Fi?|Thriller?|?War?|
Western?|
#?API
文檔請(qǐng)參考
http://pandas.pydata.org/pandas-docs/stable/
三、分析和參考代碼
基于本數(shù)據(jù)集可以進(jìn)行很多分析,
例如簡(jiǎn)單的可基于男生和女生評(píng)分均值統(tǒng)計(jì)男
女各自最喜愛(ài)的
10
部電影,結(jié)果如下:
>>>?mean_ratings[:10]
gender
F
M
總結(jié)
以上是生活随笔為你收集整理的python数据挖掘电影评分分析_Pyhon数据分析项目——男女电影评分差异比较的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 华为抢购助手_华为荣耀20系列手机采用的
- 下一篇: python 结构数组_Python数组