日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

关于 mahout factorize-movielens-1M.sh 执行

發(fā)布時(shí)間:2023/12/18 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 关于 mahout factorize-movielens-1M.sh 执行 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

mahout 0.9? hadoop 1.2.1 新手上路 請(qǐng)多指教;

?需要運(yùn)行 /examples/bin/factorize-movielens-1M.sh 即 ALS 推薦算法,數(shù)據(jù)集從movielens官網(wǎng)上下載?根據(jù)腳本文件,首先需要 將ratings.csv文件 放置在hdfs 文件系統(tǒng)中(/tmp/mahout-work-{$USER}),不然mahout 會(huì)找不到輸入路徑,這點(diǎn)在腳本文件里看不到,如果放在本地文件系統(tǒng)中,該腳本始終運(yùn)行不成功;

接下來(lái) 按照腳本文件 順序執(zhí)行, 但是 速度之慢 令人發(fā)指(由于之前在 spark scala執(zhí)行過 同樣的算法);

第1步是 分割數(shù)據(jù)集為 訓(xùn)練集和測(cè)試集 ,比較快;

第2步是 運(yùn)行 分布式的ALS算法,根據(jù)腳本文件總共iteration 10 次,總共耗時(shí)28分鐘(19:00 ~19:28),輸出結(jié)果在指定的hdfs? 路徑中

第3步是 根據(jù) 測(cè)試集 計(jì)算 RMSE值,本次實(shí)驗(yàn)值為1.9233056087885207

第4步是 計(jì)算推薦結(jié)果 ,總耗時(shí) (Minutes: 33.89475)? 結(jié)果分別存儲(chǔ)在 /tmp/mahout-work-crystal/recommendations/part-m-00000? part-m-00001? part-m-00002 文件中。部分推薦結(jié)果展示如下。1?? ?[21594:5.0,176346:5.0,27082:5.0,76134:5.0,21262:5.0,126310:5.0]
2?? ?[11111:5.0,151858:5.0,187261:5.0,154758:5.0,132710:5.0,193670:5.0]
3?? ?[150162:5.0,125323:5.0,78600:5.0,189325:5.0,138854:5.0,106806:5.0]
4?? ?[214252:5.0,182906:5.0,134862:5.0,57552:5.0,57610:5.0,17673:5.0]
5?? ?[69574:5.0,22014:5.0,22302:5.0,115892:5.0,117109:5.0,201437:5.0]
6?? ?[216281:5.0,18095:5.0,99810:5.0,201194:5.0,118216:5.0,202405:5.0]
7?? ?[82039:5.0,69574:5.0,77150:5.0,216493:5.0,85303:5.0,26756:5.0]
8?? ?[9091:5.0,63326:5.0,49299:5.0,97888:5.0,81740:5.0,214349:5.0]
9?? ?[14640:5.0,33901:5.0,118654:5.0,80297:5.0,16061:5.0,113005:5.0]
10?? ?[36730:5.0,167973:5.0,17908:5.0,163526:5.0,192192:5.0,25297:5.0]
11?? ?[111334:5.0,120355:5.0,48520:5.0,80740:5.0,191782:5.0,182794:5.0]
12?? ?[41426:5.0,103975:5.0,146438:5.0,78255:5.0,4508:5.0,134427:5.0]
14?? ?[163822:5.0,79466:5.0,17673:5.0,56068:5.0,90542:5.0,4094:5.0]
13?? ?[13334:5.0,49540:5.0,128646:5.0,207650:5.0,10598:5.0,108255:5.0]
15?? ?[167273:5.0,85015:5.0,192817:5.0,9597:5.0,103171:5.0,2415:5.0]
16?? ?[35302:5.0,112253:5.0,9091:5.0,76807:5.0,14310:5.0,49299:5.0]
17?? ?[134862:5.0,63532:5.0,176943:5.0,163526:5.0,135958:5.0,216717:5.0]
18?? ?[144686:5.0,18330:5.0,33758:5.0,70359:5.0,60828:5.0,64721:5.0]
20?? ?[191265:5.0,80756:5.0,149302:5.0,169835:5.0,48754:5.0,76186:5.0]
19?? ?[103522:5.0,173735:5.0,63396:5.0,20917:5.0,70894:5.0,179231:5.0]

輸出 結(jié)果 路徑 展示:

轉(zhuǎn)載于:https://www.cnblogs.com/superzhu/p/hadoop_mahout.html

總結(jié)

以上是生活随笔為你收集整理的关于 mahout factorize-movielens-1M.sh 执行的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。