日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

      歡迎訪問 生活随笔!

      生活随笔

      當前位置: 首頁 > 编程语言 > python >内容正文

      python

      [Spark][Python]PageRank 程序

      發布時間:2025/4/5 python 18 豆豆
      生活随笔 收集整理的這篇文章主要介紹了 [Spark][Python]PageRank 程序 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

      PageRank 程序:

      file contents:

      page1 page3
      page2 page1
      page4 page1
      page3 page1
      page4 page2
      page3 page4


      def computeContribs(neighbors,rank):
      ? ? for neighbor in neighbors: yield( neighbor, rank/len(neighbors) )

      ?

      links = sc.textFile("tst001.txt").map(lambda line: line.split()).map(lambda pages: (pages[0],pages[1]))\
      .distinct().groupByKey().persist()

      ranks=links.map(lambda (page,neighbors): (page,1.0) )


      In [4]: for x in range(1):
      ...: print "links count:"+links.count()
      ...: print "ranks count:" ranks.count()


      In [11]: for x in range(3):
      ....: contribs=links.join(ranks).flatMap( lambda (page,(neighbors,rank)): computeContribs(neighbors,rank) )
      ....: ranks=contribs.reduceByKey(lambda v1,v2: v1+v2).map(lambda (page,contrib): (page,contrib*0.85+0.15))
      ....:


      for rank in ranks.collect(): print rank

      (u'page2', 0.394375)
      (u'page3', 1.2619062499999998)
      (u'page4', 0.8820624999999999)
      (u'page1', 1.4616562499999997)

      ?

      總結

      以上是生活随笔為你收集整理的[Spark][Python]PageRank 程序的全部內容,希望文章能夠幫你解決所遇到的問題。

      如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。