日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

PageRank算法改进

發(fā)布時間:2024/3/7 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 PageRank算法改进 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

PageRank算法的應用

PageRank 算法是 Google 搜索引擎進行網(wǎng)頁排名的一種算法,那么它如何映射到其他領域?

比如,我們?nèi)绾卧谖墨I排名中應用PageRank算法呢?

對文獻的質(zhì)量進行排序是對文獻價值進行評估的一種重要手段,目的是為了方便人員在檢索時查閱。

統(tǒng)計文獻的被引次數(shù)是一種非常直觀的統(tǒng)計方式,在此基礎之上,我們引入了 PageRank算法:該算法基于網(wǎng)頁之間的鏈接關系評估網(wǎng)頁的價值,由于互聯(lián)網(wǎng)與文獻引用網(wǎng)絡之間存在著較大的相似性,所以基于文獻之間的引用網(wǎng)絡使用 PageRank 算法可以更合理的對于文獻的價值評估。

該算法基于一種投票關系:A 文對 B 文進行了引用是因為 A 文認為 B 文質(zhì)量較高,即通過引用的方式給B文投票,之后再通過投票關系對文獻進行排名。

根據(jù)PageRank的原理,在文獻排名的過程中,PageRank 算法同樣遵循以下兩個基本假設:

  • 數(shù)量假設。如果一篇文獻 A 被其他文獻引用,說明其他文獻認為文獻 A 比較重要,也就是其他文獻將自己的 PageRank 值貢獻給 A。表明 A 是一篇有質(zhì)量的文獻,所以文獻 A 的 PageRank 值會比較高。
  • 質(zhì)量假設。如果一篇高 PageRank 值的文獻引用了一篇其他的文獻,則被引用的文獻的 PageRank 值也因此而提高。
  • 算法的公式形式不變,如下所示,但是其中各個量的含義會發(fā)生變化。

    其中 p 代表某個待評價的學術文獻,d是阻尼系數(shù)。CTotal 是文獻總量。N 表示 N 篇引用了 p 的文獻,Xi 表示第 i 個引用了 p的文獻,C(Xi)表示 Xi 這篇文獻總的參考文獻數(shù)目。

    看下面的例子,假如這是迭代過程中的一個片段,PR值的分配傳遞過程如下圖所示:

    偽代碼如下:

    PageRank算法基于時間的改進和迭代優(yōu)化

    針對傳統(tǒng) PageRank 算法迭代過程復雜、時效性不強、執(zhí)行速度慢等缺點,可以進行了優(yōu)化迭代過程、增加時間因子影響函數(shù)、并行化三點改進。

    我們將改進的算法稱為NTMP 算法——在優(yōu)化迭代過程時,通過對于被引文獻的特征進行統(tǒng)計,按照權威度的方式進行 NTMP 值分配。根據(jù)文獻被引半衰期這一特征,使用時間因子影響函數(shù)更好的對文獻價值進行評價。最后將改進后的算法進行了基于MapReduce 計算框架的并行化處理,最終構成 NTMP 算法。

    加入時間影響因子

    NTMP 算法進行文獻評價時有如下三點假設:

    1)數(shù)量假設

    2)質(zhì)量假設

    3)影響力衰減假設:一篇文章的影響力不是一成不變的,其影響力會根據(jù)時間的推移進行適當衰減。如果不對文獻的影響力在時間上進行約束,就會造成在文獻排名時,影響力較大的總是那些發(fā)表時間久遠、被引次數(shù)多的文獻,新發(fā)表的文獻不能被很好的評價,這就導致了新發(fā)表的文獻在排名時一直處于比較靠后的位置,不能受到很好的重視。所以僅考慮文獻之間的引用關系而忽略時間因素在文獻排名過程中的不利影響是不夠的。尤其研究者們應該重視那些新發(fā)表的文獻,這些文獻代表著當前研究趨勢、研究熱點。

    這里引入了文獻半衰期的概念。

    半衰期是指放射性元素的原子核有半數(shù)發(fā)生衰變時所需要的時間。

    這里給出的定義如下:在 N 年(某一年時間內(nèi))被引用的文獻中,較新的一半是在最近 X 內(nèi)發(fā)表的。這個 X 就是文獻被引半衰期。例如某一年,整個數(shù)據(jù)集中共發(fā)表文獻 176922 篇,其中累積引用計算機學科文獻 289421 頻次,再根據(jù)定義求得文獻被引半衰期為 6.78 年。

    根據(jù)定義:

    其中,W 是所求的被引半衰期,U 是累積百分比小于且最接近 50%的年數(shù),X 為統(tǒng)計年至 U 年的被引累積百分比,Y 為統(tǒng)計年至 U+1 年的被引累計百分比。

    有了這個半衰期的定義,我們建立一個時間影響因子函數(shù):

    其中,HL(t)為文獻價值剩余百分比,CTotal 代表的是該數(shù)據(jù)集中初始時刻(t=0 )所有文獻的數(shù)量,t 是衰變時間,T 為計算機學科文獻被引半衰期。時間因子影響函數(shù)HL(t)的含義是在計算機學科中,某一篇文獻從發(fā)表(t=0 )開始,經(jīng)過 t 時間后,文獻的剩余價值變?yōu)樵瓉淼?HL(t)倍。

    迭代優(yōu)化

    在進行 PR 值的傳遞時,傳統(tǒng)算法會將每篇文獻的 PR 值平均分給該文獻所引用的其他文獻。

    ?NTMP算法的改進:將NTMP 值向著那些重要的文獻流動,提升分配效率和收斂速度。

    BC_Sum是文獻集合R(X)中所有文獻 Pj 的被引次數(shù)之和。

    W(X,p)是計算集合R(X)某一篇文獻 P 被引次數(shù)的所占比重,可以理解為文獻 P 在分配 X 的 NTMP 值時所占權重。

    NTMP 算法的輸入是基礎文獻信息,包括文獻發(fā)表時間,文獻引用關系等,輸出是各待評價樣本的 NTMP 值,可以根據(jù) NTMP 值對待評價樣本進行排名。

    根據(jù)上述改進方法,NTMP 算法的公式為:

    其中 xi 引用了文獻 P 的施引文獻,NTMP(xi)表示上一次迭代結束后 x 的 NTMP值,函數(shù) W(Xi,P)是之前提出的 NTMP 值分配方式,函數(shù) HL(t)是時間因子影響函數(shù),d 是阻尼系數(shù)一般取 0.85,CTotal 是數(shù)據(jù)集中的文獻總量。

    PageRank算法在分布式集群中的應用

    Map階段:計算出每條樣本給其參考文獻所貢獻的 NTMP 值

    Reduce階段:將 Map 階段所傳出的每一篇 Xi 為 P所貢獻的 NTMP 值相加,再乘以阻尼 d,之后加上調(diào)整項即為文獻 P 的 NTMP 值

    具體過程如下:

    map階段:

    reduce階段:

    本文參考論文《基于Hadoop的學術文獻排名及作者影響力評價算法》崔景洋

    總結

    以上是生活随笔為你收集整理的PageRank算法改进的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 最新国产精品自拍 | 91综合视频 | av网站不卡 | 国产全是老熟女太爽了 | 国产日韩片| 久久发布国产伦子伦精品 | 国产精品日韩在线观看 | av色图| 麻豆传媒在线免费 | 网友自拍一区 | 亚洲视频精品一区 | 欧美另类精品xxxx孕妇 | 婷婷综合色 | 久久久久久久精 | 亚洲制服在线观看 | 欧美在线一区视频 | 在线色网站 | 欧美日韩在线一区 | 日日噜噜噜夜夜爽爽狠狠视频97 | 久久国产精品国语对白 | 精品人妻午夜一区二区三区四区 | 26uuu精品一区二区在线观看 | 少妇久久久久久被弄到高潮 | 欧美国产日韩在线 | 中文字幕视频网 | 人人舔人人爽 | 国产在线观看免费视频软件 | 色偷偷综合网 | 欧美两根一起进3p做受视频 | 国产三级精品三级在线观看 | 日韩亚洲欧美一区 | 色香蕉影院 | av不卡高清| 丁香一区二区 | 国产精品毛片久久久 | 德国艳星videos极品hd | 密桃av在线| 污站在线观看 | 国产中文字幕一区二区三区 | 国产成人精品一区二区三区在线观看 | 日韩一区二区三区不卡视频 | 亚洲精选国产 | 天堂福利在线 | 韩国精品一区二区 | 日本精品一区二区三区视频 | 夜夜艹| 国产精品久久久久久亚洲调教 | 麻豆av网址| 国产精品18久久久久久久久 | 最新中文字幕在线播放 | 少妇被爽到高潮动态图 | av片网| 亚洲一片 | 免费看黄色的网址 | av动态| 国产高清在线免费 | 黄a视频| 性做久久久久久免费观看 | 97国产视频| 日b视频免费看 | 欧美性爱精品在线 | 国产亚洲欧美精品久久久www | 毛片女人| 亚洲综合热 | 香蕉网在线观看 | 欧美日韩精品区 | 色综合久久88色综合天天免费 | 小镇姑娘1979版 | 国产三级一区 | 国内外成人免费视频 | 久久久久黄色片 | 九九天堂网 | 国语对白一区 | 看全黄大色黄大片 | 无码人妻一区二区三区线 | 天天爽夜夜爽人人爽 | 久久免费视频3 | 国产a免费观看 | 日韩欧美在线视频观看 | 性福利视频| 一区二区国产在线 | 久久久久亚洲av片无码v | 播放灌醉水嫩大学生国内精品 | 亚洲一区二区三区中文字幕 | 国产成人精品一区二区三区福利 | 人人草人人搞 | 色网站在线播放 | 精品乱码久久久久久中文字幕 | 亚洲逼 | 欧美视频在线免费 | 国产主播在线播放 | 国产熟妇搡bbbb搡bbbb搡 | 欧美a网| 日韩欧美资源 | 后入内射欧美99二区视频 | 日韩福利一区二区三区 | 秋霞毛片少妇激情免费 | 国产女教师一区二区三区 | 午夜激情网站 |