日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

learning to rank评价指标

發(fā)布時(shí)間:2023/12/10 编程问答 51 豆豆
生活随笔 收集整理的這篇文章主要介紹了 learning to rank评价指标 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章目錄

  • 1 準(zhǔn)確率Mean average precision
    • 1.1 定義
    • 1.2 計(jì)算
  • 2 NDCG(Normalized Discounted Cumulative Gain)
    • 2.1定義
    • 2.2 例子

1 準(zhǔn)確率Mean average precision

1.1 定義

Precision at position k (P@k)是一個(gè)衡量排名前k位的方法,使用兩個(gè)級(jí)別(相關(guān)的和不相關(guān))的相關(guān)性判斷。公式:
P@k=1k∑j=1krjP@k=\dfrac{1}{k}\sum^{k}_{j=1}r^jP@k=k1?j=1k?rj
k是一個(gè)截?cái)辔恢?br /> rj=1r_j=1rj?=1,如果第j個(gè)位置的文檔是相關(guān)的。
rj=0r_j=0rj?=0,否則。

平均準(zhǔn)確率 average precision

AP=1∣D+∣∑j=1NrjP@jAP = \dfrac{1}{|D_+|}\sum^{N}_{j=1}r_j P@jAP=D+?1?j=1N?rj?P@j

∣D+∣|D_+|D+?是關(guān)于查詢的相關(guān)文檔的數(shù)量,也可以認(rèn)為相當(dāng)于相當(dāng)查詢的標(biāo)準(zhǔn)答案的相關(guān)文檔數(shù)量。
j是排序后的文檔結(jié)果。
一般來(lái)說(shuō)會(huì)有很多個(gè)query參與到訓(xùn)練集中。所以要取平均值: Mean average precision。
這個(gè)評(píng)價(jià)指標(biāo)是基于二維的:相關(guān)、不相關(guān)。

1.2 計(jì)算

舉個(gè)例子,現(xiàn)有一個(gè)query,與之相關(guān)的文檔有4——D1,D2,D3,D4,用rank方法檢索后,D2,D3,D4的排序分別是1,3,5,D1沒有搜索到。也就是說(shuō)rank后的結(jié)果:D2,D5,D3,D6,D4。D5,D6是不相關(guān)文檔。
那么AP = 14\dfrac{1}{4}41?(P@1+P@3+P@5)
P@1=11=1P@1=\dfrac{1}{1}=1P@1=11?=1

P@3=23P@3=\dfrac{2}{3}P@3=32?,k=3,從1到3,相關(guān)文檔有2個(gè)。

P@5=35P@5=\dfrac{3}{5}P@5=53?,k=5,從1到5,相關(guān)文檔有3個(gè)。

那么AP = (1/1 + 2/3 + 3/5)/ 4=0.57

2 NDCG(Normalized Discounted Cumulative Gain)

2.1定義

NDCG(Normalized Discounted Cumulative Gain) 歸一化折損累計(jì)增益。

NDCG@k=DCG@kIDCG@kNDCG@k=\dfrac{DCG@k}{IDCG@k}NDCG@k=IDCG@kDCG@k?

DCG@K=∑j=1kg(rj)d(j)DCG@K=\sum^k_{j=1}g(r_j)d(j)DCG@K=j=1k?g(rj?)d(j), g(rj)=2rj?1g(r_j)=2^{r_j}-1g(rj?)=2rj??1,
d(j)=1,2d(j)=1,2d(j)=1,2,j=1,2
d(j)=1log2(j)d(j)=\dfrac{1}{log_2(j)}d(j)=log2?(j)1?,其他情況
也有一種寫法是:DCG@K=∑j=1k2rj?1log2(j+1)DCG@K=\sum^k_{j=1}\dfrac{2^{r_j}-1}{log_2(j+1)}DCG@K=j=1k?log2?(j+1)2rj??1?

這個(gè)計(jì)算公式可以針對(duì)多種分類級(jí)別。例如rj=3,2,1,0r_j=3,2,1,0rj?=3,2,1,0。而且是包含了位置影響因素。相關(guān)性高的,排在前面會(huì)使得整體NDCG分值變大。

IDCG@k為理想情況下最大的DCG值:
IDCG@k=∑j=1k2ideali?1log2(j+1)IDCG@k=\sum^{k}_{j=1}\dfrac{2^{ideal_i}-1}{log_2(j+1)}IDCG@k=j=1k?log2?(j+1)2ideali??1?

2.2 例子

假設(shè)對(duì)于某一個(gè)query,本次搜索召回5個(gè)文檔,其關(guān)聯(lián)分?jǐn)?shù)分別為 3、2、3、0、1、2。

j2rj?12^{r_j}-12rj??1log2(j+1)log_2(j+1)log2?(j+1)res
1313
221.581.26
3321.5
402.320
512.580.38
622.80.71

所以 DCG = 3+1.26+1.5+0+0.38+0.71 = 6.86

接下來(lái)計(jì)算IDCG。假設(shè)這個(gè)query的相關(guān)文檔有6個(gè),相關(guān)性分?jǐn)?shù)為:3、3、3、2、2、1。

jg(rj)g(r_j)g(rj?)d(j)res
1313
231.581.89
3321.5
422.320.86
522.580.77
612.80.35

所以IDCG = 3+1.89+1.5+0.86+0.77+0.35 = 8.37
最終 NDCG@6 = 6.86/8.37 = 81.96%

參考鏈接:https://www.cnblogs.com/by-dream/p/9403984.html https://blog.csdn.net/zimohuakai/article/details/6847453
《LETOR: A benchmark collection for research on learning to rank for information retrieval》

總結(jié)

以上是生活随笔為你收集整理的learning to rank评价指标的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。