论文 | 信息检索结果Ranking的评价指标《RankDCG: Rank-Ordering Evaluation Measure》
未經允許,不得轉載,謝謝~~
一 文章簡介
為什么要提出這個新的評價算法?
二 排序問題描述
- A為一系列元素: A = [x1,x2,x3,...,xn];
- f(x)度量了元素x與query的相關性,f(x)屬于0-1;
- 通常我們能在A中的n個元素找到m個相關的元素,并按相關性由高到低進行排序得到目標結果B;
- B = [x|x ∈ A,f(x) > 0], 且 B = [ f(x1) > f(x2) > f(x3) > ... > f(xm) ];
- 在這里每個元素都是相關的;
- 待排序的都是離散值;
- 會出現多個元素具有相同等級的情況;
- 排序結果可能會出現只有非常少數的top result是相關的情況;
三 現有評價方法
信息檢索領域有多個方法來評價rank ordering的好壞,但是沒有一個對上面描述的這種問題是完全適用的,接下來先看看目前常用的一些評價算法。
3.1 F-measure(F-score)
同時考慮了檢測精度p和召回率r;
3.2 Average Precision and Mean Average Precision
AP
- 其中:P(k) = precision@k , ?R(k) = |recall(k?1)?recall(k)|.
- 其實理論上的AP應該等于綠色的precision-recall線的下方面積,而用近似計算就等于看成是一小塊的長方形的面積之和,即為圖中紅色虛線的下方面積。
MAP
- 其中:Q 是query的集合,而q是單個的query,即對所有query的AP求平均。
3.3 Kendall’s τ
這個算法考慮了給定list和結果list之間元素對之間的匹配程度;
關于這個算法這里給出一個具體的例子:
3.4 Discounted Cumulative Gain (DCG)
本文也是自己與這個算法做的改進;
rel()指的是相關度度量函數,i 表示元素所在的位置;
四 本文評價算法:RankDCG
下面兩張圖為standard DCG與別人改進的DCG在各個元素上的cost圖:
具體步驟是:在L中有10個rank值,但是只有4個不同的rank,所以按照rank value對元素進行分組,得到4,那個第一個sublist的rankvalue就改成4,后面的sublist依次遞減。
這樣可以得都到以下的結果圖,可以看到整個cost下降更均衡了。
文章做的第二個工作就是將基于位置的折損改成新的折損系統,具體方法是對L‘的rank value做一個翻轉,將值依次賦給各個sublist。最后得到:
這時候的cost圖為:
最后也模仿DCG->nDCG的過程,做了一次歸一化,即最終的RankDCG算法等于:
寫在最后
寫完了嘻嘻~~
簡書不支持公式真的有點小小的不方便,所有的公式都來自論文presentation的截圖。
最后,不是做信息檢索的,這篇論文只是課程的一個報告,有理解不正確或者不到位之處歡迎大佬評論獲或者私信謝謝ヾ(?°?°?)ノ゙
</div>總結
以上是生活随笔為你收集整理的论文 | 信息检索结果Ranking的评价指标《RankDCG: Rank-Ordering Evaluation Measure》的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Financial Report财务报表
- 下一篇: adc0809 c语言程序,ADC080