统计:mAP的中文意思
生活随笔
收集整理的這篇文章主要介紹了
统计:mAP的中文意思
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
???????? 原文鏈接:http://blog.csdn.net/Lu597203933/article/details/41802155
??????? 之前寫過一篇blog叫做機(jī)器學(xué)習(xí)實(shí)戰(zhàn)筆記之非均衡分類問題:http://blog.csdn.net/lu597203933/article/details/38666699? 其中對(duì)Precision和Recall及ROC都有所講解,其中區(qū)別在于Precision,Recall, F-score, MAP主要用于信息檢索,而ROC曲線及其度量指標(biāo)AUC主要用于分類和識(shí)別,ROC的詳細(xì)介紹見上面的blog,這里的Precision、Recall和上篇blog的計(jì)算結(jié)果其實(shí)是一樣的,只是這里從檢索的角度進(jìn)行理解。
一:Precision, Recall, F-score
?????? 信息檢索、分類、識(shí)別、翻譯等領(lǐng)域兩個(gè)最基本指標(biāo)是召回率(Recall Rate)和準(zhǔn)確率(Precision Rate------注意統(tǒng)計(jì)學(xué)習(xí)方法中precesion稱為精確率,而準(zhǔn)確率為accuracy 是分類正確的樣本除以總樣本的個(gè)數(shù)。),召回率也叫查全率,準(zhǔn)確率也叫查準(zhǔn)率,概念公式:
????????? ? ? 召回率(Recall)=? 系統(tǒng)檢索到的相關(guān)文件 / 系統(tǒng)所有相關(guān)的文件總數(shù);;;亦即預(yù)測(cè)為真實(shí)正例除以所有真實(shí)正例樣本的個(gè)數(shù)
???????????? 準(zhǔn)確率(Precision)=? 系統(tǒng)檢索到的相關(guān)文件 / 系統(tǒng)所有檢索到的文件總數(shù);;;亦即等于預(yù)測(cè)為真實(shí)正例除以所有被預(yù)測(cè)為正例樣本的個(gè)數(shù)
圖示表示如下:
注意:
?( 1 ) 準(zhǔn)確率和召回率是互相影響的,理想情況下肯定是做到兩者都高,但是一般情況下準(zhǔn)確率高、召回率就低,召回率低、準(zhǔn)確率高,當(dāng)然如果兩者都低,那是什么地方出問題了。
(2)如果是做搜索,那就是保證召回的情況下提升準(zhǔn)確率;如果做疾病監(jiān)測(cè)、反垃圾,則是保準(zhǔn)確率的條件下,提升召回。?所以,在兩者都要求高的情況下,可以用F1(或者稱為F-score)來衡量。計(jì)算公式如下:
???????????????????? F1= 2 * P * R / (P + R)
(1) 公式基本上就是這樣,但是如何算圖1中的A、B、C、D呢?這需要人工標(biāo)注,人工標(biāo)注數(shù)據(jù)需要較多時(shí)間且枯燥,如果僅僅是做實(shí)驗(yàn)可以用用現(xiàn)成的語(yǔ)料。當(dāng)然,還有一個(gè)辦法,找個(gè)一個(gè)比較成熟的算法作為基準(zhǔn),用該算法的結(jié)果作為樣本來進(jìn)行比照,這個(gè)方法也有點(diǎn)問題,如果有現(xiàn)成的很好的算法,就不用再研究了。
(2)??? 形象直觀的理解就是Recall要求的是全,寧可錯(cuò)殺一千,不能放過一人,這樣Recall就會(huì)很高,但是precision就會(huì)最低。比如將所有的樣本都判為正例,這是Recall就會(huì)等于1,但是很多負(fù)樣本都被當(dāng)做了正例,在某些情況就不適用,比如郵件過濾,此時(shí)要求的是準(zhǔn)確率,不能是召回率,將所有的郵件都當(dāng)做垃圾郵件肯定是最壞的結(jié)果(此時(shí)Recall=1)。
如果沒有證據(jù)證明你有罪,那么你就有罪,召回率會(huì)很高;如果沒有證據(jù)證明你有罪,那么你就無(wú)罪,召回率會(huì)很低,不全,很多人逍遙法外;
二:MAP
MAP:全稱 mean average precision(平均準(zhǔn)確率)。mAP是為解決P,R,F-measure的單點(diǎn)值局限性的,同時(shí)考慮了檢索效果的排名情況。
計(jì)算如下:
假設(shè)有兩個(gè)主題,主題1有4個(gè)相關(guān)網(wǎng)頁(yè),主題2有5個(gè)相關(guān)網(wǎng)頁(yè)。某系統(tǒng)對(duì)于主題1檢索出4個(gè)相關(guān)網(wǎng)頁(yè),其rank分別為1, 2, 4, 7;對(duì)于主題2檢索出3個(gè)相關(guān)網(wǎng)頁(yè),其rank分別為1,3,5。對(duì)于主題1,平均準(zhǔn)確率為(1/1+2/2+3/4+4/7)/4=0.83。對(duì)于主題 2,平均準(zhǔn)確率為(1/1+2/3+3/5+0+0)/5=0.45。則MAP=(0.83+0.45)/2=0.64。”
參考文獻(xiàn):
1:http://blog.csdn.net/marising/article/details/6543943信息檢索(IR)的評(píng)價(jià)指標(biāo)介紹 - 準(zhǔn)確率、召回率、F1、mAP、ROC、AUC
2:http://blog.sina.com.cn/s/blog_662234020100pozd.htmlMAP(Mean Average Precision)
3:http://wenku.baidu.com/view/ef91f011cc7931b765ce15ec.html
總結(jié)
以上是生活随笔為你收集整理的统计:mAP的中文意思的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 6 月国内电动汽车换电站报告:蔚来占比
- 下一篇: Photoshop显示RGB值问题