日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

OA(part2)--Outlier Evaluation Techniques

發(fā)布時(shí)間:2023/12/19 编程问答 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 OA(part2)--Outlier Evaluation Techniques 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

學(xué)習(xí)筆記,僅供參考,有錯(cuò)必糾
機(jī)翻,建議看英文原著


Outlier Evaluation Techniques


一個(gè)關(guān)鍵的問(wèn)題是如何評(píng)估離群點(diǎn)檢測(cè)算法的有效性。不幸的是,這通常是一項(xiàng)困難的任務(wù),因?yàn)楦鶕?jù)定義,異常值很少。這意味著將數(shù)據(jù)點(diǎn)標(biāo)記為異常值或非異常值通常是不可用的。對(duì)于無(wú)監(jiān)督算法來(lái)說(shuō)尤其如此,因?yàn)槿绻臼聦?shí)確實(shí)可用,它可以用來(lái)創(chuàng)建更有效的有監(jiān)督算法。在無(wú)監(jiān)督的情況下(沒(méi)有基本事實(shí)),通常很難以嚴(yán)格的方式判斷底層算法的有效性。因此,許多研究文獻(xiàn)使用案例研究來(lái)提供對(duì)無(wú)監(jiān)督場(chǎng)景中潛在異常值的直觀定性評(píng)估。


在像數(shù)據(jù)聚類這樣的其他無(wú)監(jiān)督問(wèn)題中,一種常見(jiàn)的方法是使用內(nèi)部有效性度量,其中使用“好”的模型來(lái)度量算法的有效性。例如,數(shù)據(jù)聚類中的一個(gè)常見(jiàn)的好的度量是聚類的均方半徑。這些措施的主要問(wèn)題在于,它們僅僅提供了一個(gè)概念,即“善”的模型與學(xué)習(xí)的模型匹配得有多好。畢竟,在無(wú)監(jiān)督的問(wèn)題中,沒(méi)有辦法知道善的“正確”模型;矛盾的是,如果我們知道這個(gè)正確的模型,那么我們應(yīng)該在算法中使用它,而不是用于評(píng)估。事實(shí)上,通過(guò)選擇一個(gè)與優(yōu)度模型相關(guān)的算法來(lái)博弈這樣的內(nèi)部有效性模型相對(duì)容易;這個(gè)問(wèn)題在聚類領(lǐng)域是眾所周知的[33]。這也稱為內(nèi)部評(píng)價(jià)中的過(guò)擬合問(wèn)題。在離群點(diǎn)檢測(cè)中,這個(gè)問(wèn)題要嚴(yán)重得多,因?yàn)殡x群點(diǎn)標(biāo)簽中的少量變化會(huì)極大地影響性能。例如,與線性(例如,基于主成分分析)技術(shù)相比,基于距離的內(nèi)部測(cè)量更傾向于基于距離的算法。相反,內(nèi)部有效性的線性模型更傾向于基于主成分分析的技術(shù)?

總結(jié)

以上是生活随笔為你收集整理的OA(part2)--Outlier Evaluation Techniques的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。