日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

OA(part2)--Outlier Evaluation Techniques

發布時間:2023/12/19 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 OA(part2)--Outlier Evaluation Techniques 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

學習筆記,僅供參考,有錯必糾
機翻,建議看英文原著


Outlier Evaluation Techniques


一個關鍵的問題是如何評估離群點檢測算法的有效性。不幸的是,這通常是一項困難的任務,因為根據定義,異常值很少。這意味著將數據點標記為異常值或非異常值通常是不可用的。對于無監督算法來說尤其如此,因為如果基本事實確實可用,它可以用來創建更有效的有監督算法。在無監督的情況下(沒有基本事實),通常很難以嚴格的方式判斷底層算法的有效性。因此,許多研究文獻使用案例研究來提供對無監督場景中潛在異常值的直觀定性評估。


在像數據聚類這樣的其他無監督問題中,一種常見的方法是使用內部有效性度量,其中使用“好”的模型來度量算法的有效性。例如,數據聚類中的一個常見的好的度量是聚類的均方半徑。這些措施的主要問題在于,它們僅僅提供了一個概念,即“善”的模型與學習的模型匹配得有多好。畢竟,在無監督的問題中,沒有辦法知道善的“正確”模型;矛盾的是,如果我們知道這個正確的模型,那么我們應該在算法中使用它,而不是用于評估。事實上,通過選擇一個與優度模型相關的算法來博弈這樣的內部有效性模型相對容易;這個問題在聚類領域是眾所周知的[33]。這也稱為內部評價中的過擬合問題。在離群點檢測中,這個問題要嚴重得多,因為離群點標簽中的少量變化會極大地影響性能。例如,與線性(例如,基于主成分分析)技術相比,基于距離的內部測量更傾向于基于距離的算法。相反,內部有效性的線性模型更傾向于基于主成分分析的技術?

總結

以上是生活随笔為你收集整理的OA(part2)--Outlier Evaluation Techniques的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。