日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

无监督学习:异常检测与剔除(局部异常因子法 SVM异常检测器)

發布時間:2025/3/15 编程问答 17 豆豆
生活随笔 收集整理的這篇文章主要介紹了 无监督学习:异常检测与剔除(局部异常因子法 SVM异常检测器) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.前言

前面介紹的都是有監督學習的回歸和分類算法。有監督學習是指對輸入和輸出都有成對出現的訓練樣本{(xi,yi)}。在這里,主要介紹在沒有輸出信息時,只利用輸入樣本{xi}的信息進行無監督學習的方法。本篇博客重點討論刪除樣本{xi}中包含異常值的方法。 異常值檢測,是指找出給定的輸入樣本{xi}中包含的異常值的問題。雖然再有監督回歸和有監督分類里面我們也研究了對異常值具有較高魯棒性的學習法,但是當樣本中包含較多異常值的時候,先除去異常值在進行學習的方法,一般會更有效。 如果是給定了帶有正常值和異常值標簽的數據,異常檢測就可以看做是有監督學習的分類問題。但是異常值的種類繁多,一般而言,要想從商量的異常數據中訓練出有效的、可以區分正常和異常數據的分類器是很困難的。 下面開始討論兩種無監督的異常檢測方法,一種是局部異常因子法,另一種是支持向量機異常檢測器。此外也會介紹通過在訓練集{xi}之上附加正常樣本集{x'i},進行更高精度的異常檢測的"弱監督異常檢測法"。

2.局部異常因子

局部異常因子,是指對偏離大部分數據的異常數據進行檢測的方法。 首先,從x到x'的可達距離定義如下:
RD=Reachability distance.xk表示的是訓練樣本xi中距離x第k近的樣本。從x到x`的可達距離是指,從x到x`的直線距離為||x-x'||.如果x'比xk距離x更近,那么直接使用||x-xk||的值表示。使用這個可達距離,x的局部可達密度可由下式加以定義:

LRD=Local Reachability Density.x的局部可達密度,是從xi到x的可達距離平均值的倒數。當x的訓練樣本密度值很高的時候,局部可達密度的值也比較大。 應用這個局部可達密度,x的局部異常因子可有下式加以定義:
LOF=Local Outlier Factor.LOF(x)的值越大,x的異常度就越大。LOFk(x)是xi的局部可大密度的平均值與x的局部可達密度的比。當xi的周圍的密度比較高而x周圍的密度比較低的時候,局部異常因子就會比較大,x就會被看作異常值被對待。 下面是一個局部異常因子的實例。顯而易見,偏離大部分正常值的數據點具有較高的異常值:
各個樣本周圍圓的半徑,與樣本的局部異常因子的值成正比 圓的半徑越大,其樣本越傾向于異常值 局部異常因子,是遵循預先指定的規則(偏離大部分正常值的數據被認為異常值),尋找異常值的無監督方法。所以,如果事先指定的規則與我們的期望不相符,就不能找到正確的異常值。雖然通過改變近鄰數k的值也可以在某種程度上對異常檢測做出調整。但是對于無監督學習而言,由于通常不會給定有關異常值得任何信息,所以近鄰數k的取值一直是一個非常難得的問題。另外,為了尋找k近鄰樣本,需要計算所有n個訓練樣本間的距離并進行分組,當n非常大的時候,計算負荷也會相應的增加,這也是我們必須考慮的問題。

3.支持向量機異常檢測

在無監督學習的異常檢測中引入學習要素,即為支持向量機異常檢測器。 支持向量機異常檢測器會求出幾乎包含所有訓練樣本xi的超球,并肩沒有包含在超球內的訓練樣本看做是異常值。具體而言,就是通過求解下屬的最優化問題來求得超球的球心c和半徑R:
支持向量機異常檢測器
這樣就變成了與SVM類似的最優化問題。其拉格朗日函數如下所示:
一樣的。a和β就是我們常說的拉格朗日待定因子,該優化問題也就變成了拉格朗日對偶問題:
求偏導,置零可以得到最優條件:
這樣,拉格朗日對偶問題就可以通過下式表示:
這又是一個二次規劃問題(KKT最優化問題)。 其結論與SVM也是非常相似的:
  • ai=0時,樣本xi位于超球的表面與內側;
  • 0<ai<C時,樣本xi位于超球表面;(支持向量
  • ai=C時,樣本位于超球的表面或外側。
由于支持向量機異常檢測器是通過數據對超球的中心或半徑進行學習的,因此可以得到較為理想的異常檢測結果。然而,異常檢測的結果對于正則化參數C,核函數的種類選擇(如果選擇核映射)具有較強的依賴性。所以在實際應用中,如何確定這些參數的最優值是一項很重要的工作。

4.基于密度比的異常檢測

基于密度比估計的異常檢測,是靈活應用正常值得信息對異常值進行監測的方法,因此可以不用事先確定異常值的種類,直結合數據本身進行適宜的異常檢測。另外,通過把異常檢測問題轉化為密度比的計算問題。對基準KL進行交叉驗證,就可以通過客觀的方法確定基函數中包含的各個參數了。實際中還是很有價值的。

總結

以上是生活随笔為你收集整理的无监督学习:异常检测与剔除(局部异常因子法 SVM异常检测器)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产裸体永久免费无遮挡 | 黄色草逼视频 | 国产精品一区二区久久毛片 | 天天操夜夜撸 | 成人国产精品久久久网站 | 亚洲乱码中文字幕久久孕妇黑人 | 日韩中出| 在线免费看黄网站 | 妻色成人网| 天天摸天天射 | 欧美成人一二三区 | gav成人 | 欧美性猛交一区二区三区精品 | 精品国产96亚洲一区二区三区 | 久久精品www| 午夜影院久久久 | 国产成人在线影院 | 99在线精品视频 | 大桥未久视频在线观看 | 久久精品视频在线免费观看 | 国产毛片91 | 九色自拍| 涩涩视频在线播放 | 国产91一区二区三区在线精品 | 久青草视频在线 | 91精品国产综合久久国产大片 | 日韩伦人妻无码 | 国产精品国产三级国产专区53 | 狠狠艹av| 自偷自拍av | 日韩一区二区三区在线播放 | 色呦呦在线免费观看 | 欧美成人h | 九九色视频 | 国产微拍一区 | 欧美日韩国产激情 | 国产精品麻豆果冻传媒在线播放 | 91在线精品一区二区 | 高潮流白浆在线观看 | 黄色免费国产 | 蜜色视频| 日本一区二区三区成人 | www.天天干.com| 日韩福利在线观看 | 欧美激情在线一区二区 | 久久久久久国产精品视频 | 1024亚洲 | 丁香婷婷综合激情五月色 | 99re8在线精品视频免费播放 | 国产尤物在线观看 | 人妻丰满熟妇岳av无码区hd | 亚洲午夜精品一区二区三区 | 美女xx00| 国产欧美日韩综合精品一区二区 | 久久97精品 | www.色网站 | 中文字幕一区二区不卡 | 成年在线观看 | 久久久精品中文字幕 | 亚洲精品乱码久久久久久写真 | 18成人在线观看 | 青青久操 | 国产绿帽刺激高潮对白 | 国产精品不卡一区二区三区 | 日韩精品在线免费观看视频 | 欧美日韩国产图片 | 亚洲视屏 | 综合久久激情 | 久久精品国产一区二区 | 热热色原网址 | 你懂的在线视频网站 | 欧美在线观看一区二区三区 | 在线看一区二区 | 久久精品毛片 | a三级黄色片 | 久久久久久久久久成人 | 亚洲一区a| 国产精品久久久久久久久久久免费看 | 久久天堂影院 | 中文字母av | 91精品毛片 | 欧美在线v | 岛国中文字幕 | 久久精品6 | 一区二区在线观看视频 | 麻豆免费在线观看 | 黄色一级片免费在线观看 | 日韩欧美中文字幕一区二区三区 | 丰满熟妇人妻中文字幕 | 亲嘴扒胸摸屁股免费视频日本网站 | 国产91久久婷婷一区二区 | 午夜性 | 精品乱子伦一区二区 | 韩国一级淫一片免费放 | 丰满人妻综合一区二区三区 | av青青| 精品人人妻人人澡人人爽牛牛 | 欧美一区二区高清视频 | 久久大胆视频 |