日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

分类器交叉验证java_使用交叉验证的KNN分类器

發(fā)布時間:2023/12/10 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 分类器交叉验证java_使用交叉验证的KNN分类器 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

首先,您需要準(zhǔn)確定義您的任務(wù) . F.ex給出R ^(MxN)中的圖像I,我們希望將I分類為包含面部的圖像或沒有面部的圖像 .

我經(jīng)常使用像素分類器,其任務(wù)類似于:對于圖像,我決定每個像素是面像素還是非面像素 .

定義任務(wù)的一個重要部分是提出可以用作訓(xùn)練分類器的基礎(chǔ)的假設(shè) . F.ex我們相信像素強度的分布可用于區(qū)分面部圖像和不包含面部的圖像 .

然后,您需要選擇一些定義圖像的功能 . 這可以通過多種方式完成,您應(yīng)該在分析您正在使用的相同類型的圖像時搜索其他人的行為 .

像素分類中一種廣泛使用的方法是使用像素強度值并對圖像進(jìn)行多尺度分析 . 多尺度分析的想法是不同的結(jié)構(gòu)在稱為尺度的不同模糊水平上最明顯 . 作為例證考慮樹的圖像 . 沒有模糊,我們注意到精細(xì)的結(jié)構(gòu),如小樹枝和樹葉 . 當(dāng)我們模糊圖像時,我們會注意到樹干和主要樹枝 . 這通常用作分割方法的一部分 .

當(dāng)您了解任務(wù)和功能時,可以訓(xùn)練分類器 . 如果您使用kNN和交叉驗證來查找最佳k,則應(yīng)在訓(xùn)練/測試中拆分?jǐn)?shù)據(jù)集,然后在訓(xùn)練/驗證集中拆分訓(xùn)練集 . 然后使用簡化訓(xùn)練集訓(xùn)練并使用驗證集來確定哪個k是最佳的 . 在二元分類的情況下,例如面對非面,錯誤率通常用作性能的度量 .

最后,使用參數(shù)在完整數(shù)據(jù)集上訓(xùn)練分類器并估計其在測試集上的性能 .

A classification example: With or without milk?

作為一個完整的例子,考慮從上面拍攝的一杯咖啡的圖像,因此它顯示了杯子的邊緣圍繞著棕色的盤 . 進(jìn)一步假設(shè)所有圖像都被縮放和裁剪,因此盤的直徑是相同的,并且圖像的尺寸是相同的 . 為了簡化任務(wù),我們將彩色圖像轉(zhuǎn)換為灰度,并將像素強度縮放到范圍[0,1] .

我們想要訓(xùn)練一個分類器,這樣它可以區(qū)分咖啡加牛奶和沒有牛奶的咖啡 . 通過檢查一些咖啡圖像的直方圖,我們看到每個圖像在直方圖中有兩個明顯分開的“凸起” . 我們相信這些顛簸對應(yīng)于前景(咖啡)和背景 . 現(xiàn)在我們假設(shè)前景的平均強度可以用來區(qū)分咖啡牛奶/咖啡 .

為了找到前景像素,我們觀察到因為前景/背景比率是相同的(按設(shè)計),我們可以找到給出每個圖像的比率的強度值 . 然后我們計算前景像素的平均強度,并將此值用作每個圖像的特征 .

如果我們有N個手動標(biāo)記的圖像,我們將其分為訓(xùn)練和測試集 . 然后,我們計算訓(xùn)練集中每個圖像的平均前景強度,給出一組(平均前景強度,標(biāo)簽)值 . 我們想要使用kNN,其中圖像被分配與k個最近圖像的多數(shù)類相同的類 . 我們將距離測量為平均前景像素強度的差的絕對值 .

我們通過交叉驗證搜索最優(yōu)k . 我們使用2倍交叉驗證(aka holdout)來找到最佳k . 我們測試k = {1,3,5}并選擇在驗證集上給出最小預(yù)測誤差的k .

總結(jié)

以上是生活随笔為你收集整理的分类器交叉验证java_使用交叉验证的KNN分类器的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。