日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【数据竞赛】图像赛排行榜拉开100名差距的技巧

發布時間:2025/3/12 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【数据竞赛】图像赛排行榜拉开100名差距的技巧 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作者:??塵沙風塵

Kaggle圖像賽上分技巧之TTA: Test Time Aug

  • 1??TTA(Test Time Aug)

    • 1.1??簡介

    • 1.2??案例(keras)

      • 1.2.1??導入適合當前問題的預測器(ClassPredictor用于分類,SegPredictor用于分割)

      • 1.2.2??用配置和所需的任何參數實例化類

      • 1.2.3??對圖片進行預測

      • 1.2.4??實驗結果

    • 1.3??小結

  • 2??參考文獻

簡介

我們都知道對我們的訓練數據進行翻轉,平移,縮放等擴充的操作往往可以獲得一個訓練更好的網絡模型,這些擴充操作往往可以幫助我們的模型更好的挖掘到那些對于位置,光照等信息不敏感的信息,從而具有更好的泛化性,得到更好的預測結果。那既然訓練集的數據可以擴充,測試集呢?

Bingo!沒錯,測試集也是可以采取類似的操作。而這種操作我們稱之為TTA(Test Time Augmentation),顧名思義就是在測試的階段對數據進行擴充。

TTA是一個非常通用的Trick,目前幾乎絕大多數圖像相關的競賽都會使用到,而且基本是99%都能帶來線上排行榜的提升。那么究竟是怎么做的呢?其實很簡單:

就是在模型測試時,對原始的測試圖像進行各種策略的擴充,例如:

  • 圖像裁剪;

  • 圖像縮放;

  • 圖像旋轉;

  • 圖像平移;

  • ...

然后我們將預測的結果進行某種程度的融合,最常見的就是取平均值,然后將該分數作為最終的預測分數。

TTA操作較早出現在2015年ICLR的論文"Very Deep Convolutional Networks for Large-Scale Image Recognition"

We also augment the test set by horizontal flipping of the images; the soft-max class posteriors of the original and flipped images are averaged to obtain the final scores for the image.


案例(基于Keras)

以kaggle Dogs VS Cats為例,?edafa (TTA package)

1. 導入適合當前問題的預測器(ClassPredictor用于分類,SegPredictor用于分割)

from?edafa?import?ClassPredictor?

2.繼承預測器類并實現主函數:predict_patches(self,patches)

class?myPredictor(ClassPredictor):def?__init__(self,model,*args,**kwargs):super().__init__(*args,**kwargs)self.model?=?modeldef?predict_patches(self,patches):return?self.model.predict(patches)

3. 用配置和所需的任何參數實例化類

conf?=?'{"augs":["NO",\"FLIP_LR"],\"mean":"ARITH"}'

4. 對圖片進行預測

p?=?myPredictor(model,conf) y_pred_aug?=?p.predict_images(X_val) y_pred_aug?=?[(y[0]>=0.5).astype(np.uint8)?for?y?in?y_pred_aug?] print('Accuracy?with?TTA:',np.mean((y_val==y_pred_aug)))

5. 實驗結果

  • 使用TTA:Accuracy with TTA: 0.7892

  • 不適用TTA:Accuracy without TTA: 0.7852571428571429

小結

TTA技術目前是各大圖像相關的數據競賽的必備技能之一,它能為最終的成績帶來非常大的幫助,也是目前圖像賽的必備技能之一,趕緊收藏吧!

參考文獻

  • Kaggle小技巧:TTA(test time augmentation)測試時加強:https://www.shangmayuan.com/a/0e4942dc496047bb95c5806c.html

  • https://github.com/qubvel/ttach

  • https://www.kaggle.com/andrewkh/test-time-augmentation-tta-worth-it

  • 往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯 本站知識星球“黃博的機器學習圈子”(92416895) 本站qq群704220115。 加入微信群請掃碼:

    總結

    以上是生活随笔為你收集整理的【数据竞赛】图像赛排行榜拉开100名差距的技巧的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。