當前位置：首頁 >

【数据竞赛】图像赛排行榜拉开100名差距的技巧

發布時間：2025/3/12 37 豆豆

生活随笔收集整理的這篇文章主要介紹了【数据竞赛】图像赛排行榜拉开100名差距的技巧小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作者:??塵沙風塵

Kaggle圖像賽上分技巧之TTA: Test Time Aug

1??TTA(Test Time Aug)
- 1.1??簡介
- 1.2??案例(keras)
- - 1.2.1??導入適合當前問題的預測器（ClassPredictor用于分類，SegPredictor用于分割）
  - 1.2.2??用配置和所需的任何參數實例化類
  - 1.2.3??對圖片進行預測
  - 1.2.4??實驗結果
- 1.3??小結
2??參考文獻

簡介

我們都知道對我們的訓練數據進行翻轉，平移，縮放等擴充的操作往往可以獲得一個訓練更好的網絡模型，這些擴充操作往往可以幫助我們的模型更好的挖掘到那些對于位置，光照等信息不敏感的信息，從而具有更好的泛化性，得到更好的預測結果。那既然訓練集的數據可以擴充，測試集呢？

Bingo！沒錯，測試集也是可以采取類似的操作。而這種操作我們稱之為TTA(Test Time Augmentation)，顧名思義就是在測試的階段對數據進行擴充。

TTA是一個非常通用的Trick，目前幾乎絕大多數圖像相關的競賽都會使用到，而且基本是99%都能帶來線上排行榜的提升。那么究竟是怎么做的呢？其實很簡單：

就是在模型測試時，對原始的測試圖像進行各種策略的擴充，例如：

圖像裁剪；
圖像縮放；
圖像旋轉；
圖像平移;
...

然后我們將預測的結果進行某種程度的融合，最常見的就是取平均值，然后將該分數作為最終的預測分數。

TTA操作較早出現在2015年ICLR的論文"Very Deep Convolutional Networks for Large-Scale Image Recognition"

We also augment the test set by horizontal flipping of the images; the soft-max class posteriors of the original and flipped images are averaged to obtain the final scores for the image.

案例(基于Keras)

以kaggle Dogs VS Cats為例,?edafa (TTA package)

1. 導入適合當前問題的預測器（ClassPredictor用于分類，SegPredictor用于分割）

from?edafa?import?ClassPredictor?

2.繼承預測器類并實現主函數：predict_patches(self,patches)

class?myPredictor(ClassPredictor):def?__init__(self,model,*args,**kwargs):super().__init__(*args,**kwargs)self.model?=?modeldef?predict_patches(self,patches):return?self.model.predict(patches)

3. 用配置和所需的任何參數實例化類

conf?=?'{"augs":["NO",\"FLIP_LR"],\"mean":"ARITH"}'

4. 對圖片進行預測

p?=?myPredictor(model,conf) y_pred_aug?=?p.predict_images(X_val) y_pred_aug?=?[(y[0]>=0.5).astype(np.uint8)?for?y?in?y_pred_aug?] print('Accuracy?with?TTA:',np.mean((y_val==y_pred_aug)))

5. 實驗結果

使用TTA:Accuracy with TTA: 0.7892
不適用TTA：Accuracy without TTA: 0.7852571428571429

小結

TTA技術目前是各大圖像相關的數據競賽的必備技能之一，它能為最終的成績帶來非常大的幫助，也是目前圖像賽的必備技能之一，趕緊收藏吧！

參考文獻

Kaggle小技巧:TTA（test time augmentation）測試時加強：https://www.shangmayuan.com/a/0e4942dc496047bb95c5806c.html

https://github.com/qubvel/ttach

https://www.kaggle.com/andrewkh/test-time-augmentation-tta-worth-it

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯本站知識星球“黃博的機器學習圈子”（92416895）本站qq群704220115。加入微信群請掃碼：

總結

以上是生活随笔為你收集整理的【数据竞赛】图像赛排行榜拉开100名差距的技巧的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【机器学习】使用MLflow管理机器学习
下一篇：腾讯视频如何设置缓存画质和个数