當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

第一周：和平之城中的鸟类识别(案例研究)

發(fā)布時間：2024/1/8 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了第一周：和平之城中的鸟类识别(案例研究) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

第一周：和平之城中的鳥類識別案例研究

1.1 為什么是ML策略？
1.2 正交化(Orthogonalization)
1.3 單一數(shù)字評估指標
1.4 滿足和優(yōu)化指標
1.5 訓練 / 開發(fā) / 測試集劃分
- 設立Dev/Test的方法
1.6 開發(fā)集和測試集的大小
1.7 ?? 什么時候改變開發(fā)/測試集和指標
- 步驟：
1.8 為什么是人的表現(xiàn)
1.9 可避免偏差
1.10 理解人的表現(xiàn)
1.11 超過人的表現(xiàn)
1.12 改善模型表現(xiàn)
- 改進方向
第一周測試總結：

本文是結構化機器學習的筆記。

1.1 為什么是ML策略？

快速判斷那些方向比較適合繼續(xù)研究，以免浪費時間。

1.2 正交化(Orthogonalization)

正交化的含義：各個分量互不影響。所以可以分開來考慮。

我們需要達到4個目標

訓練集上好

Dev集上好

Test集上好

現(xiàn)實情況下好

因此我們的目的是為這4種情況，設計4個獨立的按鈕，從而可以在降低訓練集準確率的前提下，提升Dev集的準確率。

1.3 單一數(shù)字評估指標

問題：如果一個分類器在Precision里面比較好，另一個在Recall里面比較好，該怎么選？
Sol:
- F1 Score: $F1\text{ }Score=\frac{2}{\frac{1}{Precision}+\frac{1}{Recall}}$
例子2：
- 不同地區(qū)的錯誤率不同
Sol: 計算平均錯誤率

1.4 滿足和優(yōu)化指標

問題：準確率+時間的指標
設優(yōu)化指標"Accuracy"（需要最值的指標），滿足指標"Running Time"（不等式的指標）
Sol:
$\text{ and } runningTime\leq100ms$
問題：“準確率”+“False Positive”
Sol:
$\text{ and } False Positive\leq1次/天$

1.5 訓練 / 開發(fā) / 測試集劃分

如何設立Dev Set和Test Set?

Dev Set: hold out cross validation set
例子：
假設哦我們有以下地區(qū)的數(shù)據(jù):
- US
- UK
- India
- China
一種劃分開發(fā)/測試數(shù)據(jù)的方法是US/UK作為開發(fā)數(shù)據(jù)，另外的兩個國家作為測試集。
這是一個糟糕的想法，因為我們可能根據(jù)Dev Set的數(shù)據(jù)設計了一效果很好的模型，但是因為開發(fā)集和測試集并沒有同樣的分布，所有會有問題。
這就好比是一個人訓練射中50m的靶，然后真正使用的時候是100m的靶。

設立Dev/Test的方法

關鍵?? ：確保開發(fā)集和訓練集來自同一個分布。（在上面例子中，各個數(shù)據(jù)集里都需要有這4個地區(qū)的數(shù)據(jù)）
所以我們可以將所有數(shù)據(jù)隨機洗牌，放入開發(fā)集和測試集。

1.6 開發(fā)集和測試集的大小

可以只有Train+Dev集，而沒有Test集合。

1.7 ?? 什么時候改變開發(fā)/測試集和指標

當沒有達到預期目的的常見解決思路：

及時改變Metric以適應目的

改變Dev/Test數(shù)據(jù)集，以確保兩者為相同的分布。

如果發(fā)現(xiàn)選出來的算法存在缺陷，則需要及時改變Metric的定義。
例子：

算法錯誤率其他

A	3%	會有一定幾率傳遞不良圖片
B	5%	無

此時，為了避免傳遞不良信息這個巨大的錯誤，我們需要及時修改metric。
$Error=\frac{1}{\sum_iw^{(i)}}\sum_{i=1}^{m_{dev}}w^{(i)} I(y_{pred}^{(i)} \neq y^{(i)})$

其中

$m_{dev}$ 表示dev集的樣本數(shù)量
$w^{(i)}=\left\{\begin{matrix} 1 \text{ 如果x不是不良信息}\\ 100 \text{ 如果x是不良信息} \end{matrix}\right.$ 相當于一個乘法項目
$I(y_{pred}^{(i)} \neq y^{(i)})=1$ 如果 $y_{pred}$ 預測錯誤

步驟：

確定Metric（放靶）

達到目標（放箭），可以通過微調Cost Function的定義。我們總是可以適時地觀察我們已經(jīng)訓練的模型，從而根據(jù)我們的需要修改模型，從而達到我們的預期目的。

1.8 為什么是人的表現(xiàn)

貝葉斯最優(yōu)誤差(Bayes Optimal Error):準確率的上限。（ $x\to y$ 映射的最優(yōu)上限）
我們觀察到當準確率超過人類時，準確率上升速率就變慢了
可能的解釋：
- 人的表現(xiàn)已經(jīng)貝葉斯最優(yōu)誤差很接近了。
- 只要Algs比人類能力強，一些方法就不再有效了。
當Algs不比人類強，有一些可能有效的方法：
- 獲得更多有標簽的數(shù)據(jù)
- 人工對算法誤差進行分析
- 對Bias和Variance方差進行分析

1.9 可避免偏差

用人類水平的誤差估計來代替貝葉斯最優(yōu)誤差，這在計算機視覺里面比較常見。
Avoidable Bias= Human-level error
Variance= Training error
例子：

1.10 理解人的表現(xiàn)

Recap:

用人類水平的誤差估計來代替貝葉斯最優(yōu)誤差

問題：怎么定義人類水平？
例子：醫(yī)療影響分析
Hyp:

我們看的是最高水平，因為人類（或者任何系統(tǒng)）都只能趨近于（小于等于）貝葉斯最優(yōu)誤差。如果能超過人類水平，則可以部署我們訓練的模型了。

當算法水平很高的時候，我們不太確定是否要繼續(xù)改善模型（減小Bias）還是減小方差。因為我們不知道怎么估計貝葉斯最優(yōu)誤差。

1.11 超過人的表現(xiàn)

例如：

人的表現(xiàn) 0.5%
Train Error 0.3%
這時候我們不知道貝葉斯最優(yōu)誤差是否小于0.3%，因為有過擬合的風險。

目前算法比人類強的地方：
這些都是從Structed Data中得到的結果，并不是自然感知任務（如計算機視覺）。

開車路線的時間
貸款
廣告投放

1.12 改善模型表現(xiàn)

對Train Set擬合很好 -> Bias

在dev/test Set上也很好 -> Variance

改進方向

Avoidable Bias改善方法：

訓練一個更大的模型

多訓練一會

改善網(wǎng)絡結構

Variance改善方法：

輸入更多的數(shù)據(jù)

正則化(L2,Dropout)

改善網(wǎng)絡結構

第一周測試總結：

我們需要確定一個評估指標，否則會降低工作效率。我們可以通過優(yōu)化指標和滿足指標將多個指標縮小為一個指標。例如

\text{ and } 內存\leq10Mb

這里準確率就是優(yōu)化指標，內存就是滿足指標。

深度學習領域一般數(shù)據(jù)集的劃分為

訓練集開發(fā)集測試集

95%

2.5%

應該用人類最高水平來估計貝葉斯最優(yōu)誤差。但這里有一個前提，即統(tǒng)計的人數(shù)足夠多，這樣的百分數(shù)才比較準確。

學習算法的性能可以優(yōu)于人類表現(xiàn)，但它永遠不會優(yōu)于貝葉斯錯誤的基準線。

總結

以上是生活随笔為你收集整理的第一周：和平之城中的鸟类识别(案例研究)的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯，歡迎將生活随笔推薦給好友。