日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

第一周:和平之城中的鸟类识别(案例研究)

發布時間:2024/1/8 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 第一周:和平之城中的鸟类识别(案例研究) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

第一周:和平之城中的鳥類識別 案例研究

  • 1.1 為什么是ML策略?
  • 1.2 正交化(Orthogonalization)
  • 1.3 單一數字評估指標
  • 1.4 滿足和優化指標
  • 1.5 訓練 / 開發 / 測試集劃分
    • 設立Dev/Test的方法
  • 1.6 開發集和測試集的大小
  • 1.7 ?? 什么時候改變開發/測試集和指標
    • 步驟:
  • 1.8 為什么是人的表現
  • 1.9 可避免偏差
  • 1.10 理解人的表現
  • 1.11 超過人的表現
  • 1.12 改善模型表現
    • 改進方向
  • 第一周測試總結:

本文是結構化機器學習的筆記。

1.1 為什么是ML策略?

  • 快速判斷那些方向比較適合繼續研究,以免浪費時間。

1.2 正交化(Orthogonalization)

  • 正交化的含義:各個分量互不影響。所以可以分開來考慮。

我們需要達到4個目標

  • 訓練集上好
  • Dev集上好
  • Test集上好
  • 現實情況下好
  • 因此我們的目的是為這4種情況,設計4個獨立的按鈕,從而可以在降低訓練集準確率的前提下,提升Dev集的準確率。

    1.3 單一數字評估指標

    • 問題:如果一個分類器在Precision里面比較好,另一個在Recall里面比較好,該怎么選?

    • Sol:

      • F1 Score: F 1 S c o r e = 2 1 P r e c i s i o n + 1 R e c a l l F1\text{ }Score=\frac{2}{\frac{1}{Precision}+\frac{1}{Recall}} F1?Score=Precision1?+Recall1?2?
    • 例子2:

      • 不同地區的錯誤率不同
    • Sol: 計算平均錯誤率

    1.4 滿足和優化指標

    • 問題:準確率+時間的指標

    • 優化指標"Accuracy"(需要最值的指標),滿足指標"Running Time"(不等式的指標)

    • Sol:
      m a x ( A c c u r a c y ) and? r u n n i n g T i m e ≤ 100 m s max(Accuracy) \text{ and } runningTime\leq100ms max(Accuracy)?and?runningTime100ms

    • 問題:“準確率”+“False Positive”

    • Sol:
      m a x ( A c c u r a c y ) and? F a l s e P o s i t i v e ≤ 1 次 / 天 max(Accuracy) \text{ and } False Positive\leq1次/天 max(Accuracy)?and?FalsePositive1/

    1.5 訓練 / 開發 / 測試集劃分

    如何設立Dev Set和Test Set?

    • Dev Set: hold out cross validation set

    • 例子:
      假設哦我們有以下地區的數據:

      • US
      • UK
      • India
      • China

      一種劃分開發/測試數據的方法是US/UK作為開發數據,另外的兩個國家作為測試集。

    • 這是一個糟糕的想法,因為我們可能根據Dev Set的數據設計了一效果很好的模型,但是因為開發集和測試集并沒有同樣的分布,所有會有問題。

    • 這就好比是一個人訓練射中50m的靶,然后真正使用的時候是100m的靶。

    設立Dev/Test的方法

    關鍵?? :確保開發集和訓練集來自同一個分布。(在上面例子中,各個數據集里都需要有這4個地區的數據)
    所以我們可以將所有數據隨機洗牌,放入開發集和測試集。

    1.6 開發集和測試集的大小

    可以只有Train+Dev集,而沒有Test集合。

    1.7 ?? 什么時候改變開發/測試集和指標

    當沒有達到預期目的的常見解決思路:

  • 及時改變Metric以適應目的
  • 改變Dev/Test數據集,以確保兩者為相同的分布。
    • 如果發現選出來的算法存在缺陷,則需要及時改變Metric的定義。
    • 例子:
    算法錯誤率其他
    A3%會有一定幾率傳遞不良圖片
    B5%

    此時,為了避免傳遞不良信息這個巨大的錯誤,我們需要及時修改metric。
    E r r o r = 1 ∑ i w ( i ) ∑ i = 1 m d e v w ( i ) I ( y p r e d ( i ) ≠ y ( i ) ) Error=\frac{1}{\sum_iw^{(i)}}\sum_{i=1}^{m_{dev}}w^{(i)} I(y_{pred}^{(i)} \neq y^{(i)}) Error=i?w(i)1?i=1mdev??w(i)I(ypred(i)??=y(i))

    其中

    • m d e v m_{dev} mdev?表示dev集的樣本數量
    • w ( i ) = { 1 如果x不是不良信息 100 如果x是不良信息 w^{(i)}=\left\{\begin{matrix} 1 \text{ 如果x不是不良信息}\\ 100 \text{ 如果x是不良信息} \end{matrix}\right. w(i)={1?如果x不是不良信息100?如果x是不良信息?相當于一個乘法項目
    • I ( y p r e d ( i ) ≠ y ( i ) ) = 1 I(y_{pred}^{(i)} \neq y^{(i)})=1 I(ypred(i)??=y(i))=1 如果 y p r e d y_{pred} ypred?預測錯誤

    步驟:

  • 確定Metric(放靶)
  • 達到目標(放箭),可以通過微調Cost Function的定義。我們總是可以適時地觀察我們已經訓練的模型,從而根據我們的需要修改模型,從而達到我們的預期目的。
  • 1.8 為什么是人的表現

    • 貝葉斯最優誤差(Bayes Optimal Error):準確率的上限。( x → y x\to y xy映射的最優上限)
    • 我們觀察到當準確率超過人類時,準確率上升速率就變慢了
    • 可能的解釋:
      • 人的表現已經貝葉斯最優誤差很接近了。
      • 只要Algs比人類能力強,一些方法就不再有效了。
    • 當Algs不比人類強,有一些可能有效的方法:
      • 獲得更多有標簽的數據
      • 人工對算法誤差進行分析
      • 對Bias和Variance方差進行分析

    1.9 可避免偏差

    • 人類水平的誤差估計來代替貝葉斯最優誤差,這在計算機視覺里面比較常見。
    • Avoidable Bias= Human-level error
    • Variance= Training error
    • 例子:

    1.10 理解人的表現

    • Recap:

    人類水平的誤差估計來代替貝葉斯最優誤差

    • 問題:怎么定義人類水平?

    • 例子:醫療影響分析

    • Hyp:

    我們看的是最高水平,因為人類(或者任何系統)都只能趨近于(小于等于)貝葉斯最優誤差。如果能超過人類水平,則可以部署我們訓練的模型了。

    當算法水平很高的時候,我們不太確定是否要繼續改善模型(減小Bias)還是減小方差。因為我們不知道怎么估計貝葉斯最優誤差

    1.11 超過人的表現

    例如:

    • 人的表現 0.5%
    • Train Error 0.3%
      這時候我們不知道貝葉斯最優誤差是否小于0.3%,因為有過擬合的風險。

    目前算法比人類強的地方:
    這些都是從Structed Data中得到的結果,并不是自然感知任務(如計算機視覺)。

    • 開車路線的時間
    • 貸款
    • 廣告投放

    1.12 改善模型表現

  • 對Train Set擬合很好 -> Bias
  • 在dev/test Set上也很好 -> Variance
  • 改進方向

    • Avoidable Bias改善方法:
  • 訓練一個更大的模型
  • 多訓練一會
  • 改善網絡結構
    • Variance改善方法:
  • 輸入更多的數據
  • 正則化(L2,Dropout)
  • 改善網絡結構
  • 第一周測試總結:

  • 我們需要確定一個評估指標,否則會降低工作效率。我們可以通過優化指標滿足指標將多個指標縮小為一個指標。例如 m a x ( 準 確 率 ) and? 內 存 ≤ 10 M b max(準確率) \text{ and } 內存\leq10Mb max()?and?10Mb
    這里準確率就是優化指標,內存就是滿足指標。
  • 深度學習領域一般數據集的劃分為
  • 訓練集開發集測試集
    95%2.5%2.5%
  • 應該用人類最高水平來估計貝葉斯最優誤差。但這里有一個前提,即統計的人數足夠多,這樣的百分數才比較準確。
  • 學習算法的性能可以優于人類表現,但它永遠不會優于貝葉斯錯誤的基準線。
  • 總結

    以上是生活随笔為你收集整理的第一周:和平之城中的鸟类识别(案例研究)的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 欧美乱码精品一区二区三区 | 中文字幕精品一区 | 蜜桃精品视频在线 | 人妻久久久一区二区三区 | 国产femdom调教7777 | 九九热久久免费视频 | 国产妇女馒头高清泬20p多 | 丁香啪啪综合成人亚洲 | 久久av无码精品人妻系列试探 | 在线观看免费中文字幕 | 秋霞av鲁丝片一区二区 | 厕拍极品 | 夜夜春很很躁夜夜躁 | 日本性欧美 | 午夜性生活视频 | 久草中文在线观看 | 欧美激情在线免费 | 色天堂在线视频 | 亚洲美女啪啪 | 久久久久不卡 | 巨大乳の揉んで乳榨り奶水 | 色噜噜综合网 | 狠狠干天天色 | 亚洲综合久久av一区二区三区 | 一区二区欧美日韩 | 色欲无码人妻久久精品 | 北条麻纪在线观看aⅴ | 夜夜视频 | 让男按摩师摸好爽视频 | 欧美xxxx83d| 日本男男激情gay办公室 | www黄色| 青青草国产在线 | 黄色成人免费网站 | 成人做爰69片免费 | 久久国产精品影视 | zzjizzji亚洲日本少妇 | 亚洲成a| 九色视频自拍 | 色婷婷久久一区二区三区麻豆 | 午夜片在线 | 黄片毛片在线免费观看 | yellow免费在线观看 | 91免费看黄 | 亚洲va久久久噜噜噜无码久久 | 青青青国产精品一区二区 | 性爱动漫 | 秋霞欧美一区二区三区视频免费 | 超碰av男人的天堂 | 日本在线有码 | 久久人人爽人人爽人人 | 国产精品尤物 | 国产97在线 | 亚洲 | 亲切的金子餐桌片段的金子 | 国内毛片视频 | 国产又粗又黄又爽又硬的视频 | 美女乱淫| 国产一级自拍 | 精品一区二区三区四区五区六区 | 2024男人天堂 | 国产男女啪啪 | 日本中文字幕在线 | 天天爱天天色 | 精品国产青草久久久久96 | 毛片你懂的 | 美女色诱男人激情视频 | 羞羞的视频在线观看 | 亚洲成人一级 | av观看网址 | 日韩av免费网址 | 欧美高清69hd | 国产精品人妖 | 人体私拍套图hdxxxx | 青青视频网站 | 无码一区二区 | 国产又粗又猛又爽又黄无遮挡 | 陪读偷伦初尝小说 | 女人性做爰69片免费看 | 日韩伊人久久 | 91麻豆国产精品 | 初尝情欲h名器av | 搞黄视频在线观看 | 在线观看国产欧美 | 奇米四色在线视频 | 毛片最新网址 | 日韩一区二区三区不卡视频 | 午夜天堂在线观看 | 国产区在线观看 | 无码aⅴ精品一区二区三区 精品久久在线 | 久久久久亚洲av无码麻豆 | 性高潮视频在线观看 | 影音先锋国产在线 | 激情小说图片视频 | 国产精品男同 | 久久久免费观看 | 成人快色 | 欧洲精品码一区二区三区免费看 | 亚洲色成人网站www永久四虎 | 女女互磨互喷水高潮les呻吟 |