當(dāng)前位置:
首頁(yè) >
深度学习核心技术精讲100篇(八十)-脏数据如何处理?置信学习解决方案
發(fā)布時(shí)間:2025/4/5
56
豆豆
生活随笔
收集整理的這篇文章主要介紹了
深度学习核心技术精讲100篇(八十)-脏数据如何处理?置信学习解决方案
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
前言
在實(shí)際工作中,你是否遇到過(guò)這樣一個(gè)問(wèn)題或痛點(diǎn):無(wú)論是通過(guò)哪種方式獲取的標(biāo)注數(shù)據(jù),數(shù)據(jù)標(biāo)注質(zhì)量可能不過(guò)關(guān),存在一些錯(cuò)誤?亦或者是數(shù)據(jù)標(biāo)注的標(biāo)準(zhǔn)不統(tǒng)一、存在一些歧義?特別是badcase反饋回來(lái),發(fā)現(xiàn)訓(xùn)練集標(biāo)注的居然和badcase一樣?如下圖所示,QuickDraw、MNIST和Amazon Reviews數(shù)據(jù)集中就存在錯(cuò)誤標(biāo)注。
為了快速迭代,大家是不是常常直接人工去清洗這些“臟數(shù)據(jù)”?但數(shù)據(jù)規(guī)模上來(lái)了咋整?有沒(méi)有一種方法能夠自動(dòng)找出哪些錯(cuò)誤標(biāo)注的樣本呢?基于此,本文嘗試提供一種可能的解決方案——置信學(xué)習(xí)。
本文的組織架構(gòu)是:
總結(jié)
以上是生活随笔為你收集整理的深度学习核心技术精讲100篇(八十)-脏数据如何处理?置信学习解决方案的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 深度学习核心技术精讲100篇(七十九)-
- 下一篇: 深度学习核心技术精讲100篇(八十一)-