基于Urbansound8K数据集的环境声识别的方法简述
文章目錄
- 摘要
- 準(zhǔn)備工作
- 論文整理
- 參考文獻(xiàn)
摘要
根據(jù)城市環(huán)境聲識(shí)別的要求,為了選擇更優(yōu)的環(huán)境聲事件識(shí)別方案,我對(duì)與UrbanSound8K聲音數(shù)據(jù)集相關(guān)的論文進(jìn)行了搜集、比較、分析,據(jù)此來(lái)給當(dāng)前面臨的識(shí)別率低的問(wèn)題尋找到個(gè)一個(gè)大概的解決方向。最終我對(duì)篩選出來(lái)的10篇論文進(jìn)行了記錄分析。
準(zhǔn)備工作
城市環(huán)境聲數(shù)據(jù)集的選擇
Urbansound8K 是目前應(yīng)用較為廣泛的用于自動(dòng)城市環(huán)境聲分類(lèi)研究的公共數(shù)據(jù)集。這個(gè)數(shù)據(jù)集一共包含8732條已標(biāo)注的聲音片段(<=4s),包含10個(gè)分類(lèi):空調(diào)聲、汽車(chē)?guó)Q笛聲、兒童玩耍聲、狗叫聲、鉆孔聲、引擎空轉(zhuǎn)聲、槍聲、手提鉆、警笛聲和街道音樂(lè)聲。數(shù)據(jù)集保存在百度云:提取碼: tyfa
論文搜索
利用谷歌學(xué)術(shù)搜集關(guān)于Urbansound8K數(shù)據(jù)集的論文,并記錄下論文標(biāo)題,然后用桂電圖書(shū)館的數(shù)據(jù)庫(kù)資源Web of Science和IEEE/IEE Electronic Library對(duì)搜集到的論文進(jìn)行下載,下載到19篇論文(SCI:6),經(jīng)過(guò)翻閱發(fā)現(xiàn)只有10篇文獻(xiàn)是符合需要的,最終對(duì)這10篇文獻(xiàn)進(jìn)行分析總結(jié)。
論文整理
| Q4 | [2] | Log-mel spectrogram | Dilated CNN | Accuracy=78% |
| CA | [3] | Raw waveforms | CRNN | Accuracy=79.6% |
| CA | [4] | Raw waveforms | CNN | F1 scores=57,ER=0.5 |
| Q2 | [5] | Log-mel spectrogram | SB-CNN | Accuracy=79% |
| Q4 | [6] | Mel-scale spectrogram | CNN | |
| CA | [7] | MFCC | CNN | Accuracy=83.5% |
| CA | [8] | log-mel spectrogram | CNN | Accuracy=89% |
| Q3 | [9] | Raw waveforms+Logmel spectrogram | DS-CNN | Accuracy=92.2% |
| JA | [10] | spectrogram,MFCC,CRP image | Google Net | Accuracy=93% |
| Q2 | [11] | MFCC/log-mel spectrogram/chroma/spectral contrast and tonnetz | DS-CNN | Accuracy=97.2% |
Tip:Q4:SCI 4區(qū),CA:EI 會(huì)議文章,JA:EI期刊文章
在此不做分析,僅做簡(jiǎn)單比較,對(duì)此感興趣的同學(xué),有問(wèn)題歡迎討論。
參考文獻(xiàn)
總結(jié)
以上是生活随笔為你收集整理的基于Urbansound8K数据集的环境声识别的方法简述的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 「qqChan」qq的消息推送bot,s
- 下一篇: E2上GBA模拟器的消息