基于Urbansound8K数据集的环境声识别的方法简述
生活随笔
收集整理的這篇文章主要介紹了
基于Urbansound8K数据集的环境声识别的方法简述
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
文章目錄
- 摘要
- 準備工作
- 論文整理
- 參考文獻
摘要
根據城市環境聲識別的要求,為了選擇更優的環境聲事件識別方案,我對與UrbanSound8K聲音數據集相關的論文進行了搜集、比較、分析,據此來給當前面臨的識別率低的問題尋找到個一個大概的解決方向。最終我對篩選出來的10篇論文進行了記錄分析。
準備工作
城市環境聲數據集的選擇
Urbansound8K 是目前應用較為廣泛的用于自動城市環境聲分類研究的公共數據集。這個數據集一共包含8732條已標注的聲音片段(<=4s),包含10個分類:空調聲、汽車鳴笛聲、兒童玩耍聲、狗叫聲、鉆孔聲、引擎空轉聲、槍聲、手提鉆、警笛聲和街道音樂聲。數據集保存在百度云:提取碼: tyfa
論文搜索
利用谷歌學術搜集關于Urbansound8K數據集的論文,并記錄下論文標題,然后用桂電圖書館的數據庫資源Web of Science和IEEE/IEE Electronic Library對搜集到的論文進行下載,下載到19篇論文(SCI:6),經過翻閱發現只有10篇文獻是符合需要的,最終對這10篇文獻進行分析總結。
論文整理
| Q4 | [2] | Log-mel spectrogram | Dilated CNN | Accuracy=78% |
| CA | [3] | Raw waveforms | CRNN | Accuracy=79.6% |
| CA | [4] | Raw waveforms | CNN | F1 scores=57,ER=0.5 |
| Q2 | [5] | Log-mel spectrogram | SB-CNN | Accuracy=79% |
| Q4 | [6] | Mel-scale spectrogram | CNN | |
| CA | [7] | MFCC | CNN | Accuracy=83.5% |
| CA | [8] | log-mel spectrogram | CNN | Accuracy=89% |
| Q3 | [9] | Raw waveforms+Logmel spectrogram | DS-CNN | Accuracy=92.2% |
| JA | [10] | spectrogram,MFCC,CRP image | Google Net | Accuracy=93% |
| Q2 | [11] | MFCC/log-mel spectrogram/chroma/spectral contrast and tonnetz | DS-CNN | Accuracy=97.2% |
Tip:Q4:SCI 4區,CA:EI 會議文章,JA:EI期刊文章
在此不做分析,僅做簡單比較,對此感興趣的同學,有問題歡迎討論。
參考文獻
總結
以上是生活随笔為你收集整理的基于Urbansound8K数据集的环境声识别的方法简述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 「qqChan」qq的消息推送bot,s
- 下一篇: E2上GBA模拟器的消息