日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

基于Urbansound8K数据集的环境声识别的方法简述

發(fā)布時(shí)間:2023/12/29 编程问答 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 基于Urbansound8K数据集的环境声识别的方法简述 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章目錄

  • 摘要
  • 準(zhǔn)備工作
  • 論文整理
  • 參考文獻(xiàn)

摘要

根據(jù)城市環(huán)境聲識(shí)別的要求,為了選擇更優(yōu)的環(huán)境聲事件識(shí)別方案,我對(duì)與UrbanSound8K聲音數(shù)據(jù)集相關(guān)的論文進(jìn)行了搜集、比較、分析,據(jù)此來(lái)給當(dāng)前面臨的識(shí)別率低的問(wèn)題尋找到個(gè)一個(gè)大概的解決方向。最終我對(duì)篩選出來(lái)的10篇論文進(jìn)行了記錄分析。

準(zhǔn)備工作

城市環(huán)境聲數(shù)據(jù)集的選擇
Urbansound8K 是目前應(yīng)用較為廣泛的用于自動(dòng)城市環(huán)境聲分類(lèi)研究的公共數(shù)據(jù)集。這個(gè)數(shù)據(jù)集一共包含8732條已標(biāo)注的聲音片段(<=4s),包含10個(gè)分類(lèi):空調(diào)聲、汽車(chē)?guó)Q笛聲、兒童玩耍聲、狗叫聲、鉆孔聲、引擎空轉(zhuǎn)聲、槍聲、手提鉆、警笛聲和街道音樂(lè)聲。數(shù)據(jù)集保存在百度云:提取碼: tyfa
論文搜索
利用谷歌學(xué)術(shù)搜集關(guān)于Urbansound8K數(shù)據(jù)集的論文,并記錄下論文標(biāo)題,然后用桂電圖書(shū)館的數(shù)據(jù)庫(kù)資源Web of Science和IEEE/IEE Electronic Library對(duì)搜集到的論文進(jìn)行下載,下載到19篇論文(SCI:6),經(jīng)過(guò)翻閱發(fā)現(xiàn)只有10篇文獻(xiàn)是符合需要的,最終對(duì)這10篇文獻(xiàn)進(jìn)行分析總結(jié)。

論文整理

影響力論文題目特征分類(lèi)器分類(lèi)表現(xiàn)
Q4[2]Log-mel spectrogramDilated CNNAccuracy=78%
CA[3]Raw waveformsCRNNAccuracy=79.6%
CA[4]Raw waveformsCNNF1 scores=57,ER=0.5
Q2[5]Log-mel spectrogramSB-CNNAccuracy=79%
Q4[6]Mel-scale spectrogramCNN
CA[7]MFCCCNNAccuracy=83.5%
CA[8]log-mel spectrogramCNNAccuracy=89%
Q3[9]Raw waveforms+Logmel spectrogramDS-CNNAccuracy=92.2%
JA[10]spectrogram,MFCC,CRP imageGoogle NetAccuracy=93%
Q2[11]MFCC/log-mel spectrogram/chroma/spectral contrast and tonnetzDS-CNNAccuracy=97.2%

Tip:Q4:SCI 4區(qū),CA:EI 會(huì)議文章,JA:EI期刊文章
在此不做分析,僅做簡(jiǎn)單比較,對(duì)此感興趣的同學(xué),有問(wèn)題歡迎討論。

參考文獻(xiàn)



總結(jié)

以上是生活随笔為你收集整理的基于Urbansound8K数据集的环境声识别的方法简述的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。