DCASE 2013任务1(声学场景分类)参赛作品相关信息
本文資料來(lái)源于DCASE 2013以及上面下載的各個(gè)參賽組的技術(shù)報(bào)告(應(yīng)該就是擴(kuò)展摘要)
參賽者及其作品:
注意:圖中的參考文獻(xiàn)[46-56]就是對(duì)應(yīng)的參賽者提交作品的技術(shù)報(bào)告(也就是擴(kuò)展摘要)。
(1)Chum et al[1]
簡(jiǎn)介:這里開(kāi)發(fā)了兩種算法:第一種是基于隱馬爾可夫模型(HMM)和高斯混合模型(GMM)。 所使用的特征包括短時(shí)傅立葉變換,響度和光譜稀疏度。 第二種算法在基于幀的層面上應(yīng)用支持向量機(jī)(SVM)。
code:CHR
方法:在兩個(gè)框架的不同的特征,分類(lèi):(a):前框架SVM+多數(shù)表決;(b):HMM
開(kāi)發(fā)語(yǔ)言:matlab
相關(guān)的文章:M. Chum, A. Habshush, A. Rahman, and C. Sang, “IEEE AASP scene classification challenge using hidden Markov models and frame based classification,” 2013.
成員:
- Dan Stowell(dan.stowell@eecs.qmul.ac.uk),Manager
- Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
- Mark Plumbley (m.plumbley@surrey.ac.uk),Manager
(2)Geiger et al[3]
- 簡(jiǎn)介:這是對(duì)聲學(xué)場(chǎng)景分類(lèi)的IEEE AASP挑戰(zhàn)的貢獻(xiàn)。 從30秒長(zhǎng)的高可變錄音中,提取頻譜,倒譜,能量和聲音相關(guān)的音頻特征。 使用滑動(dòng)窗口方法來(lái)獲得短段上低級(jí)特征的統(tǒng)計(jì)學(xué)特征。 SVM用于對(duì)這些短段進(jìn)行分類(lèi),并采用多數(shù)投票方案來(lái)獲得整個(gè)記錄的決策。 關(guān)于挑戰(zhàn)的官方發(fā)展,實(shí)現(xiàn)了73%的準(zhǔn)確性。 使用t統(tǒng)計(jì)量的特征分析表明,主要的Mel譜是最相關(guān)的特征。
code:GSR
方法:不同的特征,在4秒的窗口中使用SVM進(jìn)行分類(lèi),然后投票表決
開(kāi)發(fā)語(yǔ)言:Weka/HTK
相關(guān)文章:
- (1)J. T. Geiger, B. Schuller, and G. Rigoll, “Recognising acoustic scenes with large-scale audio feature extraction and SVM,” 2013.
- (2)J. T. Geiger, B. Schuller, and G. Rigoll, “Large-Scale Audio Feature Extraction and SVM for Acoustic Scene Classification,” in WASPAA, 2013, p. 4.(有代碼)
成員:
- Dan Stowell (dan.stowell@eecs.qmul.ac.uk),Manager
- Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
- Jürgen Geiger (geiger@tum.de),Manager
- Mark Plumbley (m.plumbley@surrey.ac.uk),Manager
Olivetti[8]
簡(jiǎn)介:我們提出一種方法,將一般對(duì)象(如音頻樣本)有效地嵌入到矢量特征空間中,適用于分類(lèi)問(wèn)題。從實(shí)踐的角度來(lái)看,采用提出的方法的研究者只需要提供兩個(gè)成分:這些對(duì)象的高效壓縮器,以及將兩個(gè)對(duì)象組合成新對(duì)象的方式。所提出的方法基于兩個(gè)主要元素:不相似性表示和歸一化壓縮距離(NCD)。不相似性表示是歐幾里德嵌入算法,即將通用對(duì)象映射到向量空間中的過(guò)程,其需要在對(duì)象之間定義距離函數(shù)。所產(chǎn)生的嵌入的質(zhì)量嚴(yán)格依賴于該距離的選擇。 NCD是基于Kolmogorov復(fù)雜性概念的對(duì)象之間的距離。在實(shí)踐中,NCD基于兩個(gè)構(gòu)建塊:壓縮函數(shù)和將兩個(gè)對(duì)象組合成新對(duì)象的方法。我們聲稱(chēng),一旦良好的壓縮機(jī)和有意義的組合兩個(gè)對(duì)象的方法可用,則可以構(gòu)建分類(lèi)算法可以準(zhǔn)確的有效特征空間。作為我們向IEEE AASP挑戰(zhàn)提交的文件,我們?cè)诼晥?chǎng)分類(lèi)的上下文中展示了所提出的方法的實(shí)際應(yīng)用,其中壓縮器是自由和開(kāi)源的Vorbis有損音頻壓縮器,并且兩個(gè)音頻樣本的組合是它們的簡(jiǎn)單連接。
code:OE
方法:歸一化壓縮距離(vorbis),歐幾里德嵌入,由隨機(jī)森林分類(lèi)
開(kāi)發(fā)語(yǔ)言:Phyon
相關(guān)文章:
- E. Olivetti, “The wonders of the normalized compression dissimilarity representation,” 2013.
成員:
- Dan Stowell (dan.stowell@eecs.qmul.ac.uk),Manager
- Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
- Mark Plumbley (m.plumbley@surrey.ac.uk),Manager
Roma et al[11]
簡(jiǎn)介:該代碼使用重復(fù)量化分析(RQA)功能進(jìn)行場(chǎng)景分類(lèi)任務(wù)。 這些特征是通過(guò)從MFCC特征的窗口計(jì)算出的閾值相似度矩陣來(lái)計(jì)算的。 增加了傳統(tǒng)的MFCC統(tǒng)計(jì),它們?cè)谑褂脴?biāo)準(zhǔn)SVM分類(lèi)器時(shí)提高了準(zhǔn)確性。
code:RNH
方法:復(fù)發(fā)定量分析應(yīng)用于MFCC時(shí)間序列,由SVM分類(lèi)
開(kāi)發(fā)語(yǔ)言:matlab
相關(guān)文章:
- (1)G. Roma, W. Nogueira, and P. Herrera, “Recurrence Quantification Analysis for auditory scene classification,” 2013.
成員:
- Dan Stowell (dan.stowell@eecs.qmul.ac.uk),Manager
- Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
- Mark Plumbley (m.plumbley@surrey.ac.uk),Manager
總結(jié)
以上是生活随笔為你收集整理的DCASE 2013任务1(声学场景分类)参赛作品相关信息的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 科技公司掀起裁员潮,Spotify 宣布
- 下一篇: 空间谱专题06:宽带信号处理思路