日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

DCASE2013挑战赛介绍

發布時間:2023/12/15 编程问答 69 豆豆
生活随笔 收集整理的這篇文章主要介紹了 DCASE2013挑战赛介绍 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

簡介

  • 2013 年起,為了評測現有的環境聲音檢測方法,電子與電氣工程師學會音頻和聲學信號處理協會(Institute of Electrical and Electronics Engineers Audio and Acoustic Signal Process, IEEE AASP )開始舉辦聲學場景和事件的檢測與分類挑戰賽(Detection and Classification of Acoustic Scenes and Events, DCASE)

  • 關于挑戰賽信息的介紹

挑戰賽結果

  • DCASE 2013挑戰賽的結果在下面的期刊文章中得到了詳細的描述:

    D. Stowell, D. Giannoulis, E. Benetos, M. Lagrange and M. D. Plumbley, Detection and Classification of Audio Scenes and Events. IEEE Transactions on Multimedia 17(10), 1733-1746, 2015.

  • 比賽的總體結果

    • 場景識別結果

    • 事件檢測 - 辦公室現場結果

    • 事件檢測 - 辦公室綜合結果

數據庫及相關代碼

公共可用的數據

  • 下面是挑戰賽的所有任務的簡單描述,以及數據的規格和一些樣本文件。請記住,由于任務目前正在開發中,示例只提供了任務如何聽起來的第一印象,它們可能不一定與最后的任務類似。

  • 公開可用的數據集,其中包括場景識別、事件檢測任務1和任務2的相關數據。

    • 場景分類(SC)挑戰將解決識別和分類聲場和聲景的問題。

      • 場景分類任務的數據集中,每種聲場由30秒錄音組成。數據集將由2個部分組成,每個部分由每個場景(類)的6個音頻記錄組成。將作為開發組發送給參與者,第二個將被保密,用于火車/測試場景分類任務。場景列表是:繁忙的街道,安靜的街道,公園,露天市場,公共汽車,地鐵列車,餐廳,商店/超市,辦公室,地鐵站10個類別。

      • 用于該任務的記錄裝置是一組專門制作的Soundman雙耳麥克風,以便它們模仿用戶可佩戴的一對入耳式耳機。錄制的建議規范是:PCM,44100 Hz,16位(CD質量)。

    • 事件檢測

      • 事件探測挑戰將解決識別聲音場景中突出的單個聲音事件的問題。兩個不同的實驗將采取,一個簡單的聲學場景沒有重疊的聲音,另一個使用復雜的場景在一個復調場景。該任務將使用三個數據集。

      但是,現在這些數據下載不了

相關源代碼

  • 一些已經提交的系統的源代碼

    • 1)Event Detection: Gemmeke et al

      • 簡介:用于音頻事件檢測的基于示例的NMF方法。

      • 出版的文章:J. F. Gemmeke, L. Vuegen, B. Vanrumste, and H. V. Hamme, “An exemplar-based NMF approach for audio event detection,” 2013.

      • Manager: Dan Stowell, Emmanouil Benetos, Jort Gemmeke, Mark Plumbley

    • 2)Event Detection: Vuegen et al

      • 簡介:該提案探討了用于聲學事件檢測和分類的從Mel頻率倒譜系數(MFCC)估計的高斯混合模型(GMM)。 為了限制靜音的影響,使用了共享的背景模型。

      • 出版的文章:L. Vuegen, B. V. D. Broeck, P. Karsmakers, J. F. Gemmeke, B. Vanrumste, and H. V. Hamme, “An MFCC-GMM approach for event detection and classification,” 2013.

      • Manager: Dan Stowell, Emmanouil Benetos, Mark Plumbley

    • 3)Scene Classification: Chum et al

      • 簡介:這里開發了兩種算法:第一種是基于隱馬爾可夫模型(HMM)和高斯混合模型(GMM)。 所使用的特征包括短時傅立葉變換,響度和光譜稀疏度。 第二種算法在基于幀的層面上應用支持向量機(SVM)。

      • 源代碼

      • 出版文章,M. Chum, A. Habshush, A. Rahman, and C. Sang, “IEEE AASP scene classification challenge using hidden Markov models and frame based classification,” 2013.

      • Manager: Dan Stowell, Emmanouil Benetos, Mark Plumbley

    • 4)Scene Classification: Geiger et al

      • 簡介:這是對聲學場景分類的IEEE AASP挑戰的貢獻。 從30秒長的高可變錄音中,提取頻譜,倒譜,能量和聲音相關的音頻特征。 使用滑動窗口方法來獲得短段上低級特征的統計學特征。 SVM用于對這些短段進行分類,并采用多數投票方案來獲得整個記錄的決策。 關于挑戰的官方發展,實現了73%的準確性。 使用t統計量的特征分析表明,主要的Mel譜是最相關的特征。

      • 無源代碼

      • 出版文章1,J. T. Geiger, B. Schuller, and G. Rigoll, “Recognising acoustic scenes with large-scale audio feature extraction and SVM,” 2013.

      • 出版文章2,J. T. Geiger, B. Schuller, and G. Rigoll, “Large-Scale Audio Feature Extraction and SVM for Acoustic Scene Classification,” in WASPAA, 2013, p. 4.

      • Manager: Dan Stowell, Emmanouil Benetos, Jürgen Geiger, Mark Plumbley

    • 5)Scene Classification: Olivetti

      • 簡介:我們提出一種將一般對象(如音頻樣本)有效地嵌入到矢量特征空間中的方法,適用于分類問題。從實踐的角度來看,采用提出的方法的研究者只需要提供兩個成分:這些對象的高效壓縮器,以及將兩個對象組合成新對象的方式。所提出的方法基于兩個主要元素:不相似性表示和歸一化壓縮距離(NCD)。不相似性表示是歐幾里德嵌入算法,即將通用對象映射到向量空間中的過程,其需要在對象之間定義距離函數。所產生的嵌入的質量嚴格依賴于該距離的選擇。 NCD是基于Kolmogorov復雜性概念的對象之間的距離。在實踐中,NCD基于兩個構建塊:壓縮函數和將兩個對象組合成新對象的方法。我們聲稱,一旦良好的壓縮機和有意義的組合兩個對象的方法可用,則可以構建分類算法可以準確的有效特征空間。作為我們向IEEE AASP挑戰提交的文件,我們在聲場分類的上下文中展示了所提出的方法的實際應用,其中壓縮器是自由和開源的Vorbis有損音頻壓縮器,并且兩個音頻樣本的組合是它們的簡單連接。

      • 無源代碼

      • 出版文章,E. Olivetti, “The wonders of the normalized compression dissimilarity representation,” 2013.

      • Manager: Dan Stowell, Emmanouil Benetos, Mark Plumbley

    • 6)Scene Classification: Roma et al

      • 簡介:該代碼使用重復量化分析(RQA)功能進行場景分類任務。 這些特征是通過從MFCC特征的窗口計算出的閾值相似度矩陣來計算的。 增加了傳統的MFCC統計,它們在使用標準SVM分類器時提高了準確性。

      • 源代碼

      • 出版文章,G. Roma, W. Nogueira, and P. Herrera, “Recurrence Quantification Analysis for auditory scene classification,” 2013.

      • Manager: Dan Stowell, Emmanouil Benetos, Mark Plumbley

  • 基線系統的源代碼:音頻場景識別、事件檢測

比賽相關介紹:

  • 介紹

    • 我們邀請信號處理,機器學習等領域的研究人員參與我們的挑戰,其中包括一系列關于聲場和聲學事件的自動檢測和分類的相關任務。

    • 任務落在計算聽覺場景分析(CASA)領域。人類能夠在復雜的音頻環境中輕松跟蹤特定的聲源,并且試圖模擬這種行為的系統的發展是一個開放的問題,特別是在重疊的聲音事件的情況下。

    • 確認參加挑戰的截止日期為2013年3月31日(請發送電子郵件至aasp-challenge-owner@eecs.qmul.ac.uk與參與者名稱/附屬機構)。提交代碼的截止日期是2013年4月14日。

    • 結果將在2013年WASPAA特別會議上提交;邀請與會者在特別會議上張貼海報。此外,鼓勵小說作家的作者在2013年WASPAA上作為常規論文提交作品。

  • 提交說明

    • 請務必閱讀技術報告,說明挑戰的動機、數據集和度量標準。

    • 請務必閱讀您將參與的任務的規范(以下鏈接)

      • 場景分類規范(PDF)

      • 事件檢測(辦公室現場)規范(PDF)

      • 事件檢測(辦公室綜合)規范(PDF)

    • 使用公開可用的挑戰數據集開發系統。您可以使用度量函數來測試系統的性能。

    • 寫一個擴展的摘要概述你的提交完成情況(下面的鏈接)

      • 擴展摘主要為其他人提供了對每個提交作品完成內容的一般理解。擴展的摘要不需要在出版材料之前是最新的。鼓勵參與者提交新的工作作為在waspaa 2013會議上的文章。
      • 在結果公布后,作者可以修改擴展摘要。我們將在挑戰網站上發布擴展摘要的最終版本。
      • 挑戰賽摘要要求:
        • 應該是2-3頁長
        • 必須遵循以下模板指南: LaTeX模板、word模板
        • 必須以PDF格式提交。
        • 可以包括對您工作的其他出版物的引用(如果存在)
    • 驗證您的代碼使用的AASP挑戰Linux系統的圖像(非matlab文件)

      這個鏈接目前是打不開的

    • 3月31日前通過電子郵件確認您參與挑戰賽。

    • 4月14日前使用電子郵件或通過下載鏈接提交您的代碼和擴展摘要。

    • 在waspaa 2013挑戰海報會議展示公告。

  • 組織者

    • 這個挑戰是由數字音樂中心和IRCAM組織的音聲信號處理的主持下(AASP)的IEEE信號處理學會技術委員會。點擊這里獲取原始的挑戰提案文件。

    • 組織者:

      • Dimitrios Giannoulis(QMUL)

      • Emmanouil Benetos(倫敦城市大學/ QMUL)

      • Dan Stowell(QMUL)

      • Mathias Rossignol(IRCAM)

      • Mathieu Lagrange(IRCAM)

      • Mark D. Plumbley(QMUL)(University of Surrey薩里大學?)

      在AASP挑戰

總結

以上是生活随笔為你收集整理的DCASE2013挑战赛介绍的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。