當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

第四届AutoDL挑战赛——AutoSpeech2019正式开赛

發(fā)布時(shí)間：2024/10/8 编程问答 36 豆豆

生活随笔收集整理的這篇文章主要介紹了第四届AutoDL挑战赛——AutoSpeech2019正式开赛小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

AutoSpeech

2019

AutoSpeech挑戰(zhàn)賽已于近日正式開始，本次挑戰(zhàn)賽是2019年亞洲機(jī)器學(xué)習(xí)大會（ACML）主會議競賽環(huán)節(jié)，由第四范式和ChaLearn聯(lián)合承辦，谷歌贊助支持。AutoSpeech是繼AutoCV、AutoCV2、AutoNLP后的第四屆AutoDL挑戰(zhàn)賽，聚焦自動(dòng)語音分類（AutoSpeech）挑戰(zhàn)任務(wù)，旨在讓參賽選手設(shè)計(jì)開發(fā)全自動(dòng)的語音多分類系統(tǒng)，通過原始語音數(shù)據(jù)和必要的數(shù)據(jù)信息，自動(dòng)挖掘語音中的各種信息，包括聲紋、語種、情感等。

近年來，深度學(xué)習(xí)（DL）在說話人識別、語種識別、情感識別等各種語音相關(guān)的任務(wù)中取得了顯著成功。然而對于每一個(gè)語音任務(wù)，仍然需要大量的專家知識和人工成本。而自動(dòng)深度學(xué)習(xí)（AutoDL）的提出可以幫助解決這個(gè)問題。其可以對于特定的任務(wù)，探索出一套自動(dòng)訓(xùn)練模型的流程，高效合理的解決這個(gè)任務(wù)。

本次賽事主要負(fù)責(zé)人、第四范式主任算法科學(xué)家涂威威表示：過去兩年時(shí)間，AutoML比賽已經(jīng)成功舉辦8屆。無論是自動(dòng)機(jī)器學(xué)習(xí)還是自動(dòng)深度學(xué)習(xí)，都引起了學(xué)術(shù)研究者和行業(yè)從業(yè)者的關(guān)注。深度學(xué)習(xí)在圖像、語音等方面的明顯優(yōu)勢讓AutoDL成為目前炙手可熱的重要研究方向。本次AutoSpeech挑戰(zhàn)賽，希望有更多自動(dòng)機(jī)器學(xué)習(xí)和智能語音的研究者和從業(yè)者參與，探索在語音相關(guān)的任務(wù)中更好的自動(dòng)化解決方案，共同推動(dòng)AutoML在語音領(lǐng)域的發(fā)展。

關(guān)于比賽

挑戰(zhàn)賽主辦方為本次AutoSpeech挑戰(zhàn)賽準(zhǔn)備了15個(gè)語音分類數(shù)據(jù)集，其中包括 5個(gè)離線公共數(shù)據(jù)集（用于選手開發(fā)和訓(xùn)練自己的AutoSpeech程序）、5個(gè)線上公共數(shù)據(jù)集（用于盲測，選手無法獲得數(shù)據(jù)集任何信息）、5個(gè)私有數(shù)據(jù)集（用于盲測，選手無法獲得數(shù)據(jù)集任何信息）。比賽平臺將提供統(tǒng)一配置的GPU服務(wù)器進(jìn)行相同環(huán)境相同計(jì)算資源的測試，并設(shè)定每個(gè)評測數(shù)據(jù)集的運(yùn)行時(shí)長。選手也可使用自行訓(xùn)練的預(yù)訓(xùn)練模型。

每個(gè)數(shù)據(jù)集來自五個(gè)不同的語音分類領(lǐng)域之一，包括：說話人識別，情感識別，口音識別，語種識別和音樂流派分類。每個(gè)數(shù)據(jù)集大約包含幾百到幾千條語音的訓(xùn)練數(shù)據(jù)，且都是多分類任務(wù)（最多100分類）。所有音頻數(shù)據(jù)都以16kHz的采樣速率轉(zhuǎn)換為單通道16位流，并用python的librosa讀入后轉(zhuǎn)儲為pickle格式（向量列表包含一個(gè)數(shù)據(jù)集中的所有訓(xùn)練或測試音頻）。注意，數(shù)據(jù)集的每條樣本長度可能不同。

數(shù)據(jù)集由內(nèi)容文件、標(biāo)簽文件和元信息文件組成，其中內(nèi)容文件和標(biāo)簽文件分為訓(xùn)練部分和測試部分：內(nèi)容文件（{train，test}.pkl）包含音頻的樣本，其格式為向量列表。

賽事挑戰(zhàn)

本次全球首次自動(dòng)語音競賽，重點(diǎn)針對語音分類任務(wù)，參賽選手將面臨如下挑戰(zhàn):?-如何在語音數(shù)據(jù)中自動(dòng)發(fā)現(xiàn)各種語義或非語義信息？-如何為不同的語音任務(wù)自動(dòng)提取有用特征？-如何自動(dòng)處理不同長度的語音數(shù)據(jù)？?-如何自動(dòng)設(shè)計(jì)有效的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)？-如何構(gòu)建和自動(dòng)調(diào)整預(yù)先訓(xùn)練的模型？同時(shí)，參賽選手需考慮：-如何自動(dòng)高效地選擇恰當(dāng)?shù)臋C(jī)器學(xué)習(xí)模型與超參數(shù)？?-如何提高解決方案的通用性？即如何保證解決方案在未知任務(wù)中的適用性？-如何控制計(jì)算和內(nèi)存成本？

賽程時(shí)間

北京時(shí)間（UTC+8）2019年9月16日16:59：反饋階段的開始，練習(xí)數(shù)據(jù)集的發(fā)布。參賽選手可以開始提交代碼并在排行榜中獲得即時(shí)反饋。2019年10月07日23:59：參賽選手真實(shí)身份驗(yàn)證2019年10月14日23:59：反饋階段結(jié)束。2019年10月15日00:00：檢查階段開始。2019年10月18日19:59：檢查階段結(jié)束。2019年10月18日20:00：最終階段開始。2019年10月20日20:00：重新提交截止日期。2019年10月22日20:00：最終階段結(jié)束。請注意CODALAB平臺使用UTC時(shí)間格式，以免錯(cuò)過比賽每個(gè)階段的時(shí)間點(diǎn)。

賽事規(guī)則

本次挑戰(zhàn)賽分為三個(gè)階段（反饋階段、檢查階段和最終階段），首先參賽選手通過下載五個(gè)練習(xí)數(shù)據(jù)集，離線開發(fā)自己的AutoSpeech程序。然后進(jìn)入反饋階段，參賽者將自己的AutoSpeech程序代碼上傳到平臺上，并通過在另外五個(gè)驗(yàn)證數(shù)據(jù)集測試，得到其性能的即時(shí)反饋。反饋階段結(jié)束后，將進(jìn)入檢查階段，參賽選手只允許在私有數(shù)據(jù)集上提交一次代碼，以便進(jìn)行調(diào)試。此時(shí)，參賽選手將無法閱讀詳細(xì)的日志，但是他們能夠看到他們的代碼是否報(bào)告錯(cuò)誤。最終階段，參賽選手的AutoSpeech程序在五個(gè)測試數(shù)據(jù)集上進(jìn)行評估。最終階段的排名將決定獲勝者。

賽事獎(jiǎng)勵(lì)

第一名: $2000第二名: $1500第三名: $500

AutoML歷屆賽事

-?First AutoML Challenge-?AutoML@PAKDD2018-?AutoML@NeurIPS2018-?AutoML@PAKDD2019-?AutoML@KDDCUP2019-?AutoCV@IJCNN2019-?AutoCV2@ECML PKDD2019-?AutoNLP@WAIC2019

對AutoSpeech2019挑戰(zhàn)賽感興趣的朋友，可以點(diǎn)擊"閱讀原文"查看官網(wǎng)詳細(xì)信息，參與挑戰(zhàn)賽。

總結(jié)

以上是生活随笔為你收集整理的第四届AutoDL挑战赛——AutoSpeech2019正式开赛的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：小马智行Pony.ai 2020校招宣讲
下一篇：智源-知乎联合发布大规模用户关系数据集，

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

第四届AutoDL挑战赛——AutoSpeech2019正式开赛

總結(jié)