第四届AutoDL挑战赛——AutoSpeech2019正式开赛
生活随笔
收集整理的這篇文章主要介紹了
第四届AutoDL挑战赛——AutoSpeech2019正式开赛
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
AutoSpeech
2019
AutoSpeech挑戰(zhàn)賽已于近日正式開始,本次挑戰(zhàn)賽是2019年亞洲機(jī)器學(xué)習(xí)大會(ACML)主會議競賽環(huán)節(jié),由第四范式和ChaLearn聯(lián)合承辦,谷歌贊助支持。AutoSpeech是繼AutoCV、AutoCV2、AutoNLP后的第四屆AutoDL挑戰(zhàn)賽,聚焦自動(dòng)語音分類(AutoSpeech)挑戰(zhàn)任務(wù),旨在讓參賽選手設(shè)計(jì)開發(fā)全自動(dòng)的語音多分類系統(tǒng),通過原始語音數(shù)據(jù)和必要的數(shù)據(jù)信息,自動(dòng)挖掘語音中的各種信息,包括聲紋、語種、情感等。近年來,深度學(xué)習(xí)(DL)在說話人識別、語種識別、情感識別等各種語音相關(guān)的任務(wù)中取得了顯著成功。然而對于每一個(gè)語音任務(wù),仍然需要大量的專家知識和人工成本。而自動(dòng)深度學(xué)習(xí)(AutoDL)的提出可以幫助解決這個(gè)問題。其可以對于特定的任務(wù),探索出一套自動(dòng)訓(xùn)練模型的流程,高效合理的解決這個(gè)任務(wù)。本次賽事主要負(fù)責(zé)人、第四范式主任算法科學(xué)家涂威威表示:過去兩年時(shí)間,AutoML比賽已經(jīng)成功舉辦8屆。無論是自動(dòng)機(jī)器學(xué)習(xí)還是自動(dòng)深度學(xué)習(xí),都引起了學(xué)術(shù)研究者和行業(yè)從業(yè)者的關(guān)注。深度學(xué)習(xí)在圖像、語音等方面的明顯優(yōu)勢讓AutoDL成為目前炙手可熱的重要研究方向。本次AutoSpeech挑戰(zhàn)賽,希望有更多自動(dòng)機(jī)器學(xué)習(xí)和智能語音的研究者和從業(yè)者參與,探索在語音相關(guān)的任務(wù)中更好的自動(dòng)化解決方案,共同推動(dòng)AutoML在語音領(lǐng)域的發(fā)展。
關(guān)于比賽
挑戰(zhàn)賽主辦方為本次AutoSpeech挑戰(zhàn)賽準(zhǔn)備了15個(gè)語音分類數(shù)據(jù)集,其中包括 5個(gè)離線公共數(shù)據(jù)集(用于選手開發(fā)和訓(xùn)練自己的AutoSpeech程序)、5個(gè)線上公共數(shù)據(jù)集(用于盲測,選手無法獲得數(shù)據(jù)集任何信息)、5個(gè)私有數(shù)據(jù)集(用于盲測,選手無法獲得數(shù)據(jù)集任何信息)。比賽平臺將提供統(tǒng)一配置的GPU服務(wù)器進(jìn)行相同環(huán)境相同計(jì)算資源的測試,并設(shè)定每個(gè)評測數(shù)據(jù)集的運(yùn)行時(shí)長。選手也可使用自行訓(xùn)練的預(yù)訓(xùn)練模型。每個(gè)數(shù)據(jù)集來自五個(gè)不同的語音分類領(lǐng)域之一,包括:說話人識別,情感識別,口音識別,語種識別和音樂流派分類。每個(gè)數(shù)據(jù)集大約包含幾百到幾千條語音的訓(xùn)練數(shù)據(jù),且都是多分類任務(wù)(最多100分類)。所有音頻數(shù)據(jù)都以16kHz的采樣速率轉(zhuǎn)換為單通道16位流,并用python的librosa讀入后轉(zhuǎn)儲為pickle格式(向量列表包含一個(gè)數(shù)據(jù)集中的所有訓(xùn)練或測試音頻)。注意,數(shù)據(jù)集的每條樣本長度可能不同。數(shù)據(jù)集由內(nèi)容文件、標(biāo)簽文件和元信息文件組成,其中內(nèi)容文件和標(biāo)簽文件分為訓(xùn)練部分和測試部分:內(nèi)容文件({train,test}.pkl)包含音頻的樣本,其格式為向量列表。賽事挑戰(zhàn)
本次全球首次自動(dòng)語音競賽,重點(diǎn)針對語音分類任務(wù),參賽選手將面臨如下挑戰(zhàn):?-如何在語音數(shù)據(jù)中自動(dòng)發(fā)現(xiàn)各種語義或非語義信息?-如何為不同的語音任務(wù)自動(dòng)提取有用特征?-如何自動(dòng)處理不同長度的語音數(shù)據(jù)??-如何自動(dòng)設(shè)計(jì)有效的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)?-如何構(gòu)建和自動(dòng)調(diào)整預(yù)先訓(xùn)練的模型?同時(shí),參賽選手需考慮:-如何自動(dòng)高效地選擇恰當(dāng)?shù)臋C(jī)器學(xué)習(xí)模型與超參數(shù)??-如何提高解決方案的通用性?即如何保證解決方案在未知任務(wù)中的適用性?-如何控制計(jì)算和內(nèi)存成本?賽程時(shí)間
北京時(shí)間(UTC+8)2019年9月16日16:59:反饋階段的開始,練習(xí)數(shù)據(jù)集的發(fā)布。參賽選手可以開始提交代碼并在排行榜中獲得即時(shí)反饋。2019年10月07日23:59:參賽選手真實(shí)身份驗(yàn)證2019年10月14日23:59:反饋階段結(jié)束。2019年10月15日00:00:檢查階段開始。2019年10月18日19:59:檢查階段結(jié)束。2019年10月18日20:00:最終階段開始。2019年10月20日20:00:重新提交截止日期。2019年10月22日20:00:最終階段結(jié)束。請注意CODALAB平臺使用UTC時(shí)間格式,以免錯(cuò)過比賽每個(gè)階段的時(shí)間點(diǎn)。賽事規(guī)則
本次挑戰(zhàn)賽分為三個(gè)階段(反饋階段、檢查階段和最終階段),首先參賽選手通過下載五個(gè)練習(xí)數(shù)據(jù)集,離線開發(fā)自己的AutoSpeech程序。然后進(jìn)入反饋階段,參賽者將自己的AutoSpeech程序代碼上傳到平臺上,并通過在另外五個(gè)驗(yàn)證數(shù)據(jù)集測試,得到其性能的即時(shí)反饋。反饋階段結(jié)束后,將進(jìn)入檢查階段,參賽選手只允許在私有數(shù)據(jù)集上提交一次代碼,以便進(jìn)行調(diào)試。此時(shí),參賽選手將無法閱讀詳細(xì)的日志,但是他們能夠看到他們的代碼是否報(bào)告錯(cuò)誤。最終階段,參賽選手的AutoSpeech程序在五個(gè)測試數(shù)據(jù)集上進(jìn)行評估。最終階段的排名將決定獲勝者。賽事獎(jiǎng)勵(lì)
第一名: $2000第二名: $1500第三名: $500AutoML歷屆賽事
-?First AutoML Challenge-?AutoML@PAKDD2018-?AutoML@NeurIPS2018-?AutoML@PAKDD2019-?AutoML@KDDCUP2019-?AutoCV@IJCNN2019-?AutoCV2@ECML PKDD2019-?AutoNLP@WAIC2019對AutoSpeech2019挑戰(zhàn)賽感興趣的朋友,可以點(diǎn)擊"閱讀原文"查看官網(wǎng)詳細(xì)信息,參與挑戰(zhàn)賽。總結(jié)
以上是生活随笔為你收集整理的第四届AutoDL挑战赛——AutoSpeech2019正式开赛的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 小马智行Pony.ai 2020校招宣讲
- 下一篇: 智源-知乎联合发布大规模用户关系数据集,