Acoustics | 声音时间检测:日常声音理解
前言
本文根據(jù)書籍:
Computational Analysis of Sound Scenes and Events
翻譯完成,推薦大家去讀原著!
開始
日常生活很少有寧靜的時候,大多數(shù)情況下,都會有產(chǎn)生不同聲音的事件不斷出現(xiàn),在時頻域上重疊后通過傳入麥克風或我們的耳朵,它們可能是從遠處傳來的,或被反射的,或被障礙物衍射后的聲音信號。這種復雜的聲學陣列(acoustic array)即構(gòu)成了聲音場景(auditory scene)。
比如,幻想你在家里和朋友孩子享受假期。這時的聲音場景是非常集中和嘈雜的,它可能由不同的對話和噪聲組成。然而,作為傾聽者的你卻有能力解析這個特定的場景:你可以從嘈雜的背景中輕易區(qū)分并識別出不同的聲音事件(sound events),它們可能是不同的對話、背景音樂、碰杯聲,甚至是孩子玩鬧是弄出的古怪爆破聲。聽你一邊朋友的對話,或者在聽聽另一邊朋友又聊了什么,你甚至能同時聽著你孩子鬧出的動靜,別讓他們捅了簍子。這是典型雞尾酒吧效應(cocktail party effect)。
本節(jié)的主要目的在于描述這些不同時間的潛在物理屬性,并對一些基本的心理聲學概念做出總結(jié),同時我們也會概述一些聲學認知模型,闡述他們具有哪些處理、解析和從聲音場景中,感知聲音時間的能力。
雖然人對語音和音樂的感知已經(jīng)在很長的一段時間內(nèi),被當作正式的研究目標,但日常場景和事件的感知的研究才剛剛起步 (Everyday listening)。這里,日常信號指的是非音樂,非語音的,發(fā)生在日常環(huán)境中的聲音信號。日常聽覺最主要的特征就是其以認知為目標—即其研究的主要目標是感受聽眾身邊的環(huán)境,和發(fā)生的事情。它通過區(qū)分和識別不同的聲音時間,來對不同的聲音環(huán)境(場景)進行劃分。相較而言,音樂感知更注重音樂信號的聲音質(zhì)量(或音色),而不對聲源做精確識別;語音聽覺主要著手于解碼語音中暗含的語言信息,和對說話人進行識別,包括說話人的身份、性別、情緒等。
總結(jié)
以上是生活随笔為你收集整理的Acoustics | 声音时间检测:日常声音理解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为什么你的大数据项目会失败?
- 下一篇: 光伏产业红与黑 需求寒冬背后暗藏分布式春