机器学习的音频提取
機器學習,學什么?比如運動檢測、視覺中的視頻、聽覺中的音頻及語言處理、嗅覺中的氣味(香煙白酒水及各種氣體)、觸覺、傳感器能感知到的環(huán)境參數(shù),如加速度、航向角、速度角度、溫濕度、大氣壓甚至事物輪廓、紅外數(shù)據(jù)等等。視頻、圖像、文字、語音、味道、質(zhì)感等信息都是一種學習內(nèi)容,學習并解析視頻、圖像、文字、語音、味道、質(zhì)感等。
比如車載攝像頭,可以聽懂語音,還能識別人的表情神態(tài)、動作,觀察是否存在疲勞駕駛、分心、打電話等狀況,并進行及時的語音提醒;醫(yī)療機器人可以像人類醫(yī)生一樣通過“望、聞、問、切”進行診斷,聽得懂聲音,還可根據(jù)肢體動作、微表情、語調(diào)等來綜合判斷精準反饋。
視頻提取一般想到的就是通過攝像頭,聲音的獲取一般通過PDM、PCM、Microphone等設備,而各種sensor更是感知到很多很多,包括人能感知或不能感知的,不得不說這是機器有些能做人做不了了的事情的原因。
本節(jié)重點介紹如何使用PDM進行音頻數(shù)據(jù)采集,首先就是要有一個帶有PDM器件的設備,作為采集的輸入接口,后臺程序作為數(shù)據(jù)處理接口。功能主要是采集16kHz的音頻7秒鐘,并且將音頻數(shù)據(jù)打印輸出到串口,代碼如下:
#include "cyhal.h" #include "cybsp.h" #include "cy_retarget_io.h" #include "cy8ckit_028_epd_pins.h" #include "mtb_e2271cs021.h" #include "GUI.h" #include "LCDConf.h"/*******************************************************************************總結(jié)
- 上一篇: 在Android初次的前期学习中的二个小
- 下一篇: html怎么转为rp,html rp标签