机器学习的音频提取
機器學習,學什么?比如運動檢測、視覺中的視頻、聽覺中的音頻及語言處理、嗅覺中的氣味(香煙白酒水及各種氣體)、觸覺、傳感器能感知到的環境參數,如加速度、航向角、速度角度、溫濕度、大氣壓甚至事物輪廓、紅外數據等等。視頻、圖像、文字、語音、味道、質感等信息都是一種學習內容,學習并解析視頻、圖像、文字、語音、味道、質感等。
比如車載攝像頭,可以聽懂語音,還能識別人的表情神態、動作,觀察是否存在疲勞駕駛、分心、打電話等狀況,并進行及時的語音提醒;醫療機器人可以像人類醫生一樣通過“望、聞、問、切”進行診斷,聽得懂聲音,還可根據肢體動作、微表情、語調等來綜合判斷精準反饋。
視頻提取一般想到的就是通過攝像頭,聲音的獲取一般通過PDM、PCM、Microphone等設備,而各種sensor更是感知到很多很多,包括人能感知或不能感知的,不得不說這是機器有些能做人做不了了的事情的原因。
本節重點介紹如何使用PDM進行音頻數據采集,首先就是要有一個帶有PDM器件的設備,作為采集的輸入接口,后臺程序作為數據處理接口。功能主要是采集16kHz的音頻7秒鐘,并且將音頻數據打印輸出到串口,代碼如下:
#include "cyhal.h" #include "cybsp.h" #include "cy_retarget_io.h" #include "cy8ckit_028_epd_pins.h" #include "mtb_e2271cs021.h" #include "GUI.h" #include "LCDConf.h"/*******************************************************************************總結
- 上一篇: 在Android初次的前期学习中的二个小
- 下一篇: html怎么转为rp,html rp标签