基于快速傅里叶变换实现的狗声识别器(人工智能)
開發背景
市場上很多寵物狗狗翻譯器,貓語翻譯器,動物交流器,它們沒有采用正確的技術去實現,從而讓動物聲音翻譯器變成人們笑料的工具。本人為了改變現狀,剛好被裁員在家里休息,所以努力開發一款真正意義上能識別出動物聲音的翻譯器。總計耗時1個月(算法折騰半個月,js折騰半個月),躺了幾次中醫推拿才初步開發完成。整體只完成夢想的一小步,后續只能交給追夢者繼續完善。
項目地址:https://github.com/windawake/dogsound
功能介紹
可以識別出包括狗狗在內的所有動物發出的聲音,前提是先錄音存到聲音檔案里面。
預覽網址
使用手機火狐瀏覽器訪問 https://app.jiajuren.net/ 同意開啟錄音和麥克風權限。
運行項目
運行環境:nginx+ssl+php+mysql
創建bowwow數據庫 CREATE DATABASE bowwow; 然后執行根目錄bowwow.sql文件,接著把app copy.json修改為app.json并且配置mysql連接參數
在根目錄運行 php -S 0.0.0.0:13000 -t .
nginx反向代理到13000端口
參考配置
最后訪問https://127.0.0.1:3000 即可看到本地效果
實現原理
運用了移位運算,門閥檢測聲音,短時能量,短時過零率,短時快速傅里葉變換等技術,請參考這本書《語音信號處理實用教程》
注意事項
必須要https才能開啟錄音和麥克風權限
需要安靜室內環境,錄音要自然,識別時的發音要跟錄音時的節奏一致。這樣子才能達到80%識別率。室外在噪音干擾下,識別率幾乎為0。
原文出處
https://learnku.com/articles/71608
總結
以上是生活随笔為你收集整理的基于快速傅里叶变换实现的狗声识别器(人工智能)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【uni-app】App实现二维码分享图
- 下一篇: JL杰理蓝牙发射方案开发