當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

基于快速傅里叶变换实现的狗声识别器（人工智能）

發布時間：2023/12/8 编程问答 40 豆豆

生活随笔收集整理的這篇文章主要介紹了基于快速傅里叶变换实现的狗声识别器（人工智能）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

開發背景

市場上很多寵物狗狗翻譯器，貓語翻譯器，動物交流器，它們沒有采用正確的技術去實現，從而讓動物聲音翻譯器變成人們笑料的工具。本人為了改變現狀，剛好被裁員在家里休息，所以努力開發一款真正意義上能識別出動物聲音的翻譯器。總計耗時1個月（算法折騰半個月，js折騰半個月），躺了幾次中醫推拿才初步開發完成。整體只完成夢想的一小步，后續只能交給追夢者繼續完善。
項目地址：https://github.com/windawake/dogsound

功能介紹

可以識別出包括狗狗在內的所有動物發出的聲音，前提是先錄音存到聲音檔案里面。

預覽網址

使用手機火狐瀏覽器訪問 https://app.jiajuren.net/ 同意開啟錄音和麥克風權限。

運行項目

運行環境：nginx+ssl+php+mysql

創建bowwow數據庫 CREATE DATABASE bowwow; 然后執行根目錄bowwow.sql文件，接著把app copy.json修改為app.json并且配置mysql連接參數

在根目錄運行 php -S 0.0.0.0:13000 -t .
nginx反向代理到13000端口
參考配置

server {listen 3000 ssl http2;ssl_certificate /web/linux/vscode/ssl/server.crt;ssl_certificate_key /web/linux/vscode/ssl/server.key;add_header Access-Control-Allow-Origin *;server_name 0.0.0.0;index index.php index.html index.htm index.nginx-debian.html;location / {proxy_pass http://127.0.0.1:13000;} }

最后訪問https://127.0.0.1:3000 即可看到本地效果

實現原理

運用了移位運算，門閥檢測聲音，短時能量，短時過零率，短時快速傅里葉變換等技術，請參考這本書《語音信號處理實用教程》

注意事項

必須要https才能開啟錄音和麥克風權限

需要安靜室內環境，錄音要自然，識別時的發音要跟錄音時的節奏一致。這樣子才能達到80%識別率。室外在噪音干擾下，識別率幾乎為0。

原文出處

https://learnku.com/articles/71608

總結

以上是生活随笔為你收集整理的基于快速傅里叶变换实现的狗声识别器（人工智能）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【uni-app】App实现二维码分享图
下一篇： JL杰理蓝牙发射方案开发