python腾讯语音合成
一、騰訊語(yǔ)音合成介紹
騰訊云語(yǔ)音合成技術(shù)(TTS)可以將任意文本轉(zhuǎn)化為語(yǔ)音,實(shí)現(xiàn)讓機(jī)器和應(yīng)用張口說(shuō)話。 騰訊TTS技術(shù)可以應(yīng)用到很多場(chǎng)景,比如,移動(dòng)APP語(yǔ)音播報(bào)新聞;智能設(shè)備語(yǔ)音提醒;依靠網(wǎng)上現(xiàn)有節(jié)目或少量錄音,快速合成明星語(yǔ)音,降低邀約成本;支持車載導(dǎo)航語(yǔ)音合成的個(gè)性化語(yǔ)音播報(bào)。(廢話一大堆)。。。
二、騰訊語(yǔ)音合成python SDK文檔
安裝 Python SDK 前,先獲取安全憑證。在第一次使用云 API 之前,用戶首先需要在騰訊云控制臺(tái)上申請(qǐng)安全憑證,安全憑證包括 SecretID 和 SecretKey, SecretID 是用于標(biāo)識(shí) API 調(diào)用者的身份,SecretKey 是用于加密簽名字符串和服務(wù)器端驗(yàn)證簽名字符串的密鑰。SecretKey 必須嚴(yán)格保管,避免泄露。
通過(guò) pip 安裝(推薦)
您可以通過(guò) pip 安裝方式將騰訊云 API Python SDK 安裝到您的項(xiàng)目中,如果您的項(xiàng)目環(huán)境尚未安裝 pip,請(qǐng)?jiān)敿?xì)參見(jiàn)?pip官網(wǎng) 安裝。
通過(guò)pip方式安裝請(qǐng)?jiān)诿钚兄袌?zhí)行以下命令:
pip install tencentcloud-sdk-python? ?請(qǐng)注意,如果同時(shí)有 python2 和 python3 環(huán)境, python3 環(huán)境需要使用 pip3 命令安裝。
三、騰訊語(yǔ)音合成
1 # !/usr/bin/env python2 # -*- coding: utf-8 -*- 3 from base64 import b64decode 4 from uuid import uuid4 5 from tencentcloud.common import credential 6 from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException 7 from tencentcloud.aai.v20180522.models import TextToVoiceRequest 8 from tencentcloud.aai.v20180522.aai_client import AaiClient 9 try: 10 # 實(shí)例化一個(gè)認(rèn)證對(duì)象,入?yún)⑿枰獋魅腧v訊云賬戶secretId,secretKey 11 cred = credential.Credential("你的secretID", "你的secretKey") 12 # 實(shí)例化要進(jìn)行語(yǔ)音合成請(qǐng)求的client對(duì)象 13 client = AaiClient(cred, 'ap-shanghai') 14 # 實(shí)例化一個(gè)請(qǐng)求對(duì)象 15 req = TextToVoiceRequest() 16 # 請(qǐng)求對(duì)象屬性封裝 17 req.Text = '先帝創(chuàng)業(yè)未半而中道崩殂' # type: str # 要合成語(yǔ)音的文本 18 req.SessionId = uuid4() # type: int # 一次請(qǐng)求對(duì)應(yīng)一個(gè)SessionId,會(huì)原樣返回,建議傳入類似于uuid的字符串防止重復(fù) 19 req.ModelType = 1 # type: int # 模型類型,默認(rèn)值為1 20 req.Volume = 5.0 # type: float # 音量大小,范圍:[0,10],分別對(duì)應(yīng)10個(gè)等級(jí)的音量,默認(rèn)為0 21 req.Speed = 0.6 # type: float # 語(yǔ)速,范圍:[-2,2],分別對(duì)應(yīng)不同語(yǔ)速:0.6倍,0.8倍,1.0倍,1.2倍,1.5倍,默認(rèn)為0 22 req.ProjectId = 10086 # type: int # 項(xiàng)目id,用戶自定義,默認(rèn)為0 23 req.VoiceType = 0 # type: int # 音色0:女聲1,親和風(fēng)格(默認(rèn)) 音色1:男聲1,成熟風(fēng)格 音色2:男聲2,成熟風(fēng)格 24 req.PrimaryLanguage = 1 # type: int # 主語(yǔ)言類型1:中文,最大100個(gè)漢字(標(biāo)點(diǎn)符號(hào)算一個(gè)漢字)語(yǔ)言類型2:英文,最大支持400個(gè)字母(標(biāo)點(diǎn)符號(hào)算一個(gè)字母) 25 req.SampleRate = 16000 # type: int # 音頻采樣率,16000:16k,8000:8k,默認(rèn)16k 26 # 通過(guò)client對(duì)象調(diào)用想要訪問(wèn)的接口,需要傳入請(qǐng)求對(duì)象 27 rep = client.TextToVoice(req) 28 # rep為響應(yīng)對(duì)象 29 print(rep) 30 """ 31 { 32 "Audio": "UklGRlR/AABXQVZFZm10IBAAAAABAAEAgD4AAAB9AAACABAAZGF0YSx9AAD+AQD//wAAAAAAAAIAAQADAAMABgAEAAYABQAGAAUABwAIAAgACQAAE......AAgACAAEAAgADAAIAAwACAAQAAwACAAIAAgADAAMAAgACAAIAAwABAAAAAAAAAAAAAAD/AAAAAAAA//8AAP///v/9//7//v///v8AAP///wAA/wAA/wAAAAAAAAAAAAAAAAAAAAAAAAAA", 33 "RequestId": "9a7a1615-3e09-4db2-8032-5c6f497f7e6a", 34 "SessionId": "session-1234" 35 } 36 Audio對(duì)應(yīng)的值為經(jīng)過(guò)base64編碼, 37 RequestId為返回的唯一請(qǐng)求id, 38 SessionId為發(fā)送請(qǐng)求時(shí)傳入的id即uuid4() 39 """ 40 # content為base64解碼后的二進(jìn)制流 41 content = b64decode(rep.Audio) 42 # I/O操作 43 with open('voice.wav', 'wb') as f: 44 f.write(content) 45 except TencentCloudSDKException as e: 46 print(e)
四、騰訊語(yǔ)音合成使用后感受
首先,在代碼層次上講,官方壓根沒(méi)有合成示例文檔啊(咆哮ing),全自己摸索的啊(咆哮ing),SDK都開發(fā)出來(lái)了,示例代碼給一下能死啊(咆哮ing),怪不得沒(méi)人用啊(咆哮ing)!
第二,還是在代碼層次上講,源碼中TextToVoiceRequest()類,在__init__()方法中就不能直接封裝屬性啊(咆哮ing),有些沒(méi)有自定制但都是默認(rèn)的直接填上不就行了啊(咆哮ing),懶死你啊,非得一行一行自己加屬性啊(咆哮ing),看到的同學(xué)務(wù)必要修改這個(gè)類的__init__()方法,要不然就像示例代碼中那樣麻煩。
第三,在合成效果上講,聲音難聽爆了有木有,語(yǔ)音文件還得解碼再I/O,吃飽了撐的了啊,還是那句話:怪不得沒(méi)人用,百度語(yǔ)音合成效果比你強(qiáng)多了。
總之,就這樣吧,不吐槽你了,真是費(fèi)勁。。。
轉(zhuǎn)載于:https://www.cnblogs.com/zepc007/p/10360557.html
總結(jié)
以上是生活随笔為你收集整理的python腾讯语音合成的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 快速原型设计软件Axure RP Pro
- 下一篇: Python读取Json字典写入Exce