python训练聊天机器人_一个可以进行训练的聊天机器人,一次chat的源码
chatbot
一個可以使用自己語料進行訓練的中文聊天機器人,目前包含seq2seq tf1.x和tf.2x版本,seqGan版本為tf1.x版本,后續計劃更新pytorch版本,歡迎大家實踐交流。
關于語料的說明
seq2seq版本代碼執行順序
1、在下載好代碼和語料之后,將語料文件放入data目錄下。
2、按照 數據預處理器(data_utls.py)-->execute.py(執行器)-->app.py(可視化對話模塊)的順序執行就可以了。
3、超參配置在seq2seq.ini和seq2seq_sever.ini文件中配置。
seqGAN版本代碼執行順序
1 、在下載好代碼和語料之后,將語料文件放入source_data目錄下。
2、按照 數據預處理器(source_data_utls.py)-->execute.py(執行器)-->app.py(可視化模塊)的順序執行就可以了
參考代碼和文獻
建議環境
ubuntu14.04
python3.5
tensorflow==1.10.1或者tensorflow-gpu==1.10.1
flask==0.11.1
已更新功能清單:
V1.1:已經增加中文分詞,效果是變得更好了。注意在使用分詞后,需要增加詞典的大小,否則的話會導致詞典無法覆蓋訓練集,導致出現很多的UNK。直接在seq2seq.ini中修改超參數enc_vocab_size和dec_vocab_size的值即可。
V2.0:增加一個基于SeqGan的版本,以增加訓練的效果。
V3.0:增加TensorFlow2.0版本,目前是2.0.0alpha,訓練效果見文件夾內圖片,訓練數據已經準備好,直接執行python3 execute即可進行訓練。
版本路線圖:
V4.0:a、增加pytorch版本;b、對當前的工程結構進行調整;敬請期待。
總結
以上是生活随笔為你收集整理的python训练聊天机器人_一个可以进行训练的聊天机器人,一次chat的源码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Google Gears 指南
- 下一篇: websocket python爬虫_p