RNN分类姓氏
11.2 Pytorch
11.2.5 RNN分類姓氏
@Author:By Runsen
數(shù)據(jù)集下載鏈接:https://download.pytorch.org/tutorial/data.zip,參考:https://pytorch.org/tutorials/intermediate/char_rnn_classification_tutorial.html
新建data文件夾,下載數(shù)據(jù)集,并將其解壓縮到當(dāng)前data文件夾中。
maoli@VM-0-5-ubuntu:~/pytorch/data$ tree ├── eng-fra.txt └── names├── Arabic.txt├── Chinese.txt├── Czech.txt├── Dutch.txt├── English.txt├── French.txt├── German.txt├── Greek.txt├── Irish.txt├── Italian.txt├── Japanese.txt├── Korean.txt├── Polish.txt├── Portuguese.txt├── Russian.txt├── Scottish.txt├── Spanish.txt└── Vietnamese.txt在 data/names 目錄中包含18個(gè)名的 “[Language].txt” 文本文件,每個(gè)文件都包含不同國家的一堆姓氏(name),我們將建立和訓(xùn)練一個(gè)基本的字符級(jí)RNN進(jìn)行分類單詞,最后的預(yù)測(cè)作為輸出,即判斷出哪里姓氏屬于哪個(gè)國家。
總結(jié)
- 上一篇: 二、LInux系统安装Java
- 下一篇: 二十七、Kaggle| 研究生入学率预测