mysql保存特殊表情_让 MySQL 支持 emoji 表情等特殊字符存储
在導(dǎo)入 twitter 內(nèi)容的時候,發(fā)現(xiàn)有部分內(nèi)容會出錯。開始以為是編碼問題,但文本全部為 utf8 也會出現(xiàn)這個問題,后來定位到 emoji 字符。其原因是 utf8 是不定長的,根據(jù)左側(cè)位來決定占用了幾個字節(jié)。emoji 表情是 4 個字節(jié),而 MySQL 的 utf8 編碼最多支持 3 個字節(jié),所以插入會出錯。
為了解決這個問題,MySQL 開始支持 utf8mb4
utf8mb4 可支持 4 個字節(jié) utf 編碼,從而支持更大的字符集,并且兼容 utf8。簡單來說,utf8mb4 是 utf8 的超集。
要讓 MySQL 開啟 utf8mb4 支持,需要一些額外的設(shè)置。
檢查 MySQL Server 版本
utf8mb4 支持需要 MySQL Server v5.5.3+
設(shè)置表的 CHARSET
創(chuàng)建表的時候指定 CHARSET 為 utf8mb4
1
2
3CREATE TABLE IF NOT EXISTS table_name (
...
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE utf8mb4_general_ci;
或者修改已存在的表 CHARSET 為 utf8mb41ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
修改 MySQL 配置文件
修改 my.conf 的內(nèi)容
1
2
3
4
5
6
7
8
9
10[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
檢查是否生效
正常情況下的結(jié)果應(yīng)該如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15mysql> SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';
+--------------------------+--------------------+
| Variable_name | Value |
+--------------------------+--------------------+
| character_set_client | utf8mb4 |
| character_set_connection | utf8mb4 |
| character_set_database | utf8mb4 |
| character_set_filesystem | binary |
| character_set_results | utf8mb4 |
| character_set_server | utf8mb4 |
| character_set_system | utf8 |
| collation_connection | utf8mb4_unicode_ci |
| collation_database | utf8mb4_unicode_ci |
| collation_server | utf8mb4_unicode_ci |
+--------------------------+--------------------+
指定 MySQL 連接時的 charset
以 mysql-python 為例:
1
2
3
4
5
6
7
8
9MySQLdb.connect(
host=config.DB_HOST,
port=config.DB_PORT,
user=config.DB_USR,
passwd=config.DB_PSW,
db=config.DB_NAME,
use_unicode=True,
charset="utf8mb4"
)
參考
總結(jié)
以上是生活随笔為你收集整理的mysql保存特殊表情_让 MySQL 支持 emoji 表情等特殊字符存储的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2u是什么平台
- 下一篇: linux cmake编译源码,linu