- 工信部备案号 滇ICP备05000110号-1
- 滇公安备案 滇53010302000111
- 增值电信业务经营许可证 B1.B2-20181647、滇B1.B2-20190004
- 云南互联网协会理事单位
- 安全联盟认证网站身份V标记
- 域名注册服务机构许可:滇D3-20230001
- 代理域名注册服务机构:新网数码
使用 erlang 存储一些特殊字符串到 MySQL 的时候,却没法读出来。经检查,这些字符串的二进制格式如下:
<<240,159,152,134,240,159,152,144>>
14> unicode:characters_to_list(<<240,159,152,134,240,159,152,144>>).[128518,128528]15> erlang:integer_to_list(128518,16).%%查看十六进制"1F606"16> erlang:integer_to_list(128528,16)."1F610"
明显,1F606
和 1F610
超过了常见 unicode 字符串 0000
-FFFF
的表达范围。
根据 unicode 官网上的说明,这是一种 emoji(表情符号),具体的展示形式与厂商有关。
目前来说,多数 MySQL 都?以 utf8 存储,注意 MySQL 的 utf8 和我们所说的传统 utf8 有点区别。MySQL 的 utf8 编码规定了最多只能有 3 个字节,而 emoji 的 unicode 已经超过了 3 个字节,因此 MySQL 的 utf8 无法识别与存储 emoji。
为此可以查阅 MySQL 中关于 unicode 支持的资料,从中可以得知 MySQL 在 5.5 后开始支持 utf8mb4,这种编码支持 1 ~ 4 个字节,这种编码可以表示 emoji。
另外 utf8mb4 向下兼容 utf8。
将 MySQL 中对应的字段改成 utf8mb4 编码:
ALTER TABLE t1 DEFAULT CHARACTER SET utf8mb4, MODIFY col1 char(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL, MODIFY col2 char(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL;
参考:http://www.landui.com/doc/refman/5.5/en/charset-unicode-upgrading.html
将连接库的连接编码改为 utf8mb4,以 erlang 的连接库 emysql 为例:
emysql:add_pool(pool,[{size,1},{user,"user"},{password,"password"},{host,"host"},{port,3306},{encoding,utf8mb4}]).%%或者emysql:add_pool(pool,1,"user","password","host",3306,undefined, utf8mb4).
为了建表方便,可以修改 my.cnf:
# 服务器字符集[mysql]default-character-set=utf8mb4[mysqld]character-set-server=utf8mb4
售前咨询
售后咨询
备案咨询
二维码
TOP