MySQL 的 utf8_general_ci 和 utf8_unicode_ci 有什么区别，应如何选择？

xiaobaif

2020-01-09

关注关注

首先就其准确性说，这世界上有无数种文字，除了通用的英文使用我们较熟悉的 A-Z 字符外，还有很多种近似的写法用于法文、德文、俄文等等…

MySQL 的 utf8_general_ci 和 utf8_unicode_ci 有什么区别，应如何选择？

光是一个 A 字就有数十种不同表现
为什么不都用同一种 A 呢，几十种多麻烦啊。事实上，它们在所属的文字上都各有意义，可能代表不同的发音，也可能是其他东西。在某些语言上，同一个单词不同发音可能就代表两个意思。

校对规则

utf8_unicode_ci 及 utf8_general_ci 的用途就是对那些看起来不一样的字符进行转换，令我们进行排序比对时更方便准确。

以下面为例，直接看起来是不相等的，但在实际应用上是成立的，这就是 utf8_unicode_ci 及 utf8_general_ci 工作的结果。
Ä = A
Ö = O
Ü = U

而 utf8_unicode_ci 准确性较好就表现在它有更完整的字元对照表上，它甚至可以将一个特别字符转换成多于一个英文字符，以德文中的 s 例:

在 utf8_unicode_ci 下面等式是成立
ß = ss

在 utf8_general_ci 只有这样才成立
ß = s

排序规则

因为 utf8_unicode_ci 有更完整字符表及转换规则，所以在排序的准确性上也比 utf8_general_ci 高一些。

utf8_general_ci 字符表的一部份

utf8_unicode_ci 有更完整的字符表

效能

同样因为 utf8_unicode_ci 的字符表及转换规则更复杂，所以在效能上比 utf8_general_ci 慢。

总结

如果你的应用是德文、俄文等等，或者需要精确处理国际化的内容，请用 utf8_unicode_ci 。
否则的话用 utf8_general_ci 就可以了。

备注

虽然说 utf8_unicode_ci 的字集比较完整，但其实还是不全的，所以 MySQL 还提供了很多种其他语言的专用字集，用于特别的本地应用，详细可以看看下面的官网连结

參考

MySQL 官方解说: http://dev.mysql.com/doc/refman/5.0/en/charset-unicode-sets.html

utf8 unicode mysql ci

xiaobaif

0 关注 0 粉丝 0 动态

关注关注

Golang 中的 Unicode 与 UTF-8

大多数的我们，真正认识到有字符编码这回事，一般都是因为遇到了乱码，因为我国常用的编码是 GBK 以及 GB2312：用两个 Byte 来表示所有的汉字，这样，我们一共可以表示 2^16 = 65536 个字符，一旦我们的 GBK 以及 GB2312 编

周游列国之仕子 2020-09-21

MySQL 编码utf8 与 utf8mb4 utf8mb4_unicode_ci 与 utf8mb4_general_ci

utf8mb4 已成为 MySQL 8.0 的默认字符集，在MySQL 8.0.1及更高版本中将 utf8mb4_0900_ai_ci 作为默认排序规则。UTF-8 编码是一种变长的编码机制，可以用1~4个字节存储字符。因为历史遗留问题，MySQL 中的

mjshldcsd 2020-06-14

ascii、unicode、utf-8、gbk

字节码是一种中间状态（中间码）的二进制代码（文件）。需要直译器转译后才能成为机器码。1字节 = 8 位位，数据存储是以“字节”为单位，数据传输是以大多是以“位”为单位，一个位就代表一个0或1，二进制是构成存储器的最小单位，utf-8 万国码的升级版

81214051 2020-06-01

utf8字符集下的比较规则

在MySQL中，比较常用的字符集是utf8和utf8mb4。这两个字符集是类似的，utf8是utf8mb3的别名，所以之后在MySQL中提到utf8就意味着使用1~3个字节来表示一个字符，如果大家有使用4字节编码一个字符的情况，比如存储一些emoji表情啥

88384957 2020-03-27

Marshal.PtrToStringAnsi中文乱码

查看内存后知道内存编码是UTF8，Marshal不支持UTF转换，所以必须先转成Unicode再转成UTF8

81214051 2020-01-28

utf8和utf8mb4的区别

MySQL在5.5.3之后增加了这个utf8mb4的编码，mb4就是most bytes 4的意思，专门用来兼容四字节的unicode。好在utf8mb4是utf8的超集，除了将编码改为utf8mb4外不需要做其他转换。当然，为了节省空间，一般情况下使用u

88540591 2019-12-26

MySQL乱码的原因和设置UTF8数据格式

MySQL使用时，有一件很痛苦的事情肯定是结果乱码。将编码格式都设置为UTF8可以解决这个问题，我们今天来说下为什么要这么设置，以及怎么设置。在编程语言中，我们为了防止中文乱码，会使用unicode对中文字符做处理，而为了降低网络带宽和节省存储空间，我们使

xiaobaif 2019-12-20

Python中 sys.setdefaultencoding(\"utf8\") 的作用详解

设置python默认字节流编/解码器按照utf8解码方式，把字节流编/解码为unicode；在将字节流使用str()方法转换为str对象时，会调用默认的encode函数，如果没有上述系统的默认编码设置，则自动使用‘ascii‘ codecs进行编码，对于非

88384957 2019-11-09

MySQL字符集utf8修改为utf8mb4

对于mysql 5.5 而言，如果不设定字符集，mysql默认的字符集是 latin1 拉丁文字符集；utf8mb4兼容utf8，且比utf8能表示更多的字符，是utf8字符集的超集。当然调整的最好方法是客户端，mysql数据库的字符集都修改为utf8mb

lpfvip00 2019-11-09

python基础字符编码转换

#python2上所有的字符编码都需要先decode到unicode,再从unicode encode到目标编码。#二进制转换为字符串，使用decode，此处二进制的编码格式如果填写错误可能会导致二进制无法转换为字符串，导致程序报错。#python3上默认

JakobHu 2019-11-09

Mysql创建数据库字符集的选择

utf8_general_ci ，这个你在注册用户名和邮箱的时候就要使用。utf8_bin:字符串每个字符串用编译存储。utf8_unicode_ci和utf8_general_ci对中、英文来说没有实质的差别。

bluet00 2020-05-12

PHP dirname(FILE)原理及用法解析

即使这个文件被其他文件引用，__file__始终是它所在文件的完整路径，而不是引用它的那个文件完整路径。dirname;得到的是__FILE__所在文件的上一层目录名。_FILE_ 得到的就是完整路径即 F:\Modoer_2.6_SC_UTF8\upl

wwwsurfphpseocom 2评论 2020-10-28

使用AJAX实现UTF8编码表单提交到GBK编码脚本无乱码的解决方法

<li><a href="utf8Form.html" rel="external nofollow" rel="external nofollow" rel="ext

learningever 2020-09-19

JVM系列之:String.intern和stringTable

它和String.intern有什么关系呢？在字符串对象的创建过程中，StringTable有起到了什么作用呢？一切的答案都在本文中，快来看看吧。intern是String类中的一个native方法，所以它底层是用c++来实现的。感兴趣的同学可以去查看下J

voiletbin 2020-07-26

mysql URL

characterEncoding=utf8&useUnicode=true. characterEncoding=utf8&useSSL=false&serverTimezone=UTC

ldcwang 2020-07-26

Oracle 修改字符集（AL32UTF8 转换成UTF8字符集）

warden00 2020-06-11

PHP无法连接MYSQL8.0一般处理办法

修改默认加密方式，默认编码

勇往直前 2020-06-04

windows系统修改cmd窗口utf-8编码格式

window操作系统默认编码格式是gbk编码，下面教大家如何临时修改成utf-8编码和永久默认为utf-8编码格式。直接输入“chcp 65001”，回车键执行，这时候该窗口编码已经是UTF-8编码了。按顺序找到HKEY_LOCAL_MACHINE\SOF

88236637 2020-06-03

mysql多个字段模糊查询是否包含某个词

) COLLATE utf8_general_ci LIKE ‘%替换关键词%‘;

weiguoxin 2020-06-02

Mysql 常用语句实战（2）

`Cno` int NOT NULL COMMENT ‘课程编号‘,) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact;`score`

阳历六月 2020-05-14

安科网

MySQL 的 utf8_general_ci 和 utf8_unicode_ci 有什么区别，应如何选择？

xiaobaif

校对规则

排序规则

效能

总结

备注

xiaobaif

相关推荐

Golang 中的 Unicode 与 UTF-8

MySQL 编码utf8 与 utf8mb4 utf8mb4_unicode_ci 与 utf8mb4_general_ci

ascii、unicode、utf-8、gbk

utf8字符集下的比较规则

Marshal.PtrToStringAnsi中文乱码

utf8和utf8mb4的区别

MySQL乱码的原因和设置UTF8数据格式

Python中 sys.setdefaultencoding(\"utf8\") 的作用详解

MySQL字符集utf8修改为utf8mb4

python基础字符编码转换

Mysql创建数据库字符集的选择

PHP dirname(FILE)原理及用法解析

使用AJAX实现UTF8编码表单提交到GBK编码脚本无乱码的解决方法

JVM系列之:String.intern和stringTable

mysql URL

Oracle 修改字符集（AL32UTF8 转换成UTF8字符集）

PHP无法连接MYSQL8.0一般处理办法

windows系统修改cmd窗口utf-8编码格式

mysql多个字段模糊查询是否包含某个词

Mysql 常用语句实战（2）

xiaobaif