MySQL数据库编码问题(转载)

在程序开发中,有时会被字符乱码的问题所困扰。对此,必须理解 MySQL 的字符集编码设置的原理:在MySQL中,默认使用的是lartin1,也就是ISO8859-1字符集编码。这是一种8位的编码,适用于所有西欧字符。而对于汉字等是不合适的。最好、最通用的编码格式是utf-8,UTF-8(8 位元 Universal Character Set/Unicode Transformation Format)是一种针对Unicode 的可变长度字节编码的Unicode字符集。它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。所以对于8位的西欧字符集来说,更能比较节省空间,而又能够有效地表示汉字等字符。 MySQL服务器对字符集和校对规则有4个级别的默认设置:服务器级、数据库级、表级和连接级。

一、MySQL默认字符集

MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。但是,传统的程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置:

(1)编译MySQL时,指定了一个默认的字符集,这个字符集是latin1;

(2)安装MySQL时,可以在配置文件(my.ini)中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;

(3)启动mysqld时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时character_set_server被设定为这个默认的字符集;

(4)当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为character_set_server;

(5)当选定了一个数据库时,character_set_database被设定为这个数据库默认的字符集;

(6)在这个数据库里创建一张表时,表默认的字符集被设定为character_set_database,也就是这个数据库默认的字符集;

(7)当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;

总结:如果什么地方都不修改,那么所有的数据库的所有表的所有栏的都用 latin1 存储,不过我们如果安装 MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把 default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏的都用 UTF-8 存储。

二、查看默认字符集

查看系统的字符集和校对的设定可以通过下面的两条命令:

1.mysql>SHOWVARIABLESLIKE'character%';

2. mysql> SHOW VARIABLES LIKE 'collation_%';

三、修改默认字符集

(1)最简单的修改方法,就是修改mysql的my.ini文件中的字符集键值,

如:default-character-set=utf8

character_set_server=utf8

修改完后,重启mysql的服务,servicemysqlrestart

(2)还有一种修改字符集的方法,就是使用mysql的命令,如:

mysql>SETcharacter_set_client=utf8;

mysql>SETcharacter_set_connection=utf8;

mysql>SETcharacter_set_database=utf8;

mysql>SETcharacter_set_results=utf8;

mysql>SETcharacter_set_server=utf8;

mysql>SETcollation_connection=utf8;

mysql>SETcollation_database=utf8;

mysql>SETcollation_server=utf8;

有时设置了表的默认字符集为utf8并且通过UTF-8编码发送查询,你会发现存入数据库的仍然是乱码。问题就出在这个connection连接层上。解决方法是在发送查询前执行一下下面这句:

SETNAMES'utf8';SETNAMES显示客户端发送的SQL语句中使用什么字符集。因此,SETNAMES'utf8'语句告诉服务器“将来从这个客户端传来的信息采用字符集'utf8'。它还为服务器发送回客户端的结果指定了字符集。

它相当于下面的三句指令:

mysql>SETcharacter_set_client=utf8;

mysql>SETcharacter_set_results=utf8;

mysql> SET character_set_connection = utf8;

新建数据库时指定库的编码:create database dbName DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;

新建数据表时指定表的编码:create table tableName (uid smallint(5) unsigned NOT NULL auto_increment,username char(50) NOT NULL default '',PRIMARY KEY(uid))TYPE=MyISAM DEFAULT CHARSET=utf8;

另 AJAX 提交中文出现乱码问题 见另一文章:

http://blog.csdn.net/ctowoo/archive/2009/09/26/4596396.aspx

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/ctowoo/archive/2009/09/26/4596361.aspx

相关推荐