<meta http-equiv=\"Content-Type\" content=\"text/html; charset=gb2312\">
META,网页Html语言里Head区重要标签之一
HTTP-EQUIV类似于HTTP的头部协议,它回应给浏览器一些有用的信息,以帮助正确和精确地显示网页内容。
常用的HTTP-EQUIV类型有:
Content-Type和Content-Language(显示字符集的设定)
说明:设定页面使用的字符集,用以说明主页制作所使用的文字已经语言,浏览器会根据此来调用相应的符集显示page内容。
<Metahttp-equiv="Content-Type"Content="text/html;Charset=gb2312">该META标签定义了HTML页面所使用的字符集为GB2132,就是国标汉字码。如果将其中的“charset=GB2312”替换成“BIG5”,则该页面所用的字符集就是繁体中文Big5码。当你浏览一些国外的站点时,IE浏览器会提示你要正确显示该页面需要下载xx语支持。这个功能就是通过读取HTML页面META标签的Content-Type属性而得知需要使用哪种字符集显示该页面的。如果系统里没有装相应的字符集,则IE就提示下载。其他的语言也对应不同的charset,比如日文的字符集是“iso-2022-jp”,韩文的是“ks_c_5601”。
Content-Type的Content还可以是:text/xml等文档类型Charset选项:ISO-8859-1(英文)、BIG5、UTF-8、SHIFT-Jis、Euc、Koi8-2、us-ascii,x-mac-roman,iso-8859-2,x-mac-ce,iso-2022-jp,x-sjis,x-euc-jp,euc-kr,iso-2022-kr,gb2312,gb_2312-80,x-euc-tw,x-cns11643-1,x-cns11643-2等字符集;Content-Language的Content还可以是:EN、FR等语言代码。
字符集与编码
各个国家和地区所制定的不同ANSI编码标准中,都只规定了各自语言所需的“字符”。比如:汉字标准(GB2312)中没有规定韩国语字符怎样存储。这些ANSI编码标准所规定的内容包含两层含义:
1.使用哪些字符。也就是说哪些汉字,字母和符号会被收入标准中。所包含“字符”的集合就叫做“字符集”。
2.规定每个“字符”分别用一个字节还是多个字节存储,用哪些字节来存储,这个规定就叫做“编码”。
各个国家和地区在制定编码标准的时候,“字符的集合”和“编码”一般都是同时制定的。因此,平常我们所说的“字符集”,比如:GB2312,GBK,JIS等,除了有“字符的集合”这层含义外,同时也包含了“编码”的含义。
“UNICODE字符集”包含了各种语言中使用到的所有“字符”。用来给UNICODE字符集编码的标准有很多种,比如:UTF-8,UTF-7,UTF-16,UnicodeLittle,UnicodeBig等。
1、ISO-8859-1:
最简单的编码规则,每一个字节直接作为一个UNICODE字符。比如,[0xD6,0xD0]这两个字节,通过iso-8859-1转化为字符串时,将直接得到[0x00D6,0x00D0]两个UNICODE字符,即"??"。
反之,将UNICODE字符串通过iso-8859-1转化为字节串时,只能正常转化0~255范围的字符。
2、GB2312,BIG5,Shift_JIS,ISO-8859-2
把UNICODE字符串通过ANSI编码转化为“字节串”时,根据各自编码的规定,一个UNICODE字符可能转化成一个字节或多个字节。
反之,将字节串转化成字符串时,也可能多个字节转化成一个字符。比如,[0xD6,0xD0]这两个字节,通过GB2312转化为字符串时,将得到[0x4E2D]一个字符,即'中'字。
“ANSI编码”的特点:
1.这些“ANSI编码标准”都只能处理各自语言范围之内的UNICODE字符。
2.“UNICODE字符”与“转换出来的字节”之间的关系是人为规定的。
3、UTF-8,UTF-16,UnicodeBig
与“ANSI编码”类似的,把字符串通过UNICODE编码转化成“字节串”时,一个UNICODE字符可能转化成一个字节或多个字节。
与“ANSI编码”不同的是:
1.这些“UNICODE编码”能够处理所有的UNICODE字符。
2.“UNICODE字符”与“转换出来的字节”之间是可以通过计算得到的。
附:codepagecharset对照表
CodePagecharset语种
708ASMO-708阿拉伯字符(ASMO708)
720DOS-720阿拉伯字符(DOS)
28596iso-8859-6阿拉伯字符(ISO)
1256windows-1256阿拉伯字符(Windows)
1257windows-1257波罗的海字符(Windows)
852ibm852中欧字符(DOS)
28592iso-8859-2中欧字符(ISO)
1250windows-1250中欧字符(Windows)
936gb2312简体中文(GB2312)
950big5繁体中文(Big5)
862DOS-862希伯来字符(DOS)
866cp866西里尔字符(DOS)
874windows-874泰语(Windows)
932shift_jis日语(Shift-JIS)
949ks_c_5601-1987朝鲜语
1251windows-1251西里尔字符(Windows)
1252iso-8859-1西欧字符
1253windows-1253希腊字符(Windows)
1254iso-8859-9土耳其字符(Windows)
1255windows-1255希伯来字符(Windows)
1258windows-1258越南字符(Windows)
20866koi8-r西里尔字符(KOI8-R)
21866koi8-ru西里尔字符(KOI8-U)
28595iso-8859-5西里尔字符(ISO)
28597iso-8859-7希腊字符(ISO)
28598iso-8859-8希伯来字符(ISO-Visual)
38598iso-8859-8-i希伯来字符(ISO-Logical)
50932_autodetect日语(自动选择)
51932euc-jp日语(EUC)
52936hz-gb-2312简体中文(HZ)
65001utf-8Unicode(UTF-8)
From:http://hi.baidu.com/%D3%A4%B6%F9%CA%D2%BB%CA%BA%F3