Oracle数据库全球化
一、自定义数据库和各个会话的语言相关行为
1.1 全球化功能
字符集
Oracle数据库软件有自己的字符集,不依赖于主机操作系统的字符集。
Oracle支持数百种字符集,我们在建立数据库时应该充分考虑实际业务需求,从而选择合适的字符集。
比如,我们确定数据库只是中国人来用,那么就可以选择ZHS16GBK字符集。
语言支持
查询v$nls_valid_values视图:
--查询数据库语言支持情况 select * from v$nls_valid_values where parameter='LANGUAGE';
可以看到结果中支持很多语言,比如SIMPLIFIED CHINESE,TRADITIONAL CHINESE,JAPANESE等。
Oracle默认排序规则是BINARY,同时Oracle还提供了很多排序规则供用户选择:
--查询数据库排序支持情况 select * from v$nls_valid_values where parameter='SORT';
地区支持
查询数据库支持的地区:
--查询数据库地区支持情况 select * from v$nls_valid_values where parameter='TERRITORY';
结果可以看到很多支持的地区,比如CHINA,CANADA,FRANCH等。选中某个地区可以默认设置许多全球化特性。
1.2 使用全球化支持功能
可以在任意级别上指定全球化(优先级由低->高):数据库、实例、客户端环境、会话、语句。
1.2.1 选择字符集
前面说过,如果我们确定数据库只是中国人来用,那么就可以选择ZHS16GBK字符集。
同样,如果要存储法语和西班牙语,就可以选择Western European字符集;如果要存储俄语或者捷克语数据,就应该选择Eastern European字符集。
数据库字符集用于存储varchar2、clob、char、long数据类型列中的所有数据。
8.0版本后,Oracle引入了National Character Set,即数据库的第二个字符集,它用于存储nvarchar2, nclob, nchar数据类型的数据。
9i版本后,Oracle的National Character Set只能为Unicode字符集,有两种选择AL16UTF16和UTF8.选择哪个要考虑nvarchar2数据类型中实际要存储的数据类型,如果大部分数据可以表示为一个字节,选择UTF8;反之选择AL16UTF16。如果实际应用表中用不到nvarchar的数据类型,这个选择没有意义。
1.2.2 改变数据库字符集
在9i版本之前,无法改变数据库字符集,从9i版本开始,虽然可以改字符集,但无法保证这种方法有效。
可以使用csscan和lcsscan工具来帮助决定字符集是否能够修改(必须首先运行csminst.sql脚本)。
确定可以无损改变数据库字符集后,就可以通过执行alter database character set..命令来完成字符集的修改。
命令本身要求目标字符集必须是原始字符集的一个超集,但不能保证不存在问题。
1.2.3 数据库中的全球化
数据库级别的全球化设置。
--查询NLS_DATABASE_PARAMETERS视图 select * from nls_database_parameters; PARAMETER VALUE ------------------------------ -------------------------------------------------------------------------------- NLS_LANGUAGE AMERICAN NLS_TERRITORY AMERICA NLS_CURRENCY $ NLS_ISO_CURRENCY AMERICA NLS_NUMERIC_CHARACTERS ., NLS_CHARACTERSET ZHS16GBK NLS_CALENDAR GREGORIAN NLS_DATE_FORMAT DD-MON-RR NLS_DATE_LANGUAGE AMERICAN NLS_SORT BINARY NLS_TIME_FORMAT HH.MI.SSXFF AM NLS_TIMESTAMP_FORMAT DD-MON-RR HH.MI.SSXFF AM NLS_TIME_TZ_FORMAT HH.MI.SSXFF AM TZR NLS_TIMESTAMP_TZ_FORMAT DD-MON-RR HH.MI.SSXFF AM TZR NLS_DUAL_CURRENCY $ NLS_COMP BINARY NLS_LENGTH_SEMANTICS BYTE NLS_NCHAR_CONV_EXCP FALSE NLS_NCHAR_CHARACTERSET AL16UTF16 NLS_RDBMS_VERSION 11.2.0.4.0 20 rows selected.
1.2.4 实例级别的全球化
实例级别的全球化设置,实例参数设置会重写数据库设置。
--查询nls_instance_parameters视图 select * from nls_instance_parameters PARAMETER VALUE ------------------------------ ------------------------------ NLS_LANGUAGE AMERICAN NLS_TERRITORY AMERICA NLS_SORT NLS_DATE_LANGUAGE NLS_DATE_FORMAT NLS_CURRENCY NLS_NUMERIC_CHARACTERS NLS_ISO_CURRENCY NLS_CALENDAR NLS_TIME_FORMAT NLS_TIMESTAMP_FORMAT NLS_TIME_TZ_FORMAT NLS_TIMESTAMP_TZ_FORMAT NLS_DUAL_CURRENCY NLS_COMP BINARY NLS_LENGTH_SEMANTICS BYTE NLS_NCHAR_CONV_EXCP FALSE 17 rows selected.
1.2.5 客户端环境设置
一般我们项目常用的在客户端环境变量中配置的两个参数:
NLS_LANG NLS_DATE_FORMAT
/bin/bash环境:
export NLS_LANG="simplified chinese_china.ZHS16GBK" export NLS_DATE_FORMAT="YYYY-MM-DD HH24:Mi:SS"
/bin/csh环境:
setenv NLS_LANG "simplified chinese_china.ZHS16GBK" setenv NLS_DATE_FORMAT "YYYY-MM-DD HH24:Mi:SS"
注意:DBA不能控制终端用户对NLS_LANG环境变量的设置。如果应用程序容易受到全球化的影响,那么开发人员就应该考虑到这个问题,同时在会话内控制全球化设置。
服务器端与客户端全球化设置之间的转换由Oracle Net完成。如果客户端与服务器使用不同的字符集,那么就可能无法完成数据的转换。
1.2.6 会话级别的全球化设置
会话级别的规范优先于服务器端数据库与实例级别的设置,而且会重写用户使用环境变量配置其会话的各种尝试。
设定nls_date_format
--第一种方法 alter session set nls_date_format='YYYY-MM-DD HH24:Mi:SS'; --第二种方法 exec dbms_session.set_nls('nls_date_format','''dd.mm.yyyy'''); --实验验证: SQL> alter session set nls_date_format='YYYY-MM-DD'; Session altered. SQL> select sysdate from dual; SYSDATE ---------- 2016-02-03 SQL> exec dbms_session.set_nls('nls_date_format','''dd.mm.yyyy'''); PL/SQL procedure successfully completed. SQL> select sysdate from dual; SYSDATE ---------- 03.02.2016
查看v$nls_parameters或者nls_session_parameters视图查看当前作用于会话的全球化设置:
select * from v$nls_parameters; select * from nls_session_parameters; SQL> select * from v$nls_parameters; PARAMETER VALUE ------------------------------ ------------------------------ NLS_LANGUAGE SIMPLIFIED CHINESE NLS_TERRITORY CHINA NLS_CURRENCY ¥ NLS_ISO_CURRENCY CHINA NLS_NUMERIC_CHARACTERS ., NLS_CALENDAR GREGORIAN NLS_DATE_FORMAT YYYY-MM-DD HH24:Mi:SS NLS_DATE_LANGUAGE SIMPLIFIED CHINESE NLS_CHARACTERSET ZHS16GBK NLS_SORT BINARY NLS_TIME_FORMAT HH.MI.SSXFF AM NLS_TIMESTAMP_FORMAT DD-MON-RR HH.MI.SSXFF AM NLS_TIME_TZ_FORMAT HH.MI.SSXFF AM TZR NLS_TIMESTAMP_TZ_FORMAT DD-MON-RR HH.MI.SSXFF AM TZR NLS_DUAL_CURRENCY ¥ NLS_NCHAR_CHARACTERSET AL16UTF16 NLS_COMP BINARY NLS_LENGTH_SEMANTICS BYTE NLS_NCHAR_CONV_EXCP FALSE 19 rows selected. --查询nls_session_parameters,没有字符集信息 SQL> select * from nls_session_parameters; PARAMETER VALUE ------------------------------ ------------------------------ NLS_LANGUAGE SIMPLIFIED CHINESE NLS_TERRITORY CHINA NLS_CURRENCY ¥ NLS_ISO_CURRENCY CHINA NLS_NUMERIC_CHARACTERS ., NLS_CALENDAR GREGORIAN NLS_DATE_FORMAT YYYY-MM-DD HH24:Mi:SS NLS_DATE_LANGUAGE SIMPLIFIED CHINESE NLS_SORT BINARY NLS_TIME_FORMAT HH.MI.SSXFF AM NLS_TIMESTAMP_FORMAT DD-MON-RR HH.MI.SSXFF AM NLS_TIME_TZ_FORMAT HH.MI.SSXFF AM TZR NLS_TIMESTAMP_TZ_FORMAT DD-MON-RR HH.MI.SSXFF AM TZR NLS_DUAL_CURRENCY ¥ NLS_COMP BINARY NLS_LENGTH_SEMANTICS BYTE NLS_NCHAR_CONV_EXCP FALSE 17 rows selected.
1.2.7 语句级别的全球化设置
全球化设置的最优控制级别是在每个SQL语句内进行编程控制,此时必然会在SQL函数中使用NLS参数。
比如:
--分别用英语,简体中文,日语显示职员的入职日期及星期: select to_char(HIREDATE,'Day dd, Month YYYY','NLS_DATE_LANGUAGE=AMERICAN') "English", to_char(HIREDATE,'Day dd, Month YYYY','NLS_DATE_LANGUAGE=''SIMPLIFIED CHINESE''') "Chinese", to_char(HIREDATE,'Day dd, Month YYYY','NLS_DATE_LANGUAGE=JAPANESE') "Japanese" from scott.emp; SQL> select to_char(HIREDATE,'Day dd, Month YYYY','NLS_DATE_LANGUAGE=AMERICAN') "English", 2 to_char(HIREDATE,'Day dd, Month YYYY','NLS_DATE_LANGUAGE=''SIMPLIFIED CHINESE''') "Chinese", 3 to_char(HIREDATE,'Day dd, Month YYYY','NLS_DATE_LANGUAGE=JAPANESE') "Japanese" 4 from scott.emp; English Chinese Japanese ------------------------------------ ------------------------- ------------------------- Wednesday 17, December 1980 星期三 17, 12月 1980 水曜日 17, 12月 1980 Friday 20, February 1981 星期五 20, 2月 1981 金曜日 20, 2月 1981 Sunday 22, February 1981 星期日 22, 2月 1981 日曜日 22, 2月 1981 Thursday 02, April 1981 星期四 02, 4月 1981 木曜日 02, 4月 1981 Monday 28, September 1981 星期一 28, 9月 1981 月曜日 28, 9月 1981 Friday 01, May 1981 星期五 01, 5月 1981 金曜日 01, 5月 1981 Tuesday 09, June 1981 星期二 09, 6月 1981 火曜日 09, 6月 1981 Sunday 19, April 1987 星期日 19, 4月 1987 日曜日 19, 4月 1987 Tuesday 17, November 1981 星期二 17, 11月 1981 火曜日 17, 11月 1981 Tuesday 08, September 1981 星期二 08, 9月 1981 火曜日 08, 9月 1981 Saturday 23, May 1987 星期六 23, 5月 1987 土曜日 23, 5月 1987 Thursday 03, December 1981 星期四 03, 12月 1981 木曜日 03, 12月 1981 Thursday 03, December 1981 星期四 03, 12月 1981 木曜日 03, 12月 1981 Saturday 23, January 1982 星期六 23, 1月 1982 土曜日 23, 1月 1982 14 rows selected.
二、使用数据库和NLS字符集
2.1 语言排序与选择
Oracle默认使用二进制排序,要排序的字符串从左到右读取,并且每个字符都被简化为他的ASCII数字。这种排序方法适用于美国英语,对于其他语言,则有可能不正确。
2.2 Locale Builder
Locale Builder是个图形化的工具,他能通过为语言、地区、字符集以及语言排序生成定义来创建自定义的全球化环境。
2.3 使用时区
为了实现业务必须在多个时区之间正常运转的功能,需要指定数据库所运作的时区以及使用TIMESTAMP WITH TIME ZONE与TIMESTAMP WITH LOCAL TIME ZONE数据类型。
实验:调整时区