详细介绍oracle数据库字符集

详细介绍oracle数据库字符集,第1张

一 什么是oracle字符集

Oracle字符集是一个字节数据的解释的符号集合 有大小之分 有相互的包容关系 ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储 处理 检索数据 它使数据库工具 错误消息 排序次序 日期 时间 货币 数字 和日历自动适应本地化语言和平台

影响oracle数据库字符集最重要的参数是NLS_LANG参数 它的格式如下:

NLS_LANG = language_territory charset

它有三个组成部分(语言 地域和字符集) 每个成分控制了NLS子集的特性 其中:

Language 指定服务器消息的语言 territory 指定服务器的日期和数字格式 charset 指定字符集 如:AMERICAN _ AMERICA ZHS GBK

从NLS_LANG的组成我们可以看出 真正影响数据库字符集的其实是第三部分 所以两个数据库之间的字符集只要第三部分一样就可以相互导入导出数据 前面影响的只是提示信息是中文还是英文

二 如何查询Oracle的字符集

很多人都碰到过因为字符集不同而使数据导入失败的情况 这涉及三方面的字符集 一是oracel server端的字符集 二是oracle client端的字符集三是dmp文件的字符集 在做数据导入的时候 需要这三个字符集都一致才能正确导入

查询oracle server端的字符集

有很多种方法可以查出oracle server端的字符集 比较直观的查询方法是以下这种:SQL>select userenv( language ) from dual

结果类似如下:AMERICAN _ AMERICA ZHS GBK

如何查询dmp文件的字符集

用oracle的exp工具导出的dmp文件也包含了字符集信息 dmp文件的第 和第 个字节记录了dmp文件的字符集 如果dmp文件不大 比如只有几M或几十M 可以用UltraEdit打开( 进制方式) 看第 第 个字节的内容 如 然后用以下SQL查出它对应的字符集:

SQL>select nls_charset_name(to_number( xxxx )) from dual

ZHS GBK

如果dmp文件很大 比如有 G以上(这也是最常见的情况) 用文本编辑器打开很慢或者完全打不开 可以用以下命令(在unix主机上):

cat exp dmp |od x|head |awk {print $ $ } |cut c

然后用上述SQL也可以得到它对应的字符集

查询oracle client端的字符集

这个比较简单 在windows平台下 就是注册表里面相应OracleHome的NLS_LANG 还可以在dos窗口里面自己设置 比如:

set nls_lang=AMERICAN_AMERICA ZHS GBK

这样就只影响这个窗口里面的环境变量

在unix平台下 就是环境变量NLS_LANG

$echo $NLS_LANG

AMERICAN_AMERICA ZHS GBK

如果检查的结果发现server端与client端字符集不一致 请统一修改为同server端相同的字符集

三 修改oracle的字符集

上文说过 oracle的字符集有互相的包容关系 如us ascii就是zhs gbk的子集 从us ascii到zhs gbk不会有数据解释上的问题 不会有数据丢失 在所有的字符集中utf 应该是最大 因为它基于unicode 双字节保存字符(也因此在存储空间上占用更多)

一旦数据库创建后 数据库的字符集理论上讲是不能改变的 因此 在设计和安装之初考虑使用哪一种字符集十分重要 根据Oracle的官方说明 字符集的转换是从子集到超集受支持 反之不行 如果两种字符集之间根本没有子集和超集的关系 那么字符集的转换是不受oracle支持的 对数据库server而言 错误的修改字符集将会导致很多不可测的后果 可能会严重影响数据库的正常运行 所以在修改之前一定要确认两种字符集是否存在子集和超集的关系 一般来说 除非万不得已 我们不建议修改oracle数据库server端的字符集 特别说明 我们最常用的两种字符集ZHS GBK和ZHS CGB 之间不存在子集和超集关系 因此理论上讲这两种字符集之间的相互转换不受支持

修改server端字符集(不建议使用)

在oracle 之前 可以用直接修改数据字典表props$来改变数据库的字符集 但oracle 之后 至少有三张系统表记录了数据库字符集的信息 只改props$表并不完全 可能引起严重的后果 正确的修改方法如下:

$sqlplus /nolog

SQL>conn / as sysdba

若此时数据库服务器已启动 则先执行SHUTDOWN IMMEDIATE命令关闭数据库服务器 然后执行以下命令:

SQL>STARTUP MOUNT

SQL>ALTER SYSTEM ENABLE RESTRICTED SESSION

SQL>ALTER SYSTEM SET JOB_QUEUE_PROCESSES=

SQL>ALTER SYSTEM SET AQ_TM_PROCESSES=

SQL>ALTER DATABASE OPEN

SQL>ALTER DATABASE CHARACTER SET ZHS GBK

SQL>ALTER DATABASE national CHARACTER SET ZHS GBK

SQL>SHUTDOWN IMMEDIATE

SQL>STARTUP

修改dmp文件字符集

上文说过 dmp文件的第 第 字节记录了字符集信息 因此直接修改dmp文件的第 第 字节的内容就可以 骗 过oracle的检查 这样做理论上也仅是从子集到超集可以修改 但很多情况下在没有子集和超集关系的情况下也可以修改 我们常用的一些字符集 如US ASCII WE ISO P ZHS CGB ZHS GBK基本都可以改 因为改的只是dmp文件 所以影响不大

具体的修改方法比较多 最简单的就是直接用UltraEdit修改dmp文件的第 和第 个字节 比如想将dmp文件的字符集改为ZHS GBK 可以用以下SQL查出该种字符集对应的 进制代码:

SQL>select to_char(nls_charset_id( ZHS GBK ) xxxx ) from dual

然后将dmp文件的 字节修改为 即可

lishixinzhi/Article/program/Oracle/201311/17875

数据库字符集在创建后原则上不能更改。不过有2种方法可行。

1. 如果需要修改字符集,通常需要导出数据库数据,重建数据库,再导入数据库数据的方式来转换。

2. 通过ALTER DATABASE CHARACTER SET语句修改字符集,但创建数据库后修改字符集是有限制的,只有新的字符集是当前字符集的超集时才能修改数据库字符集,例如UTF8是US7ASCII的超集,修改数据库字符集可使用ALTER DATABASE CHARACTER SET UTF8。

如何设置oracle的编码格式

查看及修改oracle编码格式方法:

1、查看oracle数据库字符集:

select userenv('language') from dual

查询结果:

SIMPLIFIED CHINESE_CHINA.AL32UTF8

2、修改oracle数据库字符集:(在SQL Plus中)

sql>conn / as sysdba

sql>shutdown immediate

database closed.

database dismounted.

oracle instance shut down.

sql>startup mount

oracle instance started.

total system global area 135337420 bytes

fixed size 452044 bytes

variable size 109051904 bytes

database buffers 25165824 bytes

redo buffers 667648 bytes

database mounted.

sql>alter system enable restricted session

system altered.

sql>alter system set job_queue_processes=0

system altered.

sql>alter system set aq_tm_processes=0

system altered.


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6780927.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-28
下一篇 2023-03-28

发表评论

登录后才能评论

评论列表(0条)

保存