按类型分为:字符串类型、数字类型、日期类型、LOB类型、LONG RAW& RAW类型、ROWID & UROWID类型。
在讲叙字符串类型前,先要讲一下编码。字符串类型的数据可依编码方式分成数据库字符集(CHAR/VARCHAR2/CLOB/LONG)和国际字符集(NCHAR/NVARCHAR2/NCLOB)两种。数据库中的字符串数据都通过字符集将字符转换为数字后(二进制),才存储到数据块中。通过不同的编码集转换,即便是相同的字符,也可能会转换成不同的二进制编码。这也是产生乱码的原因。数据库的编码格式一般是在创建数据库时指定的。当然也可以修改数据库的编码。
一 字符串类型
11:CHAR类型 CHAR(size [BYTE | CHAR])
CHAR类型,定长字符串,会用空格填充来达到其最大长度。非NULL的CHAR(12)总是包含12字节信息。CHAR字段最多可以存储2,000字节的信息。如果创建表时,不指定CHAR长度,则默认为1。另外你可以指定它存储字节或字符,例如 CHAR(12 BYTYE) CHAR(12 CHAR)一般来说默认是存储字节
注意:数据库的NLS_CHARACTERSET 为AL32UTF8,即一个汉字占用三到四个字节。如果NLS_CHARACTERSET为ZHS16GBK,则一个字符占用两个字节。
12: NCHAR类型
这是一个包含UNICODE格式数据的定长字符串。NCHAR字段最多可以存储2,000字节的信息。它的最大长度取决于国家字符集。
13 VARCHAR类型
不要使用VARCHAR数据类型。使用VARCHAR2数据类型。
14: VARCHAR2类型
变长字符串,与CHAR类型不同,它不会使用空格填充至最大长度。VARCHAR2最多可以存储4,000字节的信息。
15: NVARCHAR2类型
这是一个包含UNICODE格式数据的变长字符串。 NVARCHAR2最多可以存储4,000字节的信息。
二 数字类型
21 NUMBER类型
NUMBER(P,S)是最常见的数字类型,可以存放数据范围为10130~10126(不包含此值),需要1~22字节(BYTE)不等的存储空间。
P 是Precison的英文缩写,即精度缩写,表示有效数字的位数,最多不能超过38个有效数字
S是Scale的英文缩写,可以使用的范围为-84~127。Scale为正数时,表示从小数点到最低有效数字的位数,它为负数时,表示从最大有效数字到小数点的位数
下面是官方文档的示例
Actual Data Specified As Stored As
12389 NUMBER 12389
12389 NUMBER(3) 124
12389 NUMBER(6,2) 12389
12389 NUMBER(6,1) 1239
12389 NUMBER(3) 124
12389 NUMBER(4,2) exceeds precision
12389 NUMBER(6,-2) 100
01234 NUMBER(4,5)01234
00012 NUMBER(4,5) 00012
000127 NUMBER(4,5) 00013
0000012 NUMBER(2,7) 0000012
00000123 NUMBER(2,7) 0000012
12e-4 NUMBER(2,5) 000012
12e-5 NUMBER(2,5) 000001
22 INTEGER类型
INTEGER是NUMBER的子类型,它等同于NUMBER(38,0),用来存储整数。若插入、更新的数值有小数,则会被四舍五入。
23 浮点数
Oracle 数据库提供了专为浮点数的两种数值数据类型:
BINARY_FLOAT
BINARY_FLOAT 是 32 位、 单精度浮点数字数据类型。可以支持至少6位精度,每个 BINARY_FLOAT 的值需要 5 个字节,包括长度字节。
BINARY_DOUBLE
BINARY_DOUBLE 是为 64 位,双精度浮点数字数据类型。每个 BINARY_DOUBLE 的值需要 9 个字节,包括长度字节。
在数字的列中,浮点数有小数精度。在 BINARY_FLOAT 或 BINARY_DOUBLE 的列中,浮点数有二进制的精度。二进制浮点数支持的特殊值无穷大和 NaN (不是数字)。
25 FLOAT类型
FLOAT类型也是NUMBER的子类型。
Float(n),数 n 指示位的精度,可以存储的值的数目。N 值的范围可以从 1 到 126。若要从二进制转换为十进制的精度,请将 n 乘以 030103。要从十进制转换为二进制的精度,请用 332193 乘小数精度。126 位二进制精度的最大值是大约相当于 38 位小数精度。
三 日期类型
日期类型用于存储日期数据,但是并不是使用一般的格式(2012-08-08)直接存储到数据库的。
31 DATE类型
DATE是最常用的数据类型,日期数据类型存储日期和时间信息。虽然可以用字符或数字类型表示日期和时间信息,但是日期数据类型具有特殊关联的属性。为每个日期值,Oracle 存储以下信息: 世纪、 年、 月、 日期、 小时、 分钟和秒。一般占用7个字节的存储空间。
32 TIMESTAMP类型
这是一个7字节或12字节的定宽日期/时间数据类型。它与DATE数据类型不同,因为TIMESTAMP可以包含小数秒,带小数秒的TIMESTAMP在小数点右边最多可以保留9位
33 TIMESTAMP WITH TIME ZONE类型
这是TIMESTAMP类型的变种,它包含了时区偏移量的值
34 TIMESTAMP WITH LOCAL TIME ZONE类型
35 INTERVAL YEAR TO MOTH
36 INTERVAL DAY TO SECOND
四 LOB类型
内置的LOB数据类型包括BLOB、CLOB、NCLOB、BFILE(外部存储)的大型化和非结构化数据,如文本、图像、视屏、空间数据存储。BLOB、CLOB、NCLOB类型
41 CLOB 数据类型
它存储单字节和多字节字符数据。支持固定宽度和可变宽度的字符集。CLOB对象可以存储最多 (4 gigabytes-1) (database block size) 大小的字符
42 NCLOB 数据类型
它存储UNICODE类型的数据,支持固定宽度和可变宽度的字符集,NCLOB对象可以存储最多(4 gigabytes-1) (database block size)大小的文本数据。
43 BLOB 数据类型
它存储非结构化的二进制数据大对象,它可以被认为是没有字符集语义的比特流,一般是图像、声音、视频等文件。BLOB对象最多存储(4 gigabytes-1) (database block size)的二进制数据。
44 BFILE 数据类型
二进制文件,存储在数据库外的系统文件,只读的,数据库会将该文件当二进制文件处理
五 RAW & LONG RAW类型
51 LONG类型
它存储变长字符串,最多达2G的字符数据(2GB是指2千兆字节, 而不是2千兆字符),与VARCHAR2 或CHAR 类型一样,存储在LONG 类型中的文本要进行字符集转换。ORACLE建议开发中使用CLOB替代LONG类型。支持LONG 列只是为了保证向后兼容性。CLOB类型比LONG类型的限制要少得多。 LONG类型的限制如下:
1一个表中只有一列可以为LONG型。(Why有些不明白)
2LONG列不能定义为主键或唯一约束,
3不能建立索引
4LONG数据不能指定正则表达式。
5函数或存储过程不能接受LONG数据类型的参数。
6LONG列不能出现在WHERE子句或完整性约束(除了可能会出现NULL和NOT NULL约束)
52 LONG RAW 类型,能存储2GB 的原始二进制数据(不用进行字符集转换的数据)
53 RAW类型
用于存储二进制或字符类型数据,变长二进制数据类型,这说明采用这种数据类型存储的数据不会发生字符集转换。这种类型最多可以存储2,000字节的信息
六 ROWID & UROWID类型
在数据库中的每一行都有一个地址。然而,一些表行的地址不是物理或永久的,或者不是ORACLE数据库生成的。
例如,索引组织表行地址存储在索引的叶子,可以移动。
例如,外部表的ROWID(如通过网关访问DB2表)不是标准的ORACLE的rowid。
ORACLE使用通用的ROWID(UROWIDs)的存储地址的索引组织表和外表。索引组织表有逻辑urowids的,和国外表的外urowids。UROWID这两种类型的存储在ROWID伪(堆组织的表的物理行id)。
创建基于逻辑的rowid在表中的主键。逻辑的rowid不会改变,只要主键不改变。索引组织表的ROWID伪UROWID数据类型。你可以访问这个伪列,你会堆组织表的ROWID伪(即使用一个SELECT …ROWID语句)。如果你想存储的rowid索引组织表,那么你就可以定义一列的表型UROWID到列检索值的ROWID伪。
empno=100不存在的,改成有的数据了。
#!/bin/bash
result=$(sqlplus -s 'scott/tiger@dbname'<<EOF
spool testtxt
set pages 0
set feed off
set heading off;
set feedback off;
set verify off;
set linesize 1000;
SELECT FROM scottemp where empno=7369;
spool off
EOF
)
echo $result
~
~
~
~
~
~
~
~
~
"testsh" 14L, 256C written
oracle@:~> /testsh
7369 SMITH CLERK 7902 17-DEC-80 224006 20
oracle@:~> more testtxt
7369 SMITH CLERK 7902 17-DEC-80 224006
20
作为一个Oracle数据库的用户 对于Export和Import两个命令绝对不会感到陌生 因为这二者正是我们经常用于数据备份和恢复的工具 但在使用这两个命令过程中所发生的Oracle字符集问题 常给一些Oracle使用者带来不必要的麻烦和不必要的数据损失 本文将就Export和Import过程中Oracle字符集的转换规律及使用这两个命令的注意事项做一总结 字符集转换的原因 Export Import过程如上图所示 从这个示意图中可以看到有四处关系到字符集 而这四处字符集的不一致恰恰是导致Oracle进行字符集转换的原因 源数据库字符集 Export过程中用户会话字符集 Import过程中用户会话字符集 目标数据库字符集 在Export和Import过程中 如果存在影响字符集转换的四因素不一致 则可能发生Oracle字符集转换 即 在Export过程中 如果源数据库字符集与Export用户会话字符集不一致 会发生字符集转换 并在导出的二进制格式Dmp文件的头部几个字节中存储Export用户会话字符集的ID号 在这个转换过程中可能发生数据的丢失 例 : 如果源数据库使用ZHS GBK 而Export用户会话字符集使用US ASCII 由于ZHS GBK是 位字符集 而US ASCII是 位字符集 这个转换过程中 中文字符在US ASCII中不能够找到对等的字符 所以所有中文字符都会丢失而变成 形式 即这种转换后生成的Dmp文件已经发生了数据丢失 例 : 如果源数据库使用ZHS GBK 而Export用户会话字符集使用ZHS CGB 但由于ZHS GBK字符集是ZHS CGB 字符集的超集 这个过程中绝大部分字符都能够正确转换 只有一些超出ZHS CGB 字符集的字符变为 形式 如果源数据库使用ZHS CGB 字符集 而Export用户会话使用ZHS GBK字符集 则转换过程能够完全转换成功 在Import向目标数据库转换过程中 其字符集发生转换的情况正好与Export过程相反 这里不再详述 在Export导出的Dmp文件中 含有Export用户会话字符集 在Import过程中 首先发生的是Dmp文件字符集(即Export用户会话字符集)向Import用户会话字符集的转换 如果这个转换过程不能正确完成 Import向目标数据库的导入过程也就不能完成 进行字符集的正确转换通常情况下 我们在使用Oracle的Export和Import过程中 并不希望发生字符的转换 但有时这种转换却是必要的 如我们在安装Oracle数据库时 选择ZHS CGB 字符集 由于这种字符集是一种中文小字符集 对于一些汉字不能够正确表示 这需要通过使用ZHS GBK字符集得到解决 此时就要进行字符集的转换 为了确保Export Import过程中 Oracle字符集不发生转换或正确转换 建议最好在进行这个过程前 检查一下源数据库字符集与Export用户会话字符集是否一致 源数据库字符集与目标数据库字符集是否一致 目标数据库字符与Import用户会话字符集是否一致 如果能够保证这四个字符集是一致的 则在Export Import过程中 Oracle字符集就不用发生转换 可用以下办法检查数据库字符集: 通过InitXXXX ora文件进行查看 借助SQL语句查看 SELECT NAME VALUE$ FROM SYS PROPS$ WHERE NAME= NLS_CHARACTERSET 对于Export Import用户会话字符集 在Windows系统中也可以通过注册表中的NLS_LANG进行查看或修改 对于Unix系统则可通过设置用户的环境变量NLS_LANG来查看或修改 特别要注意的是 Oracle数据库字符集通常是在创建时确定 一旦存储用户数据后就不要再修改了 因为其数据都是使用该字符集进行存储的 改换其他字符集之后 原有数据就不能够正确表示了 但如果确实想进行字符集改变 则可通过以下几步来实现 备份数据库后删除原数据(可物理备份 如使用Export 请注意确保字符集不发生转换或数据无损失) 使用Internal用户更新sys props$表中的字符集:Update sys props$ set name= Dest CharSet Where name= NLS_CHARACTERSET ; MIT; 重启数据库 恢复数据 下面字符集之间的转换是可行的 字符集子集向字符集父集转换是可行的 如ZHS CGB 向ZHS GBK转换 而字符集父类向字符集子集进行转换时 会损失部分数据 只包含英文字符数据的双字节字符集也可向单字节字符集转换 如ZHS GBK(English Only)可以向US ASCII正确转换 编码范围相同的单字节字符集之间通常可以进行相互转换 请注意 这里所说的没有数据损失 是指一种字符集A转换成另一种字符集B之后 可以再从字符集B正确转换成字符集A或字符集B能够正确表示字符集A中转换过来的数据 字符集对程序的影响根据一个字符需要多少位字节来表示 可以把字符集分为单字节字符集和多字节字符集 其中 单字节字符集又分为 位字符集和 位字符集 单字节 位编码字符集有US ASCⅡ 单字节 位编码字符集有符合ISO 标准规定的WE ISO P 等 多字节编码又分为固定长度(长度大于或等于 )编码模式和不固定长度编码模式 多字节编码字符集中的ZHS GBK ZHS CGB JA SJIS等是采用两个字节表示一个字符的字符集 又叫双字节字符集 一个英文字母是一个字符 一个中文汉字是几个字符呢?我们知道 一个中文汉字是双字节字符 但它有几个字符与其数据库字符集有关 如果数据库字符集使用单字节US ASCII 则一个中文汉字是二个字符 如果数据库字符集使用双字节字符集ZHS GBK 则一个中文汉字是一个字符 有关这一点可以使用Oracle的函数Substr得到证明 使用US ASCⅡ字符集时: Select substr( 东北大学 ) from dual; 语句执行结果返回 东 使用ZHS GBK字符集时: Select substr( 东北大学 ) from dual; 语句执行结果返回 东北 选择合适的数据库字符集选择数据库字符集时应考虑以下事项 .数据库需要支持什么语言 在为数据库选择字符集时 常会发现几种字符集都适合你当前语言需求 如简体中文就有ZHS GBK和ZHSCGB 等字符集可供选择 应选择哪种?在选择字符集时 应考虑到数据库将来的系统需求 如果知道将来数据库要扩展支持不同的语言 选择一个范围较广的字符集会是一个更好的主意 .系统资源与应用之间的互作用性选择的数据库字符集应保证 *** 作系统与应用之间的无缝连接 如果选择的字符集不是 *** 作系统有效的字符集 则系统就需要在这两者之间做字符转换 在这种字符转换过程中 就有可能发生一些字符丢失现象 从一种字符集A向另一种字符集B转换过程中 A中的字符必须在B中可以找到等价的字符 否则就会以 ? 来代替 从这个意义上说 如果两种字符集编码范围是相同的 则可以相互转换 字符集转换过程中会影响系统性能 因此 应保证客户端和服务器端有相同的字符集以避免字符集转换 也可以提高一定的系统性能 .系统的性能要求不同的数据库字符集对于数据库的性能是有一定影响的 为了得到最好的数据库性能 选择的数据库字符集应避免字符转换 并且要选择对于期望的语言有最高效的编码效率 通常 单字节字符集比多字节字符集有更优的性能表现 在空间需求方面也更小些 .其他一些限制在为数据库选择一个合适的字符集时 应参考Oracle对应版本的相关文档 检查Oracle对于一些字符集的限制 如Oracle 版本中 以下字符集是不能使用的: JA EUCFIXED ZHS GBKFIXED JA DBCSFIXED KO DBCSFIXED ZHS DBCSFIXED JA SJISFIXED ZHT TRISFIXED 综上所述 正确理解Oracle字符集的转换过程 可以使我们避免不必要的麻烦和数据损失 合理利用Oracle字符集的转换过程 也可以帮助我们正确地从一种字符集转换到另一种字符集 以满足我们各种不同的应用需求 lishixinzhi/Article/program/Oracle/201311/17956
二进制不能直接转化,blob可能存放的是普通文件,比如,txt,等,也可以存储纯文本(当然这种情况下就没必要用blob了), 需要通过外部程序进行处理,使用blob是不得已的情况下才用的,比如要存储文件,因为有时候会造成很大的不方便,比如使用dblink就不能查询blob字段,这点要注意
以上就是关于oracle 数据类型全部的内容,包括:oracle 数据类型、linux下编写以个shell脚本,实现对oracle数据库抽取指定条件的数据并且保存在一个文本文件中。、Oracle在数据转储时的字符集问题等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)