文本数据库与MYSQL数据库那个比较快比较省资源_随笔

数据库，是经过优化的存储格式，一定比文本文件效率好，因为结构化处理的关系，可以很好地应对如搜索、匹配等 *** 作；

而文本，表面看起来简单，但是，随着量的增加，一旦达到某个量级，几乎就不可用了。

至于CPU，数据库比文本文件的方案更加可控，更安全。

在数据库中当然是可以对001和005使用聚合函数max()进行大小比较的，但是我们必须要留意文本型数值和数字型数值在比较数值大小时，数据库引擎对不同的字段数据类型其比较的结果可能会有所不同！下面举例说明一下：

比如 10和9，按数字比较大小则 10>9，但是如果按文本比较大小则 '10'<'9'，因为两个字串比较大小时是从左边第一个字符开始逐个字符进行比较的，一旦分出高低，比较将立即结束不再进行余下比较。'10'开头为1，'9'开头为9首尾字符即可分出大小，这样文本数字'10'就会小于文本数字'9'。我们再来看看001和005，则不论是按数字类型还是按文本类型比较均为前者小于后者，按数字比较的话自然1小于5，若按字串比较，前两位打成平手到第三个字符时就分出了大小。

数据库中字符和字串比较大小的排序规则基本上与我们日常使用的字词典里的排序规则相互吻合，两个字符或字串根据它们在字典中的排序位置我们通常不必依赖电脑运算就可以判断出谁大谁小。

现在我们实测一下使用聚合函数Max()对比文本数据类型字段和数字类型字段的比较结果，以下是SQL实验代码：

drop table if exists t2

-- 创建测试表t2含文本数据型“数字”字段和数字类型字段

create table t2(id int auto_increment primary key,

charNum varchar(10),digitNum int)

-- 插入测试数据

insert into t2(charNum,digitNum) values

('001',1),('005',5),('0010',10)

-- 查看待测数据

select * from t2

-- 直接选出文本“数字”字段中的最大值和数字字段中的最大值

select max(charNum) as maxCharNum,

max(digitNum) as maxDigitNum from t2

-- 将文本“数字”字段转换为数字类型后再选出其最大值，以及直接选出数字字段最大值

select max(convert(charNum,signed)) as maxConvertCharNum,

max(digitNum) as maxDigitNum from t2

测试截图：

待测数据：

直接对文本和数字两种数据类型字段使用Max()函数的返回结果对比：

我们可以看到直接对文本数据类型字段使用Max函数选出的最大值是“005”而非“0010”

下面是将文本数据类型数字转换为数字数据类型后才使用Max函数的对比结果：

我们可以看到对文本类型字段使用Max函数的最大值已经跟数字数据类型字段的最大值一样了，都是10。

总结：

直接对字符型数据类型字段使用聚合函数Max()、Min()所返回的极值将遵循一般字（词）典对字(词）里设定的排序规则，所选出的最大（小）值不一定是数字意义上的极值，如果需要得出严格数字意义上的极值就必须先进行类型转换，否则得出的结果可能会与期望值有出入。

正则表达式的作用是匹配文本，将一个模式与一个文本串进行比较，MySQL用WHERE子句对正则表达式提供初步的支持，允许指定正则表达式，过滤SELECT检索出来的数据，但是其实MySQL支持的只是正则表达式的一小部分；

通过实验的结果我发现LIKE是严格遵守整个列值进行匹配，而REGEXP只需要列值的部分包含表达式即可；通俗点讲就是，LIKE后面跟的字符位数和列值完全一致，但是REGEXP后跟的字符位数只需要小于或等于即可匹配；

默认情况下LIKE和REGEXP匹配是不区分大小写的，如果要区分大小写需要使用关键字BINARY；

[1-9]和[123456789]等价，字母也可以[a-z]，也可以是非完整的比如[1-3][6-9]

正则表达式中出现过的特殊字符比如.[]|-等等，出现在所取值中，应该使用\进行转义显示；

有一些已经定义好的mysql内部，可以直接使用的类；

表9-2 字符类

类说明

[:alnum:] 任意字母和数字（同[a-zA-Z0-9]）

[:alpha:] 任意字符（同[a-zA-Z]）

[:blank:] 空格和制表（同[\t]）

[:cntrl:] ASCII控制字符（ASCII 0到31和127）

[:digit:] 任意数字（同[0-9]）

[:graph:] 与[:print:]相同，但不包括空格

[:lower:] 任意小写字母（同[a-z]）

[:print:] 任意可打印字符

[:punct:] 既不在[:alnum:]又不在[:cntrl:]中的任意字符

[:space:] 包括空格在内的任意空白字符（同[\f\n\r\t\v]）

[:upper:] 任意大写字母（同[A-Z]）

[:xdigit:] 任意十六进制数字（同[a-fA-F0-9]）

表9-3 重复元字符

控制匹配的字符出现次数

元字符说明

* 0个或多个匹配

+ 1个或多个匹配（等于{1,}）

? 0个或1个匹配（等于{0,1}）

{n} 指定数目的匹配

{n,} 不少于指定数目的匹配

{n,m} 匹配数目的范围（m不超过255）

前面使用的REGEXP都是匹配列的任意位置，如果只想匹配特殊位置，需要使用定位符；

定位元字符

元字符说明

^ 文本的开始

$ 文本的结尾

[[:<:]] 词的开始

[[:>:]] 词的结尾

前提是不选择库和表的时候，否则会报错；

如果结果为真则返回1，否则返回0；

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/7430853.html

文本数据库与MYSQL数据库那个比较快比较省资源

发表评论

评论列表（0条）