JSON数组包含一个由逗号分隔的值列表,并包含在 字符[和]字符中:
JSON对象包含一组由逗号分隔的键值对,并包含在字符{和 }字符中,JSON对象中的键必须是字符串:
在JSON数组元素和JSON对象键值中允许嵌套:
在MySQL中,JSON值被写为字符串。MySQL解析在需要JSON值的上下文中使用的任何字符串,如果它作为JSON无效则会产生错误。
1.JSON_ARRAY 生成json数组
JSON_ARRAY(val1,val2,val3...)生成一个包含指定元素的json数组。
2.JSON_OBJECT 生成json对象
JSON_OBJECT(key1,val1,key2,val2...) 生成一个包含指定K-V对的json object。如果有key为NULL或参数个数为奇数,则抛错。
3.JSON_QUOTE 加"号
JSON_QUOTE(json_val) -- 将json_val用"号括起来。
2.插入记录
创建一个表
插入含有json数组的记录
插入含有json对象的记录
路径表达式对于提取JSON文档的一部分或修改JSON文档的函数很有用,以指定该文档中的 *** 作位置。例如,以下查询从JSON文档中提取具有 name 键的成员的值 :
路径语法使用前导 $ 字符来表示正在考虑的JSON文档,可选地后跟选择器,它们连续指示文档的更多特定部分:
如果路径表达式中的未加引号的键名称不合法,则必须引用命名键的路径组件。让我们 $ 参考这个值,且密钥都包含空格,必须引用:
可以使用带有 to 关键字的范围来指定JSON数组的子集。
last关键字被支撑为最后一个元素的阵列中的索引的同义词。表单的表达式可用于相对寻址,也可用于范围定义,如下所示: last - * N *
4.JSON_REMOVE()获取JSON文档和一个或多个指定要从文档中删除的值的路径。返回值是原始文档减去文档中存在的路径选择的值
JSON值可以使用进行比较 =、<、<=、>、>=、<>、!=、<=>
JSON值尚不支持以下比较运算符和函数:BETWEEN、IN()、GREATEST()、LEAST()
以上列出的比较运算符和函数是通过将JSON值转换为本机MySQL数值或字符串数据类型,使它们具有一致的非JSON标量类型。
JSON值的比较发生在两个级别。第一级比较基于比较值的JSON类型。如果类型不同,则比较结果仅由哪种类型具有更高优先级来确定。如果这两个值具有相同的JSON类型,则使用特定于类型的规则进行第二级比较。
NULL->INTEGER, DOUBLE->STRING->OBJECT->ARRAY->BOOLEAN->DATE->TIME->DATETIME->OPAQUE->BIT->BLOB按此顺序优先级依次变大。
对于具有相同优先级的JSON值,比较规则是特定于类型的:
1) BLOB、BIT、OPAQUE
比较两个值 的第一个字节,其中N是较短值中的字节数。如果N两个值的第一个字节相同,则在较长值之前排序较短的值。
2) DATETIME
表示较早时间点的值在表示稍后时间点的值之前排序。如果两个值最初 分别来自MySQL DATETIME 和 TIMESTAMP 类型,则它们相等,如果它们代表相同的时间点。
3)TIME
两个时间值中较小的一个在较大的值之前排序。
4) DATE`
较早的日期是在最近的日期之前订购的。
5) ARRAY
如果两个JSON数组具有相同的长度并且数组中相应位置的值相等,则它们是相等的。如果数组不相等,则它们的顺序由第一个位置中存在差异的元素确定。首先排序在该位置具有较小值的数组。如果较短数组的所有值都等于较长数组中的相应值,则首先排序较短的数组。
8) STRING
字符串在被比较的两个字符串以词法字典序排序 ,其中 N 是较短字符串的长度。如果 N 两个字符串的第一个 字节相同,则认为较短的字符串小于较长的字符串。
创建单个json数组
创建单个对象,并返回该对象
将其他类型的值转换成JSON类型来获取json值
将 json 值作为参数传入,如果值有效,则返回其 json 类型,否则报错
将两个或多个 json 值合并为一个 json 并返回最终值
合并两个或多个 json 值,但不合并重复键的值,如果出现重复键,仅保留最后一个的值
经过函数转换得到的 json 是区分大小写的,原因在于转换后的字符集格式为 utf8mb4 和 utf8mb4_bin ,因为 utf8mb4_bin 是二进制排序规则,所以区分大小写
因为区分大小写,所以 json 中的 null 、 true 和 false 都必须用小写字母编写
直接插入键值对语句和用 JSON_OBJECT 转换成json值存入的差别在于,前者需要双反斜杠转义字符,而后者只需要单反斜杠转义字符
当需要存储的内容如下
使用直接插入的方法时:
使用 JSON_OBJECT 时
案例
因为 $[1] 和 $[2] 计算为非标量值, 所以它们可以用作选择嵌套值的更具体的路径表达式的基础。例子:
结合 JSON_SET``JSON_INSERT``JSON_REPLACE``JSON_REMOVE 的使用
JSON_SET 替换存在的路径的值, 并为不存在的路径添加值
JSON_INSERT 添加新值, 但不替换现有值:
JSON_REPLACE 替换现有值并忽略新值:
JSON_REMOVE 使用一个或多个路径, 这些路径指定要从文档中删除的值。返回值是原始文档减去由文档中存在的路径选择的值:
将外部数据导入(import)数据库是在数据库应用中一个很常见的需求。其实这就是在数据的管理和 *** 作中的ETL (Extract, transform, load)的L (Load)部分,也就是说,将特定结构(structure)或者格式(format)的数据导入某个目的地(比如数据库,这里我们讨论MySQL)。ETL Process
本文要讨论的内容,是如何方便地将多种格式(JSON, Text, XML, CSV)的数据导入MySQL之中。
本文大纲:
将Text文件(包括CSV文件)导入MySQL
将XML文件导入MySQL
将JSON文件导入MySQL
使用MySQL workbench的Table Data Export and Import Wizard进行JSON或CSV文件的导入导出
1. 将Text文件(包括CSV文件)导入MySQL
这里我们的讨论是基于一个假定,Text file和CSV file是有着比较规范的格式的(properly formatted),比如说每行的每个数据域(field)之间是由一个共同的分隔符(比如tab: \t)分隔的。
那么首先,你需要根据你的数据的格式(有哪些域),来设计好数据库的对应的表 (的Schema)。
举个例子,要处理的Text文件或者CSV文件是以\t作为分隔符的,每行有id, name, balance这么三个数据域,那么首先我们需要在数据库中创建这个表:
CREATE TABLE sometable(id INT, name VARCHAR(255), balance DECIMAL(8,4))
创建成功以后就可以导入了。 *** 作方式很简单:
LOAD DATA LOCAL INFILE '你的文件路径(如~/file.csv)' INTO TABLE sometable FIELDS TERMINATED BY '\t' [ENCLOSED BY '"'(可选)] LINES TERMINATED BY '\n' (id, name, balance)
这里要注意的是,我们需要开启local-infile这个MySQL的配置参数,才能够成功导入。究其原因,从MySQL的Manual中可以看到这么一段话:
LOCAL works only if your server and your client both have been configured to permit it. For example, if mysqld was started with --local-infile=0, LOCAL does not work. See Section 6.1.6, “Security Issues with LOAD DATA LOCAL”.
这是MySQL出于安全考虑的默认配置。因此,我们需要在配置文件my.cnf中(以Debian发行版的Linux, 如Ubuntu为例, 即是在/etc/my.cnf中),确保:
local-infile=1
抑或是在命令行启动MySQL时加上--local-infile这一项:
mysql --local-infile -uroot -pyourpwd yourdbname
此外,我们也可以使用MySQL的一个官方导入程序mysqlimport ,这个程序本质上就是为LOAD DATA FILE提供了一个命令行的interface,很容易理解,我们这里就不再详述。
2. 将XML文件导入MySQL
这件事的完成方式,与我们的XML的形式有着很大的关系。
举个例子说,当你的XML数据文件有着很非常规范的格式,比如:
<?xml version="1.0"?>
<row>
<field name="id">1</field>
<field name="name">Free</field>
<field name="balance">2333.3333</field>
</row>
<row>
<field name="id">2</field>
<field name="name">Niki</field>
<field name="balance">1289.2333</field>
</row>
或者
<row column1="value1" column2="value2" .../>
我们就可以很方便使用LOAD XML来导入,这里可以参见MySQL的官方手册--LOAD XML Syntax。
然而我们可能有另外一些需求,比如说,我们可能会想要将XML文件的域映射到不同名字的列(TABLE COLUMN)之中。这里要注意,MySQL v5.0.7以后,MySQL的Stored Procedure中不能再运行LOAD XML INFILE 或者LOAD DATA INFILE。所以转换的程序(procedure)的编写方式与在此之前有所不同。这里,我们需要使用Load_File()和ExtractValue()这两个函数。
以下是一个示例XML文件和程序:
文件:
<?xml version="1.0"?>
<some_list>
<someone id="1" fname="Rob" lname="Gravelle"/>
<someone id="2" fname="Al" lname="Bundy"/>
<someone id="3" fname="Little" lname="Richard"/>
</some_list>
程序:
DELIMITER $$
CREATE DEFINER=`root`@`localhost` PROCEDURE `import_some_xml`(path varchar(255), node varchar(255))
BEGIN
declare xml_content text
declare v_row_index int unsigned default 0
declare v_row_count int unsigned
declare v_xpath_row varchar(255)
set xml_content = load_file(path)
-- calculate the number of row elements.
set v_row_count = extractValue(xml_content, concat('count(', node, ')'))
-- loop through all the row elements
while v_row_index <v_row_count do
set v_row_index = v_row_index + 1
set v_xpath_row = concat(node, '[', v_row_index, ']/@*')
insert into applicants values (
extractValue(xml_content, concat(v_xpath_row, '[1]')),
extractValue(xml_content, concat(v_xpath_row, '[2]')),
extractValue(xml_content, concat(v_xpath_row, '[3]'))
)
end while
END
在MySQL中,使用它进行导入:
call import_some_xml('你的XML文件路径', '/some_list/someone')
程序相当的直白,只要了解一下MySQL的脚本编写即可。
这里提一下DELIMITER $$。我们知道MySQL的命令分隔符默认为分号,然而脚本中很显然是有分号的,但是我们并不希望立即执行,所以我们需要临时更改分隔符。
3. 将JSON文件导入MySQL
如何将JSON文件导入MySQL中,是一个很有趣的话题。JSON是一种现在相当常用的文件结构,所以掌握它的导入具有比较广泛的意义。
很多时候,我们处理的JSON数据是以如下形式出现的:
{"name":"Julia","gender":"female"}
{"name":"Alice","gender":"female"}
{"name":"Bob","gender":"male"}
{"name":"Julian","gender":"male"}
而并不是规整的[{},{},{},{}](一些NoSQL数据库的Export)。
这样的形势对于载入有一个好处:因为每一行是一个JSON Object,所以我们便可以按行处理此文件,而不需要因为JSON的严格结构将整个文件(比如一个许多G的.json文件)全部载入。
方式一 使用common-schema
common-schema是一个应用很广泛的MySQL的框架,它有着很丰富的功能和详细的文档。我们可以使用它的JSON解析的功能。(它还具有JSON转换成XML等等方便的功能)
具体说来,将common-schema导入之后,使用它的extract_json_value函数即可。源码中:
create function extract_json_value(
json_text text charset utf8,
xpath text charset utf8
) returns text charset utf8
该函数接受两个参数,一个是json_text,表示json文件的内容,另一个是xpath,表示数据的结构(这里可以类比XML文件的处理)。很多读者应该知道,XPath是用来对XML中的元素进行定位的,这里也可以作一样的理解。
以本段开始的几行JSON为例,这里common-schema的使用如下例:
select common_schema.extract_json_value(f.event_data,'/name') as name, common_schema.extract_json_value(f.event_data,'/gender') as gender, sum(f.event_count) as event_count from json_event_fact f group by name, gender
关于event_data,我们需要先理解LOAD DATA INFILE是一个event,不同的event type对应不同的event data。这部分知识可以参看Event Data for Specific Event Types
如果感兴趣,可以参看其源码。参看一个受到广泛使用的项目的源码,对于自身成长是很有益的。
当然了,我们也可以像之前处理XML文件导入一样,自己编写程序。这里便不再给出实例程序,有兴趣的读者可以自行编写或者跟笔者交流。
方式二 使用mysqljsonimport
这是Anders Karlsson的一个完成度很高的作品。这一份程序由C写成。它依赖于一个JSON Parser,Jansson。他们都有着比较好的维护和文档,所以使用上体验很好。
mysqljsonimport的下载在SourceForge上。具体使用参照其文档即可。
为了方便不熟悉源码安装的朋友,笔者在这里提一下安装流程和注意事项。
安装命令顺序如下:
$ wget http://sourceforge.net/projects/mysqljson/files/myjsonimport_1.6/mysqljsonimport-1.6.tar.gz
$ tar xvfz mysqljsonimport-1.6.tar.gz
$ cd mysqljsonimport-1.6
$ ./configure –-with-mysql=/xxx/mysql
$ make
$ make check
$ sudo make install
--with-mysql这一步不是必要的,只要你安装的mysql的路径是系统的默认路径。很关键的,而且很容易被不熟悉的朋友忽略的是,这一个C程序要成功编译和运行,是需要MySQL的C API的,所以需要安装的依赖,除了jansson,还有libmysqlclient-dev。
jansson的安装就是简单的源码安装,libmysqlclient-dev则可以使用包管理工具(比如ubuntu中使用apt-get即可;编译和安装前,建议先sudo apt-get update以避免不必要的麻烦)。
导入命令:
$ ./mysqljsonimport –-database test –-table tablename jsonfilename
还有一个parser,作者是Kazuho,感兴趣的读者可以参看一下,他的相关博文是mysql_json - a MySQL UDF for parsing JSON ,github项目是mysql_json。
4. 使用MySQL workbench
Workbench这个工具对于许多不熟悉SQL语言或者命令行的朋友还是很方便和友好的。利用它,可以方便地导入和导出CSV和JSON文件。
具体 *** 作图例参见MySQL官方手册即可:Table Data Export and Import Wizard,这里不再赘述。
文/freenik(简书作者)
原文链接:http://www.jianshu.com/p/d330edb61fe2
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)