具体步骤:
1、使用cmd切换到需要使用的MySQL账户(使用前需配置adb及MySQL的环境变量)
ADB笔记:目标:主要用于数据分析,后端支持BI报表和数据大屏。mysql协议,学习成本低。
特有名词:
表组,对应RDS的schema。
维度表组(系统自带):自带维度概念的表(例如省份表等),可以放到维度表组下
普通表组:一般会把需要关联的普通表放在相同普通表组中,建议这个表组中的所有普通表的一级分区数一致,join性能会有很大提升。
维度表:共享表。
普通表:分区表。默认一级分区,可创建二级分区。
分区:普通表才有,一级分区采用hash算法,单表数据量在60亿以内,推荐。
主键:表必须包含主键。由业务id、一级分区键组成,有些情况业务id与一级分区相同。对于记录量特别大的表,从存储空间和insert性能考虑,一定要减少主键的字段数。
数据库创建完毕后,系统会默认创建一个维度表组,所有维度相关的表,可以放到维度表组下。
特殊字段:timestamptimestampAnalyticDB精确到秒,MySQL支持自定义精度
常用sql连接:
https://help.aliyun.com/document_detail/94859.html?spm=a2c4g.11186623.2.38.22c965313Zwnsd
navicat连接后,无法显示建表语句。
输入导入方式:1、DTS;2、数据集成。
insert插入显示延迟5-10S,可单独提工单修改。
更新数据:AnalyticDB不支持update *** 作,可以通过主键覆盖的方式进行insert *** 作来实现和update同等的功能。
数据导出功能较弱,dump方式到OSS/MaxCompute
推荐权限定义方式:https://help.aliyun.com/document_detail/95546.html?spm=a2c4g.11186623.6.578.702d620fyspxAo
索引&扫描原理
AnalyticDB内部采用列存方式,通过单列高效过滤后,可直接通过内部记录指针扫描其他列值,减少其他列的索引查询开销。
子查询修改为表关联
普通表join普通表,尽量包含分区列join条件,如果不包含则,尽量通过where条件过滤掉多余的数据。
维度表join普通表,没有限制。
默认是全索引,建表成功后,某列删除索引 *** 作,需提工单解决。
二级分区用于删除数据,对于“回溯表”类场景,避免手动删除。
一级分区键选择:
1、分布均匀,避免数据倾斜。park_record_id?
2、建议选择一级分区列的数据类型为tinyint、smallint、int、bigint或者varchar。
3、如果是多个普通表(不包括维度表)JOIN,则选择参与JOIN的列作为分区列。park_record_id?park_id?
4、选择GROUP BY或DISTINCT包含的列作为分区列
5、如果常用的SQL包含某列的等值或IN查询条件,则选择该列作为分区列。以下列子则选择id作为分区列。
select * from table where id=123 and …
select * from table where user in(1, 2,3)
使用场景以管理员使用为主,范围扫描较多,park_id分区优势更大。
历史单条数据,管理员查询较少,可忽略。
用户单条查询,在RDS完成。
多参考设计样例:https://help.aliyun.com/document_detail/97587.html?spm=a2c4g.11186623.6.655.207b43c1yl28Kx
https://help.aliyun.com/document_detail/97620.html?spm=a2c4g.11186623.6.656.5ebb12f55cr9Pf
为满足高QPS,从设计上采用大宽表、冗余字段,并且避免表关联。
场景描述:全量sql,查询频率低,以区域统计查询为主。
最佳实践:区域查询、车场查询读扩大,数据分布均匀+聚集列效果。缺点:
PRIMARY KEY (park_record_id,TS)
PARTITION BY HASH KEY (park_record_id) PARTITION NUM 128
SUBPARTITION BY LIST KEY (TS)
SUBPARTITION OPTIONS (available_partition_num = 300)
CLUSTERED BY (area_id,park_id)
单个AnalyticDB最多表数256
单个表组总表数256
最大一级分区数255
不支持存储过程
是否支持修改表的一级分区数:当前不支持动态修改,只能删表重建。
# SELECT 数据查询(二)
## 对查询结果排序 ORDER BY
ORDER BY 关键字主要用来将查询结果中的数据按照一定的顺序进行排序
1. 语法: - `order by 字段名>[asc|desc]`
- 说明 asc 按照升序排序【默认】, desc 按照降序排序
2. 注意:
- ORDER BY 关键字后可以跟子查询 - 当排序的字段中存在空值时,ORDER BY 会将该空值作为最小值来对待
- 当排序的字段中存在空值时,ORDER BY 会将该空值作为最小值来对待查询数据按字母升序进行排序(A Z),但数据的排序并不仅限于此,还可以使用 ORDER BY 中的 DESC 对查询结果进行降序排序(Z A)。
## 条件查询数据 WHERE
如果需要有条件的从数据表中查询数据,可以使用 WHERE 关键字来指定查询条件。
1. 语法 - `WHERE conditons`
- 带比较运算符和逻辑运算符的查询条件
- 带 BETWEEN AND 关键字的查询条件
- 带 IS NULL 关键字的查询条件
- 带 IN 关键字的查询条件 - 带 LIKE 关键字的查询条件
### 单条件查询
### 多条件查询
在 WHERE 关键词后可以有多个查询条件,这样能够使查询结果更加精确。
多个查询条件时用逻辑运算符 `AND(&&)、OR(||)` 或 `XOR` 隔开。
1. AND :记录 满足所有条件,才会被查询出结果
2. OR : 记录 满足任意一个查询条件,才会被查询出结果
3. XOR : 记录 满足其中一个条件,并且不满足另外一个条件是,才会被查询出结果
>OR、AND 和 XOR 可以一起使用,但是在使用时要注意运算符的优先级。
http://c.biancheng.net/view/7399.html
### 模糊查询 LIKE [新知识 4me]
1. 语法:
- `[NOT]LIKE`
- NOT :可选参数,字段中的内容与指定的字符串不匹配时满足条件。
- 字符串:指定用来匹配的字符串。“字符串”可以是一个很完整的字符串,也可以包含通配符。
LIKE 关键字支持百分号` % `和下划线` _ `通配符。
#### 带有“%”通配符的查询
“%”是 MySQL 中最常用的通配符,它能代表 **任何长度的字符串** ,字符串的长度可以为 0。
例如,a%b表示以字母 a 开头,以字母 b 结尾的任意长度的字符串。该字符串可以代表 ab、acb、accb、accrb 等字符串。
注意:匹配的字符串必须加 *单引号* 或 *双引号* 。
#### 带有“_”通配符的查询
“_”只能代表单个字符,字符的长度不能为 0。 例如,a_b可以代表 acb、adb、aub 等字符串。
#### LIKE 区分大小写(默认不区分)
默认情况下,LIKE 关键字匹配字符的时候是 不 区分大小写的。如果需要 可以加入`BINARY`关键字
#### 使用通配符的注意事项和技巧
1. 注意事项:
- 注意大小写。MySQL 默认是不区分大小写的。如果区分大小写,像“Tom”这样的数据就不能被“t%”所匹配到。
- 注意尾部的空格 尾部空格会干扰通配符的匹配。例如,“T% ”就不能匹配到“Tom”。
- 注意NULL。”%”通配符可以到匹配任意字符,但是不能匹配 NULL。也就是说 “%”匹配不到 tb_students_info 数据表中值为 NULL 的记录。
2. 使用技巧:
- 不要过度使用通配符,如果其它 *** 作符能达到相同的目的,应该使用其它 *** 作符。因为 MySQL 对通配符的处理一般会比其他 *** 作符花费更长的时间。
- 在确定使用通配符后,除非绝对有必要,否则不要把它们用在字符串的开始处。把通配符置于搜索模式的开始处,搜索起来是最慢的。
- 仔细注意通配符的位置。如果放错地方,可能不会返回想要的数据。 ** *拓展* ** 如果查询内容中包含通配符,可以使用“”转义符。
*** 2021-12-23 今天先学到这里 明天继续 MySql 的查询 学习
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)