以下是本次实战的环境信息,请确保您的Elasticsearch可以正常运行:
-
*** 作系统:Ubuntu 18.04.2 LTS
-
JDK:1.8.0_191
-
Elasticsearch:6.7.1
-
Kibana:6.7.1
实战用的数据依然是一些汽车销售的记录,在第一章有详细的导入步骤,请参考 *** 作,导入后您的es中的数据如下图:
本章概要本篇聚焦查询范围限定,由以下内容构成:
-
不做限定时的默认范围;
-
最简单的查询范围
-
全局桶
-
使用过滤器
-
桶内使用过滤器
- 下面是个普通的聚合请求,将文档按照color字段聚合,由于没有做任何范围限定,因此查询的是所有文档:
GET /cars/transactions/_search
{
“size”:0,
“aggs”:{
“popular_colors”:{
“terms”: {
“field”: “color”
}
}
}
}
下面请求带上了查询条件match_all,匹配所有文档,和前面不带查询条件的请求达到了同样效果:
GET /cars/transactions/_search
{
“size”:0,
“query”: { ------查询条件
“match_all”: {} ------匹配所有文档
},
“aggs”:{
“popular_colors”:{
“terms”: {
“field”: “color”
}
}
}
}
最简单的查询范围- 前面提出了一个问题:福特汽车一共分为几种颜色?这就是最简单的范围限定聚合(限定了汽车品牌),查询DSL如下:
GET /cars/transactions/_search
{
“size”:0,
“query”: { —范围限定的查询
“term”: { —查询类型是精确匹配
“make”: “ford” —查询条件是品牌为福特
}
},
“aggs”:{ —聚合
“popular_colors”:{ —聚合字段名
“terms”: { —桶类型
“field”: “color” —匹配字段是color
}
}
}
}
- 返回结果如下,只有福特汽车的聚合数据:
{
“took” : 7,
“timed_out” : false,
“_shards” : {
“total” : 5,
“successful” : 5,
“skipped” : 0,
“failed” : 0
},
“hits” : {
“total” : 2,
“max_score” : 0.0,
“hits” : [ ]
},
“aggregations” : { —聚合结果
“popular_colors” : { —聚合字段
“doc_count_error_upper_bound” : 0,
“sum_other_doc_count” : 0,
“buckets” : [ —这个数组的元素是所有的桶
{
“key” : “blue”, —color为blue的文档
“doc_count” : 1 —文档数为1
},
{
“key” : “green”, —color为blue的文档
“doc_count” : 1 —文档数为1
}
]
}
}
}
全局桶如果想对比福特汽车的销售额和所有汽车的销售额,可以通过全局桶对所有文档做聚合,关键字是global,全局桶的聚合不受范围限定的影响:
GET /cars/transactions/_search
{
“size”: 0,
“query”: { —范围限定的查询
“term”: { —查询类型是精确匹配
“make”: “ford” —查询条件是品牌为福特
}
},
“aggs”: { —聚合
“ford_sales”: { —聚合字段名
“sum”: { —直接对范围内的所有文档执行metrics,类型是累加
“field”: “price” —选择price字段的值进行累加
}
},
“all”: { —聚合字段名
“global”: {}, —全局桶关键字,表示忽略前面term查询的范围限定
“aggs”: { —聚合
“all_sales”: { —聚合字段名
“sum”: { —直接对范围内的所有文档执行metrics,类型是累加
“field”: “price” —选择price字段的值进行累加
}
}
}
}
}
}
来看看结果:
…
“aggregations” : { —聚合结果
“all” : { —全局桶的聚合结果(te
《一线大厂Java面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》
【docs.qq.com/doc/DSmxTbFJ1cmN1R2dB】 完整内容开源分享
rm查询无效)
“doc_count” : 8, —文档总数
“all_sales” : { —聚合字段名
“value” : 212000.0 —总销售额
}
},
“ford_sales” : { —聚合字段名(term查询限定了范围,只有福特汽车的销售记录)
“value” : 55000.0 —福特汽车销售额
}
}
}
不止是query前面的范围限定用到了query,其实适用于查询的过滤器也能应用在聚合 *** 作中,下面是过滤+聚合的查询,和前面一样,也是统计总销售和和福特汽车的销售额:
GET /cars/transactions/_search
{
“size”: 0,
“query”: {
“bool”: { —布尔查询,里面可以将query和filter组合使用
“filter”: { —本例只用到了filter
“term”: { —精确匹配
“make”: “ford” —匹配福特品牌
}
}
}
},
“aggs”: { —聚合结果
“ford_sales”: { —聚合字段名
“sum”: { —metrics *** 作,累加
“field”: “price” —累加字段是price
}
},
“all”: { —聚合字段名
“global”: {}, —全局桶关键字,表示忽略范围限定
“aggs”: { —聚合
“all_sales”: { —聚合字段名
“sum”: { —metrics *** 作,累加
“field”: “price” —累加字段是price
}
}
}
}
}
}
查询结果如下,和query的一样:
…
“aggregations” : {
“all” : {
“doc_count” : 8,
“all_sales” : {
“value” : 212000.0
}
},
“ford_sales” : {
“value” : 55000.0
}
}
}
注意:虽然query和filter限定范围的结果是一样的,但是filter会忽略评分,并且有可能缓存结果数据,这些都是性能上的优势;
桶内filter- 学习桶内filter之前,先看看官方的布尔查询DSL,如下所示,查询JSON对象的内部可以加入filter,对查询结果做过滤:
GET /_search
{
“query”: {
“bool”: {
“must”: [ —布尔查询
{ “match”: { “title”: “Search” }},
{ “match”: { “content”: “Elasticsearch” }}
],
“filter”: [ —对查询结果做过滤
{ “term”: { “status”: “published” }},
{ “range”: { “publish_date”: { “gte”: “2015-01-01” }}}
]
}
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)