Elasticsearch聚合学习之三：范围限定，java基础面试知识题库_随笔

Elasticsearch聚合学习之三：范围限定，java基础面试知识题库环境信息

以下是本次实战的环境信息，请确保您的Elasticsearch可以正常运行：

*** 作系统：Ubuntu 18.04.2 LTS
JDK：1.8.0_191
Elasticsearch：6.7.1
Kibana：6.7.1

实战用的数据依然是一些汽车销售的记录，在第一章有详细的导入步骤，请参考 *** 作，导入后您的es中的数据如下图：

本章概要

本篇聚焦查询范围限定，由以下内容构成：

不做限定时的默认范围；
最简单的查询范围
全局桶
使用过滤器
桶内使用过滤器

不做限定时的默认范围

下面是个普通的聚合请求，将文档按照color字段聚合，由于没有做任何范围限定，因此查询的是所有文档：

GET /cars/transactions/_search

{

“size”:0,

“aggs”:{

“popular_colors”:{

“terms”: {

“field”: “color”

}

下面请求带上了查询条件match_all，匹配所有文档，和前面不带查询条件的请求达到了同样效果：

GET /cars/transactions/_search

{

“size”:0,

“query”: { ------查询条件

“match_all”: {} ------匹配所有文档

“aggs”:{

“popular_colors”:{

“terms”: {

“field”: “color”

}

最简单的查询范围

前面提出了一个问题：福特汽车一共分为几种颜色？这就是最简单的范围限定聚合（限定了汽车品牌），查询DSL如下：

GET /cars/transactions/_search

{

“size”:0,

“query”: { —范围限定的查询

“term”: { —查询类型是精确匹配

“make”: “ford” —查询条件是品牌为福特

}

“aggs”:{ —聚合

“popular_colors”:{ —聚合字段名

“terms”: { —桶类型

“field”: “color” —匹配字段是color

}

返回结果如下，只有福特汽车的聚合数据：

{

“took” : 7,

“timed_out” : false,

“_shards” : {

“total” : 5,

“successful” : 5,

“skipped” : 0,

“failed” : 0

“hits” : {

“total” : 2,

“max_score” : 0.0,

“hits” : [ ]

“aggregations” : { —聚合结果

“popular_colors” : { —聚合字段

“doc_count_error_upper_bound” : 0,

“sum_other_doc_count” : 0,

“buckets” : [ —这个数组的元素是所有的桶

{

“key” : “blue”, —color为blue的文档

“doc_count” : 1 —文档数为1

{

“key” : “green”, —color为blue的文档

“doc_count” : 1 —文档数为1

}

]

}

全局桶

如果想对比福特汽车的销售额和所有汽车的销售额，可以通过全局桶对所有文档做聚合，关键字是global，全局桶的聚合不受范围限定的影响：

GET /cars/transactions/_search

{

“size”: 0,

“query”: { —范围限定的查询

“term”: { —查询类型是精确匹配

“make”: “ford” —查询条件是品牌为福特

}

“aggs”: { —聚合

“ford_sales”: { —聚合字段名

“sum”: { —直接对范围内的所有文档执行metrics，类型是累加

“field”: “price” —选择price字段的值进行累加

}

“all”: { —聚合字段名

“global”: {}, —全局桶关键字，表示忽略前面term查询的范围限定

“aggs”: { —聚合

“all_sales”: { —聚合字段名

“sum”: { —直接对范围内的所有文档执行metrics，类型是累加

“field”: “price” —选择price字段的值进行累加

}

来看看结果：

…

“aggregations” : { —聚合结果

“all” : { —全局桶的聚合结果(te

《一线大厂Java面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》

【docs.qq.com/doc/DSmxTbFJ1cmN1R2dB】完整内容开源分享

rm查询无效)

“doc_count” : 8, —文档总数

“all_sales” : { —聚合字段名

“value” : 212000.0 —总销售额

}

“ford_sales” : { —聚合字段名(term查询限定了范围，只有福特汽车的销售记录)

“value” : 55000.0 —福特汽车销售额

}

不止是query

前面的范围限定用到了query，其实适用于查询的过滤器也能应用在聚合 *** 作中，下面是过滤+聚合的查询，和前面一样，也是统计总销售和和福特汽车的销售额：

GET /cars/transactions/_search

{

“size”: 0,

“query”: {

“bool”: { —布尔查询，里面可以将query和filter组合使用

“filter”: { —本例只用到了filter

“term”: { —精确匹配

“make”: “ford” —匹配福特品牌

}

“aggs”: { —聚合结果

“ford_sales”: { —聚合字段名

“sum”: { —metrics *** 作，累加

“field”: “price” —累加字段是price

}

“all”: { —聚合字段名

“global”: {}, —全局桶关键字，表示忽略范围限定

“aggs”: { —聚合

“all_sales”: { —聚合字段名

“sum”: { —metrics *** 作，累加

“field”: “price” —累加字段是price

}

查询结果如下，和query的一样：

…

“aggregations” : {

“all” : {

“doc_count” : 8,

“all_sales” : {

“value” : 212000.0

}

“ford_sales” : {

“value” : 55000.0

}

注意：虽然query和filter限定范围的结果是一样的，但是filter会忽略评分，并且有可能缓存结果数据，这些都是性能上的优势；

桶内filter

学习桶内filter之前，先看看官方的布尔查询DSL，如下所示，查询JSON对象的内部可以加入filter，对查询结果做过滤：

GET /_search

{

“query”: {

“bool”: {

“must”: [ —布尔查询

{ “match”: { “title”: “Search” }},

{ “match”: { “content”: “Elasticsearch” }}

“filter”: [ —对查询结果做过滤

{ “term”: { “status”: “published” }},

{ “range”: { “publish_date”: { “gte”: “2015-01-01” }}}

]

}

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/5676961.html

Elasticsearch聚合学习之三：范围限定，java基础面试知识题库

发表评论

评论列表（0条）