Elasticsearch 增加字段,并设置默认值

Elasticsearch 增加字段,并设置默认值,第1张

1.添加字段

备注:

test_idx: 索引名称

test: 索引中 mappings 的下一级对象

bookNum: 需要添加的属性

obj1: 索引中的子对象

响应如下才能说明新增成功

2.给新增的字段增加默认值

需求如下:在Blog中保存着一串标签,标签名由用户自定义,如TagSex,其值也是可以自由输入的字符串,现需要根据这个动态的标签名和值筛选出这一篇Blog。

你可能使用Mysql实现一个类似Elasticsearch倒排索引一样的关联tag和blog的关联表, 但如果还需要支持其他条件的筛选+排序那想一想都觉得复杂.

那我们换成Elasticsearch来实现吧.

索引(类似mysql的表)的Mapping(类似mysql的字段)如下

其他字段就不用多说, 我们来关注tags字段, tags类型是 Object 类型, 其可以存放任意字段.

多个tag就可以存放在这个Object里面:

或是还可以支持像这样的多个value:

在搜索时, 直接使用普通的query语句即可:

当然, 事情没这么简单, 你还需要考虑这几个问题:

下面的方案2就会解决key太多的问题,不过你觉得方案1也可行的话,我们就继续来解决第二个问题:如何将动态添加的字段类型固定为keyword?

当动态添加字段的时候Elasticsearch默认会自动推断类型, 如string就会使用 text 类型存储.

如果需要修改这个逻辑就需要使用到 dynamic templates .

在这个案例中, 我们需要对动态添加的tags字段进行精确搜索, 而不是全文搜索, 所以需要使用到keyword类型, 那么就可以这样写dynamic_templates:

现在动态的向tags对象里添加字段都将作为keyword类型存储。

key的多少会不会影响ES的性能笔者也没找到资料,抱歉也太多时间去验证,有兴趣的可以自己试验一下,不过猜测这对ES的性能影响很小,但如果你觉得太多的key不美观或者担心性能,那可以使用另一种方案:

设置tags字段的类型的Array,然后将tag和value拼接起来放在tags里,在搜索时就可以使用 term-query 来查询

document:

如果一个tag有多个值,那么可以这样存储:

{

"id": 1,

"tags": ["tagAbc=blue", "tagAbc=green"]

}

其中 = 作为tagKey和value的分隔符,可根据项目需要而定。

同样在搜索的时候也需要拼接key和value:

query:

这种方案的优点是不会生成太多的key,性能稳定,麻烦的是在存储到ES之前需要先处理一次(不过实际上不算什么问题)。

https://stackoverflow.com/questions/34556585/supporting-query-on-dynamic-columns-in-elastic-search

在学习 ES 文档相关 *** 作之前,我们先学习 ES 中常用的字段类型。

当一个字段的内容需要被全文检索时,可以使用 text 类型,支持长内容的存储,比如检索文章内容、商品信息等。该类型的字段内容在保存时会被分词器分析,并且拆分成多个词项, 然后根据拆分后的词项生成对应的索引,根据关键字检索时可能会将关键字分词,用分好的词从之前生成的索引中去匹配,进而找到对应的文档。对于 text 类型的字段你可能无法通过指定文本精确的检索到。另外需要注意的是, text 类型的字段不能直接用于排序、聚合 *** 作。这种类型的字符串也称做 analyzed 字符串。

keyword 类型适用于结构化的字段,比如手机号、商品id、用户id等,默认最大长度为256。 keyword 类型的字段内容不会被分词器分析、拆分,而是根据原始文本直接生成倒排索引,所以 keyword 类型的字段可以直接通过原始文本精确的检索到。 keyword 类型的字段可用于过滤、排序、聚合 *** 作。这种字符串称做 not-analyzed 字符串。

ES 中的 date 类型默认支持如下两种格式:

如果我们要存储类似 2020-12-01 20:10:15 这种格式的日期就会有问题,我们可以在创建索引时指定字段为 date 类型以及可以匹配的日期格式:

需要注意的是,如果不主动指定字段类型为 date ,ES 默认使用 text 类型去保存日期的值。

boolean 类型就简单了,有 true 、 false 两个值。

一般情况下,如果可以满足需求,则优先使用范围小的类型,来提高效率。

其实在 ES 中并没有数组类型,但我们却可以按数组格式来存储数据,因为 ES 中默认每个字段可以包含多个值,同时要求多个值得类型必须一致。例如可以按照如下方式指定一个字段的值为数组:

这个其实没什么特别的,由于 ES 中以 JSON 格式存储数据,所以一个 JSON 对象中的某个字段值可以是另一个 JSON 对象。

例如我们可以创建索引时定义一个日期范围的字段类型:

添加文档时可以这样指定字段的值:

最后我们通过一个完整的例子梳理一下这些字段类型,首先创建 blog 索引,并指定相关字段的类型:

然后添加一条文档数据:

上边我们只指定了 publishDate 和 reader_age_range 字段的类型,其它的并未指定。其实在添加文档时,ES 也会根据字段的值动态的推断出它的类型,即动态映射,但这样可能出现推断不符合预期的问题,例如前边说过的日期类型,所以你可以根据实际情况选择是否主动指定字段的类型。

再使用如下请求查看一下文档字段的 mapping 信息:

结果如下:

由于我们未指定 title 字段的类型, ES 自动将其映射成了 text 类型,同时还添加了一个类型为 keyword 的字段:

ES 中常用的字段类型就介绍到这里了。其中 text 和 keyword 可能理解起来比较抽象,但也是重点,后边结合具体的例子就好理解了,分词相关的内容后边也会专门介绍。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11272064.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-14
下一篇 2023-05-14

发表评论

登录后才能评论

评论列表(0条)

保存