Elasticsearch 批量添加数据
首先我们先构造一个 json文件,内容参考如下(批量请求必须通过换行符[\n]终止):
在json文件所在文件夹执行以下命令:
插入数据的时候他会有一段时间去执行,你需要立即让他去执行添加
1.添加字段
备注:
test_idx: 索引名称
test: 索引中 mappings 的下一级对象
bookNum: 需要添加的属性
obj1: 索引中的子对象
响应如下才能说明新增成功
2.给新增的字段增加默认值
scroll查询用于有效的从Elasticsearch中检索大量文档,而无需支付深度分页带来的开销。Scrolling允许我们初始化搜索将结果从Elasticsearch中按批次分离出来直到没有更多结果。这个有点像传统数据库中的游标。
GET /old_index/_search?scroll=1m
}
1、因为保持scroll打开消耗资源,所以我们需要设置超时时间。这里保持1分钟的连接
2、_doc是最有效的排序顺序。
3、在扫描scan的时候,size是应用到每一个片shard上的,所以每一个批次中文档数量应该是size * number_of_primary_shards
该请求返回一个Base-64编码的_scroll_id。现在我们可以通过_scroll_id用_search/scroll接口获取下个批次的数据。
Bulk API使执行多次索引或者删除 *** 作在一个API中完成。这可以极大的提高索引速度。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)