- 前言
- 一、Elasticsearch是什么?
- 二、基本概念
- 2.1 索引(indices)
- 2.2 类型(type)
- 2.3 文档(document)
- 2.4 字段(field)
- 三、集群基础概念
- 3.1 cluster (集群)
- 3.2 shards (分片)
- 3.3 replicas(副本)
- 总结
前言
Elasticsearch 是一个实时的分布式搜索分析引擎,它能让你以前所未有的速度和规模,去探索你的数据。 它被用作全文检索、结构化搜索、分析以及这三个功能的组合
以下是本篇文章正文内容,主要介绍Elasticsearch的一些基本概念和用法
一、Elasticsearch是什么?Elasticsearch 是一个开源的搜索引擎,建立在一个全文搜索引擎库 Apache Lucene™ 基础之上。 Lucene 可以说是当下最先进、高性能、全功能的搜索引擎库—无论是开源还是私有。
Elasticsearch 也是使用 Java 编写的,它的内部使用 Lucene 做索引与搜索。 它提供一套简单的 RESTful API 隐藏了 Lucene 的复杂性,使全文检索变得简单。
二、基本概念 2.1 索引(indices)indices是index的复数,代表许多的索引。index类似于传统关系数据库中的一个数据库 ,是一个存储关系型文档的地方。在一个集群中,可以定义任意多的索引。
2.2 类型(type)类型是模拟mysql中的table概念,一个索引库下可以有不同类型的索引,比如商品索引,订单索引,其数据格式不同。不过这会导致索引库混乱,因此7.0以后的版本移除了这个概念
2.3 文档(document)存入索引库原始的数据。比如每一条商品信息,就是一个文档。相当于数据库里的一行数据
一个文档是一个可被索引的基础信息单元。比如,你可以拥有某一个客户的文档,某一个产品的一个文档,当然,也可以拥有某个订单的一个文档。文档以json格式来表示
文档中的属性。相当于数据库中的列
三、集群基础概念es集群部署图:下面逐一介绍
如上图:cluster代表一个es集群。集群中有三个节点node1、node2、node3。其中master代表node1为主节点。这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的。
es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集群外部来说的,因为从外部来看es集群,在逻辑上是个整体,你与任何一个节点的通信和与整个es集群通信是等价的。
shards代表索引分片,es可以把一个完整的索引分成多个分片,这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上。构成分布式搜索。分片的数量只能在索引创建前指定,并且索引创建后不能更改。解决了数据水平扩展,将数据分布到集群内全部节点上
如上图:P0 和P1代表索引数据分成了两个分片。绿色边框的代表是主分片,灰色边框代表是分片副本
replicas:代表索引副本,es可以设置多个索引的副本。
副本的作用
- 提高系统的容错性,当某个节点某个分片损坏或丢失时可以从副本中恢复。
- 提高es的查询效率,es会自动对搜索请求进行负载均衡。
如上图:P0主分片有两个副本R0(灰色边框)P1主分片有两个副本R1(灰色边框)
总结本文仅仅简单介绍了Elasticsearch的一些基本概念,接下来的会详细介绍Elasticsearch的基本命令和实际使用
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)