elasticsearch 配置
环境信息
- elasticsearch 8.8.2
Elasticsearch 是一个开源的搜索引擎,建立在一个全文搜索引擎库 Apache Lucene [1] 基础之上。 Lucene 可以说是当下最先进、高性能、全功能的搜索引擎库 — 无论是开源还是私有。
但是 Lucene 仅仅只是一个库。为了充分发挥其功能,你需要使用 Java 并将 Lucene 直接集成到应用程序中。 更糟糕的是,您可能需要获得信息检索学位才能了解其工作原理。Lucene 非常 复杂。 [1]
Elasticsearch 也是使用 Java 编写的,它的内部使用 Lucene 做索引与搜索,但是它的目的是使全文检索变得简单, 通过隐藏 Lucene 的复杂性,取而代之的提供一套简单一致的 RESTful API。
然而,Elasticsearch 不仅仅是 Lucene,并且也不仅仅只是一个全文搜索引擎。 它可以被下面这样准确的形容:
- 一个分布式的实时文档存储,每个字段 可以被索引与搜索
- 一个分布式实时分析搜索引擎
- 能胜任上百个服务节点的扩展,并支持 PB 级别的结构化或者非结构化数据
Elasticsearch 将所有的功能打包成一个单独的服务,这样你可以通过程序与它提供的简单的 RESTful API 进行通信, 可以使用自己喜欢的编程语言充当 web 客户端,甚至可以使用命令行(去充当这个客户端)。
Elasticsearch 是 面向文档 的,意味着它存储整个对象或 文档。Elasticsearch 不仅存储文档,而且 索引 每个文档的内容,使之可以被检索。在 Elasticsearch 中,我们对文档进行索引、检索、排序和过滤—而不是对行列数据。这是一种完全不同的思考数据的方式,也是 Elasticsearch 能支持复杂全文检索的原因。 [2]
Elasticsearch 使用 JSON 作为文档的序列化格式 [2]
端口说明
elasticsearch 主要使用以下端口
9200
- elasticsearch 服务的监听端口,客户端访问 9200 和 Elasticsearch 进行通信。9300
- 集群中的节点通过 9300 端口彼此通信,如果这个端口没有开,节点将无法形成一个集群
Elasticsearch 配置文件说明
Elasticsearch 的主要配置文件为,配置文件路径可以用环境变量 ES_PATH_CONF
指定。 [8]
elasticsearch.yml
jvm.options
log4j2.properties
Elasticsearch 已经有了
很好
的默认值,特别是涉及到性能相关的配置或者选项。 如果你有疑问,最好就不要动它。我们已经目睹了数十个因为错误的设置而导致毁灭的集群, 因为它的管理者总认为改动一个配置或者选项就可以带来 100 倍的提升。 [8]
配置文件格式支持 YAML 和 扁平 格式 [8]
YAML 格式示例
path: |
扁平 格式示例
path.data: /var/lib/elasticsearch |
集群及节点名称
Elasticsearch 默认启动的集群名字叫 elasticsearch
。生产环境中建议修改集群名称,防止其他使用默认集群名称的节点意外加入集群 [8]
同样,最好也修改你的节点名字。就像你现在可能发现的那样, Elasticsearch 会在节点启动的时候随机给它指定一个名字。你可能会觉得这很有趣,但是当凌晨 3 点钟的时候, 你还在尝试回忆哪台物理机是 Tagak the Leopard Lord 的时候,你就不觉得有趣了。
更重要的是,这些名字是在启动的时候产生的,每次启动节点, 它都会得到一个新的名字。这会使日志变得很混乱,因为所有节点的名称都是不断变化的。 [8]
cluster.name: elasticsearch |
网络配置
监听接口相关配置
多网卡情况下,建议指定 IP 地址,以防止集群使用网络不通的 IP。# |