阿里云Elasticsearch实例常见问题_检索分析服务 Elasticsearch版(ES)-阿里云帮助中心

购买ES实例时选错配置，如何处理？

当您购买ES实例后，发现所选的配置不符合预期时，可以参考下表，匹配您的配置信息，选择合适的解决方案。

配置	解决方案
付费模式	如果您购买的是按量付费的实例，可转换为包年包月，详情请参见按量付费转包年包月。如果您购买的是包年包月的实例，可转换为按量付费，详情请参见包年包月转按量付费。
版本	实例需要满足以下任意一种情况，才支持进行版本变更：购买的实例版本为5.5.3，需要变更版本为5.6.16。购买的实例版本为5.6.16，需要变更版本为6.3.2。购买的实例版本为6.3.2，需要变更版本为6.7.0。实例版本升级，详情请参见升级版本。不满足上述情况的版本变更，建议退订后重新购买。
地域	不支持变更，建议退订后重新购买。
可用区	可迁移可用区，详情请参见迁移可用区节点。
可用区数量	不支持变更，建议退订后重新购买。
实例规格	支持变更，详情请参见升配集群和降配集群。
存储类型	支持变更，详情请参见升配集群和降配集群。
云盘加密	不支持变更，建议退订后重新购买。
单节点存储空间	支持变更，详情请参见升配集群。
数据节点数量	支持变更，详情请参见升配集群和降配集群。
网络类型、专有网络、虚拟交换机	不支持变更，建议退订后重新购买。
登录名	默认的管理员账号为elastic，不支持更改。您也可以在Kibana中创建用户，并为该用户授予对应的权限，详情请参见通过Elasticsearch X-Pack角色管理实现用户权限管控。
登录密码	支持变更，详情请参见重置实例访问密码。

购买页版本	具体版本
8.5	8.5.1
7.16	7.16.2
7.10	7.10.0
7.7	7.7.1
6.8	6.8.6
6.7	6.7.0
6.3	6.3.2
5.6	5.6.16
5.5	5.5.3

PUT /_cluster/settings
   "transient": {
      "cluster": {
        "max_shards_per_node":10000
}

可能原因	解决方案
插件问题导致节点无法启动	删除对应插件。
磁盘使用率太高导致shard无法分配	删除索引或者将索引副本数暂时设置为0。
集群参数设置问题导致shard无法分配	通过 `GET /_cluster/allocation/explain?pretty` 命令查看分片未分配的原因，根据具体原因进行处理。
副本数大于节点数	重新设置副本数。
集群规格过小，出现OOM（Out Of Memory）	升配集群。

```
PUT test/_settings
  "index" : {
    "number_of_replicas":"0"
}                                
```

常见原因	解决方案
负载不均导致集群资源不足。	建议您优化分片负载，调整主+副分片为集群数据节点的整数倍，详细信息请参见 shard分配不均，如何调整？。
集群中包含无用的索引数据。	建议定时清理无用的索引数据，尤其是以.monitor开头的索引监控数据，具体操作请参见配置Monitoring监控日志。
分片未分配。	通过 `GET /_cluster/allocation/explain?pretty` 命令查看分片未分配的原因，根据具体原因进行处理。处理后，可通过 `POST /_cluster/reroute?retry_failed=true` 命令，重新分配分片。
缓存导致资源占用。	建议使用 `POST /<索引名>/_cache/clear?fielddata=true` 命令清理缓存。
在进行升配等集群变更操作。	建议中断当前变更，在升配页面选择强制变更，具体操作请参见升配集群。
实例规格较低资源不足，例如1核2 GiB、2核4 GiB等规格。	建议升配集群，具体操作请参见升配集群。
磁盘水位超过85% （通过高级监控或 `GET _cat/allocation?v` 命令查看磁盘水位）	建议删除不需要的历史数据或扩磁盘，详细信息请参见集群磁盘使用率过高和read_only问题的排查与处理方法。

常见原因	解决方案
高级监控显示写入或查询QPS增加导致CPU增加。	降低并发写入量、降低写入查询QPS或扩容集群规格，建议您结合生产环境进行压测，选择合适的规格。
索引缓存占用资源。	建议使用 `POST /索引名/_cache/clear?fielddata=true` 命令，清理缓存。
集群规格太低。	建议升配集群，具体操作请参见升配集群。
单节点CPU高，负载不均。	优化分片负载，设置主+副分片为集群数据节点的整数倍，详细信息请参见 shard分配不均，如何调整？。

常见原因	解决方案
集群缓存占用内存。	短期内可以通过 `POST /索引名/_cache/clear?fielddata=true` 命令清理缓存。如果长期内存占比过高，建议及时升配集群，具体操作请参见升配集群。如果内存周期性升高但未报警，可能是由于业务波动或ES内存回收，属于正常现象。
查询写入过高。	建议停止读写后安装限流插件，并开启集群限流，具体操作请参见使用集群限流插件（aliyun-qos）。
无用索引占用内存。	删除无用的索引释放资源，尤其是以 .monitoring-* 为前缀的监控索引，可设置其保留周期，具体操作请参见配置Monitoring监控日志。
单节点内存高，分片不均。	优化分片负载，设置主+副分片为集群数据节点的整数倍，详细信息请参见 shard分配不均，如何调整？。
异常查询，例如业务侧触发的一串长特殊字符。	通过 `GET _cat/tasks?v` 命令获取耗时查询任务ID，并通过 `GET _tasks?detailed=true&actions=read/search` 命令获取详细的查询语句并保存分析。您也可以通过 task cancel API 或重启集群（负载高的节点）快速取消查询。

常见原因	解决方案
集群分片负载不均。	建议您优化分片负载，调整主+副分片为集群数据节点的整数倍，详细信息请参见 shard分配不均，如何调整？。
集群资源不足。	如果存在agg、term、脚本和模糊查询等消耗性能较大的操作，建议您优化操作命令或者升配集群。升配集群的具体操作请参见升配集群。

PUT /my_index/_settings  
  "index": {  
    "max_result_window": 50000  
}

GET _search
   "query": {
   "match_all": {}
}

可能原因

解决方案

集群资源不足。

集群在缩容后，磁盘、内存、CPU等资源不足，不足以承担当前系统数据或者负载。

使用 GET _cat/indices?v 命令，检查磁盘等资源是否可以在安全阈值内承担当前的数据量和请求量。如果不满足要求，需要升配集群。

shard分配异常。

按照Lucene原理，对于任意一个数据节点中同一个索引的副本，Elasticsearch不会把2个或者2个以上的副本同时迁移到同一个数据节点中。这会导致缩容后集群中索引的副本数可能大于等于数据节点数，从而导致shard分配异常。

使用 GET _cat/indices?v 命令，查看集群中索引的副本数是否小于缩容后的节点数。如果不满足，需要调整副本数，详情请参见索引模板。例如，使用索引模板设置副本数为2，示例代码如下。

PUT _template/template_1
  "template": "*",
  "settings": {
    "number_of_replicas": 2
}

GET .security/_settings

{
  ".security-6" : {
    "settings" : {
      "index" : {
        "number_of_shards" : "1",
        "auto_expand_replicas" : "0-all",
        "provided_name" : ".security-6",
        "format" : "6",
        "creation_date" : "1555142250367",
        "priority" : "1000",
        "number_of_replicas" : "9",
        "uuid" : "9t2hotc7S5OpPuKEIJ****",
        "version" : {
          "created" : "6070099"
}

- ```
PUT .security/_settings
  "index" : {
    "auto_expand_replicas" : "0-1"
}
```
- ```
PUT .security/_settings
  "index" : {
    "auto_expand_replicas" : "false",
    "number_of_replicas" : "1"
}
```

POST /<索引名>/_cache/clear?fielddata=true

```
POST /_cache/clear
```

分词类型	使用方式	功能描述	支持上传的文件类型	分词器或分析器
同义词	在集群配置模块，上传同义词文件后使用。	在文件中写入几个同义词，查询其中一个，其他的也会显示。	UTF-8编码的TXT文件	自定义
IK分词	analysis-ik插件方式。	根据 main.dic 文件，对一段话进行拆分。查询时，只要查询的内容中包含了拆分后的词，查询结果中就会显示该段话。同时还包含了停用词 stop.dic ，拆分后， stop.dic 文件中包含的词会被过滤掉。对应的词库可以在官方文档中查看。	UTF-8编码的DIC文件	分词器： ik_smart ik_max_word
AliNLP分词	analysis-aliws插件方式。	与IK分词大致相同，但不包含单独的停用词文件。停用词集成在主分词词库： aliws_ext_dict.txt 文件中，且词库不对外开放。目前不支持自定义停用词。	文件名必须为：aliws_ext_dict.txt，UTF-8编码	分析器：aliws（不会截取虚词、虚词短语、符号）分词器：aliws_tokenizer

POST /_snapshot/aliyun_snapshot_from_instanceId/es-cn-instanceId_datetime/_restore
    "indices": "myIndex",
    "settings": {
    "max_restore_bytes_per_sec" : "150mb" 
}

数值	含义
0.00	集群状态正常。
1.00	集群处于亚健康状态。当前集群中某个或某几个索引的副本分片丢失，不影响继续使用。
2.00	集群状态异常。当前集群中某个或某几个索引的主分片丢失（unassigned），影响集群正常使用，需要尽快修复。

可能原因	解决方案
公网访问不通	在通过公网域名访问ES的场景下，请按照以下方式排查解决：确保公网访问白名单配置正确，配置方法请参见配置实例公网或私网访问白名单。检查访问连通性，确保ping和telnet要访问的域名是连通的，然后使用curl命令访问ES，详细信息请参见通过curl命令访问与管理Elasticsearch 。
私网访问不通	在通过私网域名访问ES的场景下，请按照以下方式排查解决：确保客户端与待访问的ES实例在同一专有网络下。您可以通过 `ping <ES私网地址>` 进行验证。确保curl命令使用正确，详细信息请参见通过curl命令访问与管理Elasticsearch 。
集群自身状况不佳	在网络都连通的情况下，出现无法访问ES，请按照以下方式排查集群自身状况，根据具体情况自行解决：通过 `GET _cat/health?v` 查看集群健康状态，是否有出现节点失联、shard未分配等情况。通过监控查看集群负载，即查看CPU、JVM、磁盘使用率等是否出现瓶颈。具体操作请参见指标含义与异常处理建议。通过日志查看是否出现熔断、disconnected、节点removed等情况。具体操作请参见查询日志。

open-n/Applications/Google\Chrome.app/--args--disable-web-security--user-data-dir=新建的空文件夹路径

购买ES实例时选错配置，如何处理？

ES购买页的版本具体对应的是哪个版本？

购买ES实例时，专有网络为空，如何处理？

购买ES实例时，已拥有对应的专有网络，但无法选择虚拟交换机或虚拟交换机为空，报错vSwitch: may not be empty，如何解决？

已购买的实例退订后重新购买，实例的访问地址会变吗？

如何释放ES实例？

ES实例停止服务后多久被释放？

我可以购买单机版的ES实例吗？

购买实例时，资源已经售罄怎么办？

为什么建议还在使用存量1核2 GiB规格的用户尽快升级规格？

我能免费试用阿里云ES实例吗？

购买ES后一直在创建中，如何处理？

ES集群创建完成后，还需要单独购买Kibana吗？

为什么找不到已创建的实例？

购买ES实例时，什么情况下需要购买专有主节点和协调节点？

购买ES实例时，输入密码的默认账号是什么？

ES支持版本升级或降级吗？

ES支持通过SSH登录集群修改配置吗？

6.7版本的Logstash和6.3版本的ES能够兼容吗？

Quick BI支持ES数据源吗？

ES支持评分插件吗？

ES支持LDAP功能吗？

ES有Java SDK吗？

ES实例的内核版本在哪里查看？

阿里云ES支持本地部署吗？

ES在使用过程中，什么情况下可以使用强制重启功能，使用该功能后会有什么影响？

如何确认ES的Log4j2漏洞已修复？

修复Log4j2漏洞需要升级ES版本吗？

如何实现跨地域ES实例内网互通？

如何在Elasticsearch集群间迁移数据？

开启HTTPS协议是否需要购买协调节点？

ES单节点最大支持多少分片？

以.monitoring-es开头的索引是怎么生成的？作用是什么？

ES数据盘开启云盘加密，使用的加密算法是什么?

阿里云ES服务是否支持9300端口？

ES冷数据如何归档到OSS？

如何将MongoDB数据同步至阿里云ES？

重启ES实例或节点需要多久？

打开或关闭ES实例的公网访问时，会触发实例重启吗？

修改集群访问密码，会触发集群重启吗？

索引没有副本，是否会影响集群重启？

如何重启角色节点（例如Kibana节点）或单个节点？

重启实例卡住了怎么办？

ES实例能设置定期重启节点吗？

使用ES实例时，一部分节点的CPU和负载正常，另一部分处于空闲状态，如何处理？

ES集群状态yellow，如何处理？

ES集群负载高导致状态red，如何处理？

通过监控查看到或收到集群报警，集群CPU占比过高，如何处理？

ES磁盘使用率过高，如何处理？

通过监控查看到或收到集群报警，ES内存占比过高，如何处理？

shard分配不均，如何调整？

集群负载高，且主日志报错：java.lang.StackOverflowError for the entire cluster，如何处理？

fielddata占用高是什么原因？

如何查询JVM配置实际分配了多少内存？

如何调整队列大小？

如何查询或导出指定时间段内的数据？

ES使用批量插入操作是否有数量限制？

Elasticsearch查询结果与实际存在时间差，如何处理？

ES集群查询较长时间后返回结果，或不返回结果，如何处理？

集群写入报错Data too large... which is larger than the limit of，如何处理？

ES支持批量删除索引吗？

新建索引时会偶现索引UUID冲突报错（index uuid conflicted ），索引文档写不进去，怎么办？

如何修改index.max_result_window（分页查询时查询的最大文档数量）？

ES更新数据时报错：Rejecting mapping update to [] as the final mapping would have more than 1 type，如何处理？

如何查询索引中文档的详细内容？

使用ES前，如何合理规划集群的资源和规格以及shard的大小和数量？

如何查看ES实例的配置参数？

变更集群配置会影响ES服务吗？

变更节点数后，集群会自动重新规划分片吗？

ES实例支持变更云盘类型吗？

ES支持将其他类型的节点变为冷数据节点吗？

升级了实例规格后，可以降低配置吗，如何操作？

业务量临时突增，如何变更集群配置，来保证业务正常进行？

升配集群时，提示UpgradeVersionMustFromConsole如何处理？

升级ES版本需要多长时间？

升级ES版本会影响集群服务吗？

升配集群报错或超时，如何处理？

集群无法变配，如何处理？

是否可以在集群的YML文件配置中，调整http.max_content_length和discovery.zen.ping_timeout值？

我可以切换ES实例的VPC吗？