如何通过Logstash将自建Elasticsearch数据全量或增量迁移至阿里云_检索分析服务 Elasticsearch版-阿里云帮助中心

当您需要将自建Elasticsearch中的全量或增量数据迁移至阿里云Elasticsearch时，可通过在ECS中自建Logstash，并通过Logstash的管道配置功能实现。本文为您介绍具体的实现方法。

背景信息

本文中数据迁移的流程如下。数据架构

本文在阿里云ECS上部署自建Logstash，该Logstash所在的ECS需要与阿里云Elasticsearch集群在同一专有网络下，同时该Logstash需要能够同时访问源Elasticsearch集群（自建）和目标Elasticsearch集群（阿里云）。
数据迁移可以全量迁移或增量迁移。如果业务侧时刻存在写入更新，首次迁移时，需先全量迁移，再通过时间标识字段（或其他可标识增量的字段）进行增量迁移，否则迁移后新数据极易被旧数据覆盖。如果已有全量数据，可以只通过标识字段实现增量数据迁移。

创建阿里云Elasticsearch实例。

具体操作请参见创建阿里云Elasticsearch实例。本文使用的测试环境如下。


环境项	环境信息
地域	华东1（杭州）。
版本	通用商业版7.10.0。
实例规格配置	3个可用区、3个数据节点、单节点4核CPU、16 GB内存、100 GB ESSD云盘。

创建ECS实例，用于部署自建Elasticsearch、自建Kibana和自建Logstash。

具体操作请参见自定义购买实例。本文使用的测试环境如下。


环境项	环境信息
地域	华东1（杭州）。
实例规格	4 vCPU 16 GiB内存。
镜像	公共镜像、CentOS、7.9 64位。
存储	系统盘、ESSD云盘、100 GiB。
网络	与阿里云Elasticsearch相同的专有网络，选中分配公网IPv4地址，并按使用流量计费，带宽峰值为100 Mbps。
安全组	入方向添加5601端口（即Kibana端口），在授权对象中添加您客户端的IP地址。

部署自建Elasticsearch。
本文使用的自建Elasticsearch版本为7.6.2，1个数据节点，具体操作步骤如下：
1. 连接ECS服务器。
  具体操作请参见通过密码或密钥认证登录Linux实例。
2. 使用root用户权限创建elastic用户。
```
useradd elastic
passwd <your_password>
```
3. 将root用户切换为elastic用户。
```
su -l elastic
```
4. 下载Elasticsearch软件安装包并解压缩。
```
sudo wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.6.2-linux-x86_64.tar.gz
sudo tar -zvxf elasticsearch-7.6.2-linux-x86_64.tar.gz
```
5. 启动Elasticsearch。
  进入Elasticsearch的安装目录下，启动服务。
```
sudo cd elasticsearch-7.6.2
./bin/elasticsearch -d
```
6. 验证Elasticsearch服务是否正常运行。
```
cd ~ 
curl localhost:9200
```
  正常情况下，返回结果中会显示Elasticsearch版本号和 "You Know, for Search" 。
部署自建Kibana，并准备测试数据。
本文使用的自建Kibana版本为7.6.2，1个数据节点，具体操作步骤如下：
1. 连接ECS服务器。
  具体操作请参见通过密码或密钥认证登录Linux实例。