我在AWS EC2上尝试在线添加Elasticsearch集群配置的节点

1 年 ago

新, 韵

3 minutes

不久之前，我已经对标题所提到的问题进行了回应，但是我忘记将其写成文章。因此，我想在我还记得的范围内与大家分享我所做的内容。
可能会有一些我忘记写入的内容，请谅解。

请阅读参考文章。

amazon web services – elasticsearch-cloud-aws plugin not working with IAM role – Stack Overflow

需要的历史事件

そのため、担当システムでのアクセスが重くなるなどの障害が起き始めていたため、スケールする必要が出てきた

考察实现方式

できません。理由は、既存ノードがクラスタ構成となるように設定されて起動しているため、全く同じデータが入ってる状態でAMIから起動すると、重複データが入った状態になるためです。
そのため、同じスペックのデータやインデックスの存在しないノードを作成する必要があった。

せっかくなので、Multi-AZ構成にしたいけど、そのままやればいけるの？

それだと、下記の問題が起きてしまい、良い状態とはなりません。(参考URL3つ目の引用)

Elasticsearchは受け付けた検索要求をすべてのシャードへ問い合わせる仕組みのため、マルチAZ配置にするとAZ間の通信が発生してしまうので、どうしてもパフォーマンスが落ちてしまいます。

そのため、参考URL3つ目の方がやられている通り、「Shard Allocation Awareness」という方法で解決しました。

处理步骤

起動後、インデックス、データ全てを削除するため、下記のコマンドを実行。

$ curl -XDELETE 'http://localhost:9200/*'
{"acknowledged":true}

Elasticsearchの設定ファイルを修正。

# ap-northeast-1a 側のノード
cluster.name: XXXXX-XXXX-cluster
cluster.routing.allocation.awareness.attributes: aws_availability_zone
cluster.routing.allocation.awareness.force.aws_availability_zone.values: ap-northeast-1a,ap-northeast-1c
cloud.node.auto_attributes: true

node.zone: ap-northeast-1a

discovery.zen.ping.multicast.enabled: false
discovery.type: ec2
cloud.aws.region: ap-northeast-1

# ap-northeast-1c
cluster.name: XXXXX-XXXX-cluster
cluster.routing.allocation.awareness.attributes: aws_availability_zone
cluster.routing.allocation.awareness.force.aws_availability_zone.values: ap-northeast-1a,ap-northeast-1c
cloud.node.auto_attributes: true

node.zone: ap-northeast-1c

discovery.zen.ping.multicast.enabled: false
discovery.type: ec2
cloud.aws.region: ap-northeast-1

設定ファイルを修正したので、まずは、稼働中のElasticsearchサーバから、再起動する前に、参考URLの通り、「ノード追加前の準備」を実行しました。　※本当は再起動後が良かったかも？

$ curl -XPUT 'http://localhost:9200/_cluster/settings' -d '{
"persistent": {"cluster.routing.allocation.enable": "none"}
}'
{"acknowledged":true,"persistent":{"cluster":{"routing":{"allocation":{"enable":"none"}}}},"transient":{}}%
// minimum_master_nodesは、１ノードを追加で、２ノードになるが、「ノード数 / 2 + 1」を計算すると、１なので、デフォルトだったので、実行なしとしました。

上記実行後、稼働中のElasticsearchサーバを再起動。

$ sudo service elasticsearch status
$ sudo service elasticsearch restart

起動後、設定が反映されていることを確認。

$ curl -XGET 'http://localhost:9200/_nodes?pretty=true'
{
  "cluster_name" : "XXXX-XXXX-cluster",
  "nodes" : {
    "XXXXXXXXXXXXXXXXXXXXX" : {
      "name" : "Ch'od",
      "transport_address" : "inet[10.0.X.XXX/10.0.X.XXX:9300]",
      "host" : "localhost",
      "ip" : "127.0.0.1",
      "version" : "1.3.2",
      "build" : "dee175d",
      "http_address" : "inet[/10.0.XXX.XXX:9200]",
      "attributes" : {
        "aws_availability_zone" : "ap-northeast-1c",
        "zone" : "ap-northeast-1c"
      },
      "settings" : {
        "node" : {
          "zone" : "ap-northeast-1c"
        },
        "bootstrap" : {
          "mlockall" : "true"
        },
        "name" : "Ch'od",
        "pidfile" : "/var/run/elasticsearch/elasticsearch.pid",
        "path" : {
          "data" : "/XXX/elasticsearch/data",
          "work" : "/XXX/elasticsearch/work",
          "home" : "/usr/share/elasticsearch",
          "conf" : "/etc/elasticsearch",
          "logs" : "/XXX/elasticsearch/logs"
        },
        "cluster" : {
          "routing" : {
            "allocation" : {
              "awareness" : {
                "attributes" : "aws_availability_zone",
                "force" : {
                  "aws_availability_zone" : {
                    "values" : "ap-northeast-1a,ap-northeast-1c"
                  }
                }
              }
            }
          },
          "name" : "XXXX-XXXX-cluster"
        },
        "cloud" : {
          "aws" : {
            "region" : "ap-northeast-1"
          },
          "node" : {
            "auto_attributes" : "true"
          }
        },
...

その後、無事ノードがクラスタに追加されたことを確認したら、シャード移動を許可するようにする。

$ curl -XPUT http://localhost:9200/_cluster/settings -d '{
"persistent": {"cluster.routing.allocation.enable": "all"}
}'

それぞれのノードが aws_availability_zone の値に何が設定されているのか確認するには、次のコマンドを実行します。

$ curl localhost:9200/_nodes/transport?pretty
{
  "cluster_name" : "XXXX-XXXX-cluster",
  "nodes" : {
    "XXXXXXXXXX" : {
      "name" : "Ch'od",
      "transport_address" : "inet[10.0.XXX.XXX/10.0.XXX.XXX:9300]",
      "host" : "localhost",
      "ip" : "127.0.0.1",
      "version" : "1.3.2",
      "build" : "dee175d",
      "http_address" : "inet[/10.0.XXX.XXX:9200]",
      "attributes" : {
        "aws_availability_zone" : "ap-northeast-1c",
        "zone" : "ap-northeast-1c"
      },
      "transport" : {
        "bound_address" : "inet[/0:0:0:0:0:0:0:0:9300]",
        "publish_address" : "inet[10.0.XXX.XXX/10.0.XXX.XXX:9300]"
      }
    },
    "XXXXXXXXXXXX" : {
      "name" : "Danielle Moonstar",
      "transport_address" : "inet[/10.0.XXX.XXX:9300]",
      "host" : "localhost",
      "ip" : "127.0.0.1",
      "version" : "1.3.2",
      "build" : "dee175d",
      "http_address" : "inet[/10.0.XXX.XXX:9200]",
      "attributes" : {
        "aws_availability_zone" : "ap-northeast-1a",
        "zone" : "ap-northeast-1a"
      },
      "transport" : {
        "bound_address" : "inet[/0:0:0:0:0:0:0:0%0:9300]",
        "publish_address" : "inet[/10.0.XXX.XXX:9300]"
      }
    }
  }
}

以上是我要说的内容。如果有任何错误，请指正。谢谢。