我们专注攀枝花网站设计 攀枝花网站制作 攀枝花网站建设
成都网站建设公司服务热线:400-028-6601

网站建设知识

十年网站开发经验 + 多家企业客户 + 靠谱的建站团队

量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决

ELK5.3+Kafka集群配置-创新互联

【一】资源准备

创新互联专注于新会企业网站建设,响应式网站建设,购物商城网站建设。新会网站建设公司,为新会等地区提供建站服务。全流程定制网站建设,专业设计,全程项目跟踪,创新互联专业和态度为您提供的服务

# 3台4C*8G, 安装Zookeeper、Kafka、Logstash——Broker(input: filebeat; output: Kafka)

 10.101.2.23 10.101.2.24 10.101.2.25

# 2台4C*8G, 安装Logstash——Indexer(input: Kafaka; output: Elasticsearch)

 10.101.2.26 10.101.2.27

# 3台8C*16G, 安装Elasticsearch

 10.101.2.28 10.101.2.29 10.101.2.30

# 2台2C*4G, 安装Kibana

 10.101.2.31 10.101.2.32

# 安装包下载

 elasticsearch-5.3.1.tar.gz

 filebeat-5.3.1-linux-x86_64.tar.gz

 jdk-8u131-linux-x64.tar.gz

 kafka_2.12-0.10.2.0.tgz

 kibana-5.3.1-linux-x86_64.tar.gz

 logstash-5.3.1.tar.gz

 node-v7.9.0-linux-x64.tar.gz

 zookeeper-3.4.10.tar.gz

 nginx-1.12.0.tar.gz

 统一上传至服务器 /usr/local/src 目录下

【二】通用配置

# 配置hosts

vi /etc/hosts

10.101.2.23   vmserver2x23

10.101.2.24   vmserver2x24

10.101.2.25   vmserver2x25

10.101.2.26   vmserver2x26

10.101.2.27   vmserver2x27

10.101.2.28   vmserver2x28

10.101.2.29   vmserver2x29

10.101.2.30   vmserver2x30

10.101.2.31   vmserver2x31

10.101.2.32   vmserver2x32

# 配置ssh访问限制,假如有必要的话

vi /etc/hosts.allow

【三】安装Elasticsearch集群

# 系统环境

vi /etc/sysctl.conf

vm.max_map_count=262144

fs.file-max=65536

执行 sysctl -p  使配置生效

vi /etc/security/limits.conf #打开文件数

* soft nofile 65536

* hard nofile 131072

* soft nproc 2048

* hard nproc 4096

* - memlock unlimited

vi /etc/security/limits.d/90-nproc.conf

* soft nproc 2048

# 配置Java环境变量

cd /usr/local/src/

tar -xvf jdk-8u131-linux-x64.tar.gz

mv jdk1.8.0_131 /usr/share/

vi /etc/profile #在末尾添加下面3行后, 保存退出

export JAVA_HOME=/usr/share/jdk1.8.0_131

export PATH=$JAVA_HOME/bin:$PATH

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

source /etc/profile  使得配置立即生效

# 解压elasticsearch

cd /usr/local/src

tar -xvf elasticsearch-5.3.1.tar.gz

mv elasticsearch-5.3.1 /usr/local

vi /usr/local/elasticsearch-5.3.1/bin/elasticsearch  #设置ES_JAVA_OPTS参数

ES_JAVA_OPTS="-Xms8g -Xmx8g"  # 去掉该行前的注释后, 一定要删除后面的这一串 ./bin/elasticsearch

# 新增elastic组及用户, 因为elasticsearch不允许root用户启动

groupadd elastic

useradd elastic -g elastic

passwd elastic  # 设定用户密码

chown -R elastic:elastic /usr/local/elasticsearch-5.3.1/

# 配置elasticsearch.ywl, 主要参数如下

cluster.name: bsd-elk

node.name: elk-2-30    # 每个节点不同

node.master: true

node.data: true

bootstrap.memory_lock: true

bootstrap.system_call_filter: false   # centos7以下版本需要将这个参数设置为false

network.host: 0.0.0.0

http.port: 9200

discovery.zen.ping.unicast.hosts: ["10.101.2.28:9300", "10.101.2.29:9300", "10.101.2.30:9300"]

discovery.zen.minimum_master_nodes: 2

discovery.zen.ping_timeout: 60s     # 网上大部分文章这个参数都写成了discovery.zen.ping.timeout

http.cors.enabled: true

http.cors.allow-origin: "*"

# 下载node-v7.9.0-linux-x64.tar.gz, 解压后mv到/usr/local/nodejs-7.9.0

chown -R elastic:elastic nodejs-7.9.0/

cd /usr/local/nodejs-7.9.0

ln -s /usr/local/nodejs-7.9.0/bin/node /usr/local/bin

ln -s /usr/local/nodejs-7.9.0/bin/npm /usr/local/bin

# 安装head插件, 5.x以上的elasticsearch暂没有找到离线安装的方法, 所以需要服务器开通外网访问权限

# 5.x版本是里程碑式的更新, 网上大部分的文章都是以前版本的插件安装

cd /usr/local/elasticsearch-5.3.1

git clone https://github.com/mobz/elasticsearch-head.git

如果没有git工具先安装, yum install git

cd elasticsearch-head

npm install -g grunt --registry=https://registry.npm.taobao.org   # 安装grunt

npm install                             # 安装head

npm install grunt --save  # 如果 node_modules/grunt/bin/目录下没有 grunt文件, 就执行以下该命令

vi Gruntfile.js  修改connect, 在options里添加本机IP hostname: '10.101.2.30',

cd /usr/local/elasticsearch-5.3.1

bin/elasticsearch -d   # 启动elasticsearch

cd elasticsearch-head

node_modules/grunt/bin/grunt server &  # 启动head插件

访问 http://10.101.2.30:9100

# 安装bigdesk插件

cd /usr/local/elasticsearch-5.3.1

git clone https://github.com/hlstudio/bigdesk

cd bigdesk/_site

python -m SimpleHTTPServer &  # 启动bigdesk插件

访问 http://10.101.2.30:8000

另外两台机器(10.101.2.28 10.101.2.29)按此步骤同样配置, master和data节点的选择看实际情况, 我的3台全是混合节点

所有elasticsearch启动后, 访问head如果能看到3个节点的集群信息, 就可以了

【四】安装ZooKeeper集群

# zookeeper依赖java, java环境配置参照上面

# 解压zookeeper-3.4.10.tar.gz

cd /usr/local/src

tar -xvf zookeeper-3.4.10.tar.gz

mv zookeeper-3.4.10 /usr/local

mkdir /usr/local/zookeeper-3.4.10/data   # 每个节点上创建一个数据存放目录

# 创建myid文件

echo 23 >/usr/local/zookeeper-3.4.10/data/myid   # 10.101.2.23、24、25三台机器上myid的值分别放 23 24 25

# 配置zoo.cfg

cd /usr/local/zookeeper-3.4.10/conf/

cp zoo_sample.cfg zoo.cfg

vi zoo.cfg   # 主要参数如下

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/usr/local/zookeeper-3.4.10/data

clientPort=2181

server.23=10.101.2.23:2888:3888

server.24=10.101.2.24:2888:3888

server.25=10.101.2.25:2888:3888

# 复制配置文件到其他节点

scp zoo.cfg root@ip:/usr/local/zookeeper-3.4.10/conf/

# 启动zookeeper集群

cd /usr/local/zookeeper-3.4.10/

bin/zkServer.sh start

bin/zkServer.sh status  # 主节点会返回 Mode: leader, 从节点返回 Mode: follower

至此zookeeper集群配置完毕

【五】配置kafka集群

# 解压kafka_2.12-0.10.2.0.tgz, 创建数据目录

cd /usr/local

tar -xvf  src/kafka_2.12-0.10.2.0.tgz

mkdir /usr/local/kafka_2.12-0.10.2.0/data

# 配置server.propertites

cd /usr/local/kafka_2.12-0.10.2.0/config

vi server.properties  # 主要参数如下

broker.id=23      # 10.101.2.23、24、25三台机器上id的值分别放 23 24 25

delete.topic.enable=true

num.network.threads=3

num.io.threads=8

socket.send.buffer.bytes=102400

socket.receive.buffer.bytes=102400

socket.request.max.bytes=104857600

log.dirs=/usr/local/kafka_2.12-0.10.2.0/data

num.partitions=6

num.recovery.threads.per.data.dir=1

#log.flush.interval.messages=10000

#log.flush.interval.ms=1000

log.retention.hours=72

#log.retention.bytes=1073741824

log.segment.bytes=1073741824

log.retention.check.interval.ms=300000

zookeeper.connect=10.101.2.23:2181,10.101.2.24:2181,10.101.2.25:2181

zookeeper.connection.timeout.ms=6000

# 复制配置文件到其他节点, 不要忘记修改 broker.id

scp server.properties root@ip:/usr/local/kafka_2.12-0.10.2.0/config/

# 启动kafka集群

cd /usr/local/kafka_2.12-0.10.2.0/

bin/kafka-server-start.sh config/server.properties > /dev/null &

# 友情赠送几条常用命令

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test  # 创建topic

bin/kafka-topics.sh --list --zookeeper localhost:2181  # 查看已经创建的topic列表

bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic test  # 查看topic的详细信息

bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test # 发送消息, 回车后模拟输入一下消息

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test # 消费消息, 可以换到其他kafka节点, 同步接收生产节点发送的消息

bin/kafka-topics.sh --zookeeper localhost:2181 --alter --topic test --partitions 6  # 给topic增加分区

bin/kafka-topics.sh --delete --zookeeper localhost:2181 --topic test1  # 删除已经创建的topic, 前提是开了delete.topic.enable=true参数

如果还不能删除, 可以到zookeeper中去干掉它

cd /usr/local/zookeeper-3.4.10/

bin/zkCli.sh

ls /brokers/topics       # 查看topic

rmr /brokers/topics/test1   # 删除topic

至此kafka集群配置完毕

【六】logstash——broker集群配置

# java环境配置略

# 解压logstash-5.3.1.tar.gz

cd /usr/local

tar -xvf src/logstash-5.3.1.tar.gz

# 添加配置文件 beat_to_kafka.conf

cd logstash-5.3.1

vi config/beat_to_kafka.conf  # 输入下面内容后保存

input {

 beats {

  port => 5044

 }

}

filter {

}

# topic_id改成按beat中配置的document_type来输出到不同的topic中, 供kibana分组过滤用

output {

 kafka {

  bootstrap_servers => "10.101.2.23:9092,10.101.2.24:9092,10.101.2.25:9092"

  # topic_id => "bsd-log"

  topic_id => '%{[type]}'

 }

}

# 启动logstash

bin/logstash -f config/beat_to_kafka.conf > /dev/null &

至此logstash-broker集群配置完成

【七】在实际应用服务器上安装filebeat

# 解压filebeat-5.3.1-linux-x86_64.tar.gz

cd /usr/local/

tar -xvf src/filebeat-5.3.1-linux-x86_64.tar.gz

mv filebeat-5.3.1-linux-x86_64 filebeat-5.3.1

# 配置filebeat.yml文件, 先找一台drds试水

cd filebeat-5.3.1

vi filebeat.yml   # 主要参数如下

#=========================== 文件正文开始 =============================

filebeat.prospectors:

-

 input_type: log

 paths:

  - /home/admin/drds-server/3306/logs/rms/slow.log

  - /home/admin/drds-server/3306/logs/engineering/slow.log

  - /home/admin/drds-server/3306/logs/sc_file/slow.log

  - /home/admin/drds-server/3306/logs/sc_user/slow.log

  - /home/admin/drds-server/3306/logs/sc_order/slow.log

  - /home/admin/drds-server/3306/logs/sc_inventory/slow.log

  - /home/admin/drds-server/3306/logs/sc_marketing/slow.log

  - /home/admin/drds-server/3306/logs/sc_message/slow.log

  - /home/admin/drds-server/3306/logs/sc_channel/slow.log

 #exclude_lines: ["^DBG"]

 #include_lines: ['Exception','ERR_CODE']

 #exclude_files: [".gz$"]

 document_type: drds-slow

 # 设定合并正则

 multiline.pattern: ^[0-9]{4}-[0-9]{2}-[0-9]{2}\s[0-9]{2}:[0-9]{2}:[0-9]{2}.[0-9]{3}

 multiline.negate: true

 multiline.match: after

# 单台机器上配置不同document_type

-

 input_type: log

 paths:

  - /home/admin/drds-server/3306/logs/test/sql.log

 document_type: drds-sql

 multiline.pattern: ^[0-9]{4}-[0-9]{2}-[0-9]{2}\s[0-9]{2}:[0-9]{2}:[0-9]{2}.[0-9]{3}

 multiline.negate: true

 multiline.match: after

#----------------------------- Logstash output --------------------------------

output.logstash:

 # The Logstash hosts

 hosts: ["10.101.2.23:5044","10.101.2.24:5044","10.101.2.25:5044"]

#=========================== 文件正文结束 =============================

# 启动filebeat

./filebeat -c filebeat.yml > /dev/null &

【八】配置logstash——indexer集群

# java环境配置略

# 解压logstash-5.3.1.tar.gz

cd /usr/local

tar -xvf src/logstash-5.3.1.tar.gz

# 添加配置文件 kafka_to_es.conf

cd logstash-5.3.1

vi config/kafka_to_es.conf  # 输入下面内容后保存

# input里关于server以及topic的配置, 5.x和以前版本不同

input {

 kafka {

  bootstrap_servers => "10.101.2.23:9092,10.101.2.24:9092,10.101.2.25:9092"

  group_id => "logstash"

  topics => ["drds-sql","drds-slow","sc_user","sc_channel","sc_order","sc_inventory","sc_message","sc_file","sc_marketing","rms",'scm','engineering']

  consumer_threads => 50

  decorate_events => true

 }

}

filter {

}

output {

 elasticsearch {

  hosts => ["10.101.2.28:9200","10.101.2.29:9200","10.101.2.30:9200"]

  index => "logstash-%{+YYYY.MM.dd.hh}"

  manage_template => true

  template_overwrite => true

  template_name => "drdsLogstash"

  flush_size => 50000

  idle_flush_time => 10

 }

}

# 启动logstash

bin/logstash -f config/kafka_to_es.conf > /dev/null &

至此logstash-indexer集群配置完成, 不出意外, elasticsearch-head里应该已经有数据写入了

【九】配置kibana集群

# 解压kibana-5.3.1-linux-x86_64.tar.gz

cd /usr/local

tar -xvf src/kibana-5.3.1-linux-x86_64.tar.gz

mv kibana-5.3.1-linux-x86_64/ kibana-5.3.1

# 配置kibana.yml文件

cd kibana-5.3.1

vi config/kibana.yml   #主要参数如下

server.port: 5601

server.host: "0.0.0.0"

elasticsearch.url: "http://10.101.2.28:9200"   # 指到es集群master节点

# 启动kibana

bin/kibana > /dev/null &

# kibana对浏览器兼容性不好, 低版本的chrome和ie都不能访问, 显示正在加载

访问 http://ip:5601

# 另一台kibana节点按相同配置(可以把es.url指到另一个节点), kibana查询支持布尔运算符, 通配符等, 关键字要大些(如AND OR), 具体自行百度

【十】配置nginx代理

# 安装nginx需要的一些依赖包

yum -y install pcre-devel

yum -y install gd-devel

# 解压nginx-1.12.0.tar.gz

cd /usr/local/

tar -xvf src/nginx-1.12.0.tar.gz

# 安装nginx

cd nginx-1.12.0

./configure --prefix=/usr/local/nginx-1.12.0/ --conf-path=/usr/local/nginx-1.12.0/nginx.conf

make

make install

# 配置 nginx.conf 文件, 我们这边只做负载均衡, 随便设设就好

vi /usr/local/nginx-1.12.0/nginx.conf

worker_processes  1;

error_log  logs/error.log  info;

#pid     logs/nginx.pid;

events {

  worker_connections  1024;

}

http {

  include    mime.types;

  default_type  application/octet-stream;

  log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '

           '$status $body_bytes_sent "$http_referer" '

           '"$http_user_agent" "$http_x_forwarded_for"';

  access_log  logs/access.log  main;

  sendfile     on;

  keepalive_timeout  65;

  upstream kibana {

    server  10.101.2.31:5601;

    server  10.101.2.32:5601;

  }

  server {

    listen    15601;

    server_name  10.101.2.31;

    #charset koi8-r;

    #access_log  logs/host.access.log  main;

    location / {

      root  html;

      index  index.html index.htm;

      proxy_pass http://kibana;

    }

    error_page  500 502 503 504  /50x.html;

    location = /50x.html {

      root  html;

    }

  }

# 启动nginx

sbin/nginx

# 之后在浏览器上访问 http://nginx_ip:15601 即可

至此集群所有组件配置完成

另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


网站栏目:ELK5.3+Kafka集群配置-创新互联
分享网址:http://shouzuofang.com/article/jspsi.html

其他资讯