我在本地的Docker环境中快速地运行了 Kafka 第7次回顾

2 年 ago

科, 颖

3 minutes

概述

受到 Kafka 的吸引，一名只懂得基础设施的软件工程师购买了新的 MacBook Pro，并参考了在 Qiita 等网站上发布的前辈们的文章，分步骤记录了在自己的电脑上进行 Kafka 的操作确认的过程，并将其分为数次进行了描述。关于 Kafka 的概述，请参考此文章。

执行环境

MacOS Big Sur 11.1
Docker 版本 20.10.2，构建 2291f61
Python 3.8.3

在消费者设置中接收消息的选项

为了接收数据，连接到消费者并转到程序所在的目录。

$ docker exec -it iottopicdata_ktp_1 /bin/bash
root@c23123e17068:/app#
root@c23123e17068:/app# cd opt
root@c23123e17068:/app/opt#

运行IoTTopicData-v1.py，并设置数据接收配置（终端输出）。

root@c23123e17068:/app/opt# python IoTTopicData-v1.py --mode tm
<kafka.consumer.group.KafkaConsumer object at 0x7f7494085650>
ターミナル 出力

目前没有任何提示出现，但仍在等待从生产者那里接收消息。

启动两个Producer容器

为了发送数据，您需要打开另一个终端，并启动两个生产者。之后，请检查这两个容器是否已经启动。

$ docker-compose up -d --scale iot=2
Creating iotsampledata_iot_2 ... done

$ docker-compose ps
       Name           Command   State   Ports
---------------------------------------------
iotsampledata_iot_1   python3   Up           
iotsampledata_iot_2   python3   Up

从两个制片人发送的信息

为了同时运行两个容器程序，我们将创建一个名为「script_iot.sh」的脚本文件。
我们将设置每个容器发送 500 条数据（参数：–count 500）。
我们还将设置一个参数（参数：–proc 1111 or 2222）以区分是从哪个容器发送的数据。

#!/bin/zsh
docker exec iotsampledata_iot_1 python /app/opt/IoTSampleData-v2.py --mode kf --proc 1111 --count 500 &
docker exec iotsampledata_iot_2 python /app/opt/IoTSampleData-v2.py --mode kf --proc 2222 --count 500

我将运行这个脚本。

$ ./iot_multi.sh
Kafka 出力
<kafka.producer.future.FutureRecordMetadata object at 0x7f1e5b861ad0>

データ作成件数:500
データ作成時間:0.21667098999023438 [sec]

Kafka 出力
<kafka.producer.future.FutureRecordMetadata object at 0x7f165d9c8450>

データ作成件数:500
データ作成時間:0.22739458084106445 [sec]

消费者接收到由生产者发送的数据并显示在提示符中。

root@c23123e17068:/app/opt# python IoTTopicData-v1.py --mode tm
<kafka.consumer.group.KafkaConsumer object at 0x7f7494085650>
ターミナル 出力
  中略
topic-11:0:766: key=b'2021/02/06' value={'SECTION': 'E', 'TIME': '2021-02-06T01:36:51.211665', 'PROC': '1111', 'IOT_NUM': '832-6134', 'IOT_STATE': '茨城県', 'VOL_1': 179.96703574789623, 'VOL_2': 80.56843267707185}
topic-11:0:767: key=b'2021/02/06' value={'SECTION': 'E', 'TIME': '2021-02-06T01:36:51.211852', 'PROC': '1111', 'IOT_NUM': '673-3797', 'IOT_STATE': '福井県', 'VOL_1': 147.72401039767132, 'VOL_2': 85.72532419479631}
topic-11:0:768: key=b'2021/02/06' value={'SECTION': 'E', 'TIME': '2021-02-06T01:36:51.216597', 'PROC': '2222', 'IOT_NUM': '503-2390', 'IOT_STATE': '千葉県', 'VOL_1': 152.7394266108338, 'VOL_2': 57.05013141176613}
topic-11:0:769: key=b'2021/02/06' value={'SECTION': 'C', 'TIME': '2021-02-06T01:36:51.216701', 'PROC': '2222', 'IOT_NUM': '516-4680', 'IOT_STATE': '青森県', 'VOL_1': 108.40957664102798, 'VOL_2': 87.16620915206302}
topic-11:0:770: key=b'2021/02/06' value={'SECTION': 'E', 'TIME': '2021-02-06T01:36:51.217158', 'PROC': '2222', 'IOT_NUM': '461-3098', 'IOT_STATE': '熊本県', 'VOL_1': 156.59169261796896, 'VOL_2': 84.65261961696028}
topic-11:0:771: key=b'2021/02/06' value={'SECTION': 'C', 'TIME': '2021-02-06T01:36:51.217178', 'PROC': '2222', 'IOT_NUM': '715-8459', 'IOT_STATE': '宮城県', 'VOL_1': 170.13111876865736, 'VOL_2': 63.72228869990629}
topic-11:0:772: key=b'2021/02/06' value={'SECTION': 'C', 'TIME': '2021-02-06T01:36:51.217307', 'PROC': '2222', 'IOT_NUM': '153-1059', 'IOT_STATE': '石川県', 'VOL_1': 109.43435107461053, 'VOL_2': 71.26109660837363}
topic-11:0:773: key=b'2021/02/06' value={'SECTION': 'W', 'TIME': '2021-02-06T01:36:51.212614', 'PROC': '1111', 'IOT_NUM': '019-2207', 'IOT_STATE': '長崎県', 'VOL_1': 136.0842636605171, 'VOL_2': 51.32787199610963}
topic-11:0:774: key=b'2021/02/06' value={'SECTION': 'W', 'TIME': '2021-02-06T01:36:51.212961', 'PROC': '1111', 'IOT_NUM': '783-1782', 'IOT_STATE': '宮崎県', 'VOL_1': 123.00662563145016, 'VOL_2': 59.17796383111264}
　後略

通过 topic-01 → Ksql → topic-11 的路径，可以确认在两个Producer容器上生成的Python程序的数据可以通过Consumer上的Python程序接收到（通过检查PROC键的值，可以看到数据在各自的容器中被接收）。

最后

我在本地的Docker环境中迅速地运行了Kafka，总共进行了7次尝试。虽然没有包括模式注册表和连接器等内容，但我已确认了Kafka的基本运行情况。

第1回：在本地的Docker环境中运行Kafka基本组件
第2回：通过Broker，确认能够从Kafka的Producer发送的消息被Consumer接收
第3回：通过Broker，确认Producer上的Python程序生成的数据能够被Consumer接收
第4回：确认Producer上生成的数据通过topic-01并经过KSQL（topic01_stream1 → topic01_stream2）进行流式抽取处理
第5回：通过topic-01 → Ksql → topic-11，确认Producer上生成的数据可以被Consumer上的Python程序接收
第6回：通过topic-01 → Ksql → topic-11，确认Producer上生成的数据可以通过Consumer上的Python程序写入S3
第7回：通过topic-01 → Ksql → topic-11，确认两个Producer容器生成的各自数据可以被Consumer上的Python程序接收

请提供相关信息。

根据以下信息作为参考，我非常感谢您：
Kafka Docker教程
从Kafka到KSQL，通过Docker轻松搭建环境