尝试将Elasticsearch的数据传输到BigQuery,通过数据门户进行可视化

简而言之

我们将用户在我们运营的服务中的行为日志积累到Elasticsearch中,并且许多人都考虑使用数据分析来改善服务。因此,本次我们将尝试将Elasticsearch的数据自动传输到BigQuery,并进行数据可视化。

qiita_20200827_1.png

目标 (mù

qiita_20191210_1.png

推荐给这样的人

    • ElasticsearchのデータをBigQueryにも保存しておきたい方

 

    • Elasticsearchに保存したデータと他のデータを組み合わせて分析したい方

 

    自前のコードを用いたデータ取り込みや、手作業によるデータ取得に疲れている方・・・

选择与DWH同步的方式

1-1. DWH的选择

首先要确定数据集中在哪里,选择数据仓库(DWH)。

    • Google BigQuery

 

    • Amazon Redshift

 

    MySQLやPostgreSQL

这次我们决定使用BigQuery。

将Elasticsearch数据传输到BigQuery的三种方法。

由于决定将数据集成到BigQuery中,接下来我们将考虑用于传输的方法。
1. 编写程序以实现Elasticsearch和BigQuery的各种API之间的协作。
2. 使用Embulk并自行构建环境。
3. 使用trocco并在屏幕上进行设置。

1. 在进行API的适应工作+编写程序工作+环境设置工作时,还会产生其他一些运维工作,比如错误处理等需要持续进行。
2. 与1一样,Embulk也需要一定的专业知识,并且需要花费一定的时间进行环境设置和运维。此外,由于错误的内容有些专业性,解决错误可能会花费一些时间。

因此,这次我们将使用名为trocco的SaaS来解决Embulk的问题,通过在屏幕上进行设置而无需编写程序即可完成工作。

2. 实现trocco自动将数据从Elasticsearch传输到BigQuery。

事前准备是指在某个事件或活动之前所做的准备工作。

需要trocco账号和Elasticsearch主机名。
他们好像也提供免费试用,所以请提前申请并注册!
(在申请时,请注明您看到了这篇文章,以便我们能够顺利地为您提供信息)

确定转发来源和转发目标

qiita_20200827_3.png

与Elasticsearch的协作设置2-2。

qiita_20200827_6.png

2-3. 从Elasticsearch中进行数据提取设置

qiita_20200827_7.png

2-4. 设置BigQuery的传输目标。

qiita_20200827_8.png

2-5. 数据预览

qiita_20200827_9.png

2-6. 日程安排和通知设置

qiita_20200827_10.png

2-7. 执行数据传输任务

qiita_20200827_11.png

3. BigQuery配置

qiita_20200827_12.png

4. 在Google数据门户(原名数据工作室)上进行可视化。

qiita_20200827_17.png

总结

您使用trocco后,可以轻松获取广告报告并存储到DWH(BigQuery),您觉得效果如何呢?
此外,将数据存储到BigQuery后,可以立即使用Google的免费仪表板数据门户进行可视化。
实际上,在我们公司的trocco服务中,我们也是通过这样的流程收集和分析营销KPI等数据。

如果您想试一试的话,我们正在提供免费试用机会,希望您能抓住这个机会,尽情体验一次。请在申请时注明您是通过阅读本文得知此信息,以便我们能够顺利为您提供服务。

我整理了各种分析数据的ETL和传输案例,包括广告和数据库等其他内容。
trocco的用法总结(CRM、广告、数据库等其他)。

广告
将在 10 秒后关闭
bannerAds