在一个月内获得GCP专业数据工程师认证的学习方法
因为我最近通过了Google Cloud认证的专业数据工程师(PDE)资格考试,所以我想要分享学习方法。
希望能对即将参加PDE考试的人们提供帮助。
开始学习前的知识和经验
在没有任何数据库或者机器学习的知识的情况下,我之前获得了Google Cloud的另一项认证PCA,因此对该服务的概要和参考架构有了一个大致的了解。
由於Google Cloud的服務有一些是基於開放源碼軟體而建立的,所以如果有這些相關知識的話會更好,但即使完全不了解也可以從零開始學習,在約一個月內就能通過考試。因此,我認為即使沒有實務經驗或者資料分析等知識,也完全有能力通過資格考試。
学习方法
我实际花费了大约一个月(约60小时)来学习。我主要使用Coursera作为主要学习资源。Coursera的课程是以视频讲座为主导,使用Qwiklabs进行实践操作,然后通过理解度测试进行总结。个人而言,通过实践操作对知识的巩固感到很大,所以强烈推荐。你也可以创建GCP账户进行尝试,但使用费用可能会很高…
我在公司的福利制度下可以免费使用Coursera,但通常情况下只有7天的免费试用期,之后基本上会收取月费,所以请注意不要产生意外的费用。
以下是我進行學習的實際步驟概要。
1. Google Cloud大数据和机器学习基础(日本语版本)
我认为这是必须参加的一门课程,你可以大致了解本考试会出现的服务概要。
试试看参加一次模拟考试。
您可以免费参加 Google Cloud 的模拟考试(30道题)。您可以无限次参加考试,但题目始终相同。
第一次尝试时,我感觉很敏锐,正确率大约为70%(虽然我自信满满地回答了约50%的问题…)。考试前想再次参加以测试学习成果,所以没有仔细阅读答案和解释,只是简单地浏览了一遍。
通过GCP来现代化数据湖和数据仓库 日本語版本
在数据管道中,有两个非常重要的组件,分别是数据湖和数据仓库。
即使对于不了解数据湖和数据仓库的人,通过概述开始解释,他们也能很容易地理解。
4. 在GCP上构建批量数据流水线(日本语版本)
在GCP上构建具有弹性的流媒体分析系统的日本语版本。
以下是两个选项的汉语原生版翻译:
以上的两个课程涵盖了数据管道的批处理和流式处理。由于在考试中经常会涉及到哪种处理适用于哪种情况的问题,建议大家要掌握它们之间的区别和使用案例等内容。
6. GCP(Google Cloud Platform)上的智能分析、机器学习和人工智能,日本语版本。
这是关于ML和AI的课程。这门课程与“Google云大数据和机器学习基础”有许多相似之处,所以只需要看一下大致内容可能也可以。考试中也会出现一些ML的问题,但作为比例大约只有10%至20%,所以我个人认为相对于诸如数据管道之类的课程,重要性会下降。
7. 尝试参加模拟考试(第二次)
在这里参加了第二次模拟考试,结果与第一次几乎没有变化,正确率约为70%。
但是,由于我对回答有一些确定性地增加了,所以我能够增加一些自信。
8. 准备参加Google云数据工程师专业考试——日本语版本。
由于觉得这门课的视频讲座与之前的课程大部分重复,所以我只是轻松地浏览了一下。
因为课程的最后有包含25个模拟问题,所以我建议你去做一下。
考试后的感想
我觉得这个考试相当难。与之前参加的PCA考试相比,我觉得PDE更具挑战性。
此外,还出现了比我们在学习方法中介绍的模拟考试和Coursera的模拟题更难的问题。如果出现了官方模拟考试级别的问题,我认为这是一种服务问题。
考試技巧
在GCP专业数据工程师考试中,我在两周内取得了合格,因此我想分享学习方法。这篇文章介绍了一些考试技巧,务必阅读!!考试期间,我读过这篇文章,它帮了我很多。我认为在考试前,理解这篇文章中所提到的内容接近100%可以显著提高合格率。
我参加考试并努力学习,觉得有几个好处值得补充一下。
■存储相关
– Cloud SQL的存储上限
Cloud SQL的存储上限根据机器类型等因素而异,最大可达64TB。
如果需要超过64TB的存储容量,将无法选择Cloud SQL。
关于Bigtable的模式设计
事务仅在一行内受支持。
每个表的索引(行键)仅限一个,没有二级索引等。
■流水线
·关于Kafka和Pub/Sub的区别
需要注意的是,Pub/Sub有一定的消息保留时间限制。
最后一步
虽然考试非常困难,但只要抓住重点努力学习,我认为可以通过。祝大家考试顺利!