Apache Atlas可行的开始(2)
※上篇文章请点击此处。
本文将详细介绍Apache Atlas的构建和安装步骤,并对其未来发展进行说明。这是第二篇文章。
1. Atlas的构建和安装
在此后,有时会简称Apache Atlas为Atlas。
1.1 前提条件
1.1 tí
在这里,我们假设在Linux或其他类UNIX系统上进行构建和安装。另外,在构建过程中需要互联网连接以下载库文件和工具。
1.2 措辞一个目的
构建Apache Atlas需要Java Development Kit(JDK)和Apache Maven。在Atlas版本2.1.0中,要求JDK版本为1.8.0-151以上(但JDK 9未经测试),要求Apache Maven版本为3.5.0以上。
除此之外,任何必要的库和工具将会在构建过程中通过Apache Maven自动下载。
2. Atlas的构建
2.1 获取源代码
获取Apache Atlas的源代码有两种方法。
2.1.1 通过Git获取
Atlas的源代码是由Git管理的。您可以通过以下URL中的任意一个使用git clone命令来获取存储库,并且可以检出任意的提交ID或标签。
-
- https://git.apache.org/repos/asf/atlas.git
- https://github.com/apache/atlas.git
关于Atlas的Git使用,当Release Candidate (RC)版被正式发布和认可后,不需要再创建发布点的标签,所以在需要发布版本时,请检查名称为release-X.Y.Z-rc#的标签中最大的末尾号。如果是版本2.1.0,则是release-2.1.0-rc3。
获取源代码存档文件。
从官方网站的下载页面上获取源代码归档文件的tarball,并进行解压缩。
$ tar -xf apache-atlas-X.Y.Z-sources.tar.gz
$ cd apache-atlas-sources-X.Y.Z/
选择2.2版配置文件
Atlas提供了支持Apache HBase,Apache Cassandra和Oracle Berkeley DB作为后端数据库的选项,并支持Apache Solr和Elasticsearch作为全文搜索引擎。通过在构建时指定下表中的配置文件,您可以选择这些后端数据库和全文搜索引擎的组合。
external-hbase-solr
(デフォルト)HBase+Solr別途HBaseとSolrのセットアップが必要embedded-hbase-solr
HBase+Solrembedded-cassandra-solr
Cassandra+Solrberkeley-elasticsearch
Berkeley DB+Elasticsearch別途Berkeley DBのjarファイルの手動ダウンロードが必要如果要运行通过”profile external-hbase-solr”构建的Atlas,则除了Atlas之外,还需要设置并启动HBase和Solr。对于其他配置文件,则以包含后端数据库和全文搜索引擎的形式构建,并与Atlas一起启动。
2.3 建筑
只需要一个选项来用中文来改写:
在这里,我们要指定embedded-hbase-solr和dist作为配置文件来构建。配置文件dist的指示是生成二进制和源代码的存档文件。
$ mvn clean -DskipTests package -Pdist,embedded-hbase-solr
3. Atlas的安装
当构建成功后,将会在distro/target目录下生成二进制压缩文件的tarball,您需要将其解压到任意目标安装目录中。在此示例中,我们将版本2.1.0安装到/opt/apache-atlas。
$ sudo mkdir /opt/apache-atlas
$ sudo chown $(id -u):$(id -g) /opt/apache-atlas
$ tar -xf distro/target/apache-atlas-2.1.0-bin.tar.gz -C /opt/apache-atlas
编辑配置文件conf/atlas-env.sh,并在环境变量JAVA_HOME中设置JDK1的路径。
$ cd /opt/apache-atlas/apache-atlas-2.1.0
$ vi conf/atlas-env.sh
JDK的路径因系统而异。以下是在Ubuntu系统下的设置示例。
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
4. Atlas的启动
Atlas会在atlas_start.py命令下启动2。除了Atlas本身,还会同时启动后端的HBase和Solr。
$ cd /opt/apache-atlas/apache-atlas-2.1.0
$ bin/atlas_start.py
可以通过http://<主机名>:21000/访问Web UI。初始注册的用户名和密码是admin/admin。安装后第一次启动时,会进行模型注册和其他初始设置,因此可能需要一些时间才能访问Web UI。
默认情况下,Web UI兼RESTful API使用端口21000/tcp进行设置,但如果要更改此端口,可以通过使用“-port”选项来启动。
$ bin/atlas_start.py -port 8080
5. 注册示例实体
在安装Atlas后的初始状态下,尚未注册任何实体。我们可以使用quick_start.py命令来注册示例实体。
$ bin/quick_start.py
在访问Web用户界面后,点击左侧导航栏的”搜索”→”按类型搜索”的输入框中选择”_ALL_ENTITY_TYPES”或”Asset”类型,点击”搜索”按钮后,右侧窗格会列出示例实体。
6. Atlas的结束
Atlas将使用atlas_stop.py命令进行停止。
$ bin/atlas_stop.py
7. Atlas的未来是什么?
在数据目录领域,国内供应商也开始发布产品,这表明人们对其重要性的认识正在增加。在这个领域中,Apache Atlas已经建立了作为支持Hadoop生态系统的数据目录的地位。最近,公共云存储服务和数据库服务的普及,以及数据平台的多样性不断增加,但Atlas具有支持多样化数据资源的潜力,不仅限于Hadoop生态系统。
Atlas作为一个开源的数据目录,任何人都可以自由使用,可以说它将继续受到关注。
关于他们的商品名称
-
- Linuxは,Linus Torvalds氏の米国およびその他の国における登録商標もしくは商標です。
-
- UNIXは,The Open Groupの米国およびその他の国における登録商標です。
-
- Oracle,JavaおよびすべてのJava関連の商標およびロゴは,Oracle Corporationおよびその子会社,関連会社の米国およびその他の国における登録商標もしくは商標です。
-
- Gitは,Software Freedom Conservancy, Inc. の米国およびその他の国における登録商標もしくは商標です。
-
- Apache,Apache Cassandra,Apache HBase,Apache Maven,Apache Solr,Cassandra,HBaseは,Apache Software Foundationの米国およびその他の国における登録商標もしくは商標です。
-
- Elasticsearchは,Elasticsearch B.V.の米国およびその他の国における登録商標もしくは商標です。
-
- Ubuntuは,Canonical Ltd.の米国およびその他の国における登録商標もしくは商標です。
-
- Active Directoryは,米国Microsoft Corporationの米国およびその他の国における登録商標もしくは商標です。
-
- その他記載の会社名,製品名,サービス名,その他固有名詞は,それぞれの会社の登録商標もしくは商標です。
- 本文中では™,®マークは表記しておりません。
Atlas启动需要使用jar命令。由于Java Runtime Environment (JRE)可能不包含jar命令,因此请使用JDK。
在版本2.1.0中,执行Atlas附带的实用程序命令,包括启动命令atlas_start.py,需要使用Python 2。
用户和密码将在配置文件conf/users-credentials.properties中注册。此外,还支持其他用户认证方式,例如LDAP,Active Directory和Kerberos。