通过 IBM Power Systems 上运行的 SAP HANA Spark Controll(3)

日期：2020-06-12 栏目：程序人生浏览：次

hndadm 5724 1 0.0 538816 35648 /usr/sap/HND/HDB00/exe/sapstartsrv pf=/usr/sap/HND/SYS/profile/HND_HDB00_saphana2 -D -u hndadm

安装并配置 SAP HANA Studio

HANA Studio 是一个集成开发环境 (IDE)，在与 SAP HANA 交互时，它提供了许多功能。可以使用它来访问并可视化 SAP HANA 中的数据资产。将该软件安装在您的客户端系统上，比如 Windows PC。

安装并配置 SAP HANA Spark Controller

执行以下步骤来安装并配置 SAP HANA Spark Controller：

从下载 Spark Controller。

按照 Spark Controller 安装和配置指南进行操作。

在多节点 HDP 集群上，SAP HANA Spark Controller 只能安装在一个节点上。可以考虑将它安装在运行 Ambari、Name Node 和 YARN Resource Manager 的节点上。必须配置该节点来与 Hive Metastore 进行通信。

可以手动或使用 Ambari 安装并配置 Spark Controller。

启动 Spark Controller 并检查 Spark Controller 日志 (/var/log/hanaes/hana_controller.log)，以理解并调试问题（如果有）。

检查 Spark Controller 是否在运行并在端口 7860（默认端口）上进行监听。

[root@hdpnode1 conf]# ps -aef |grep -i ^hanaes

hanaes 6064 1 0 Mar25 ? 02:37:24 /usr/lib/jvm/java-1.8.0-openjdk-1.8.0.111-1.b15.el7_2.ppc64le//bin/java -cp /usr/hdp/current/spark-client/lib/spark-assembly-1.6.2.2.5.0.0-1245-hadoop2.7.3.2.5.0.0-1245.jar::/etc/hive/conf:/usr/hdp/current/spark-client/lib/datanucleus-api-jdo-3.2.6.jar:/usr/hdp/current/spark-client/lib/datanucleus-core-3.2.10.jar:/usr/hdp/current/spark-client/lib/datanucleus-rdbms-3.2.9.jar:mysql-connector-java.jar:mysql-connector-java.jar:/usr/hdp/2.5.0.0-1245/tez/*:/usr/hdp/2.5.0.0-1245/tez/lib/*:/usr/hdp/2.5.0.0-1245/tez/conf:/usr/sap/spark/controller/bin/../conf:/usr/hdp/2.5.0.0-1245/hadoop/conf:/etc/hive/conf:../*:../lib/*:/usr/hdp/2.5.0.0-1245/hadoop/*:/usr/hdp/2.5.0.0-1245/hadoop/lib/*:/usr/hdp/2.5.0.0-1245/hadoop-hdfs/*:/usr/hdp/2.5.0.0-1245/hadoop-hdfs/lib/* -XX:PermSize=128m -XX:MaxPermSize=256m -Xmx8172m com.sap.hana.spark.network.Launcher

[root@hdpnode1 conf]# netstat -anp | grep LISTEN |grep 7860

tcp6 0 0 :::7860 :::*LISTEN 6064/java

从 SAP HANA 数据库访问 HDP 上的数据用以执行分析

按照下面的步骤，从 SAP HANA 访问存储在 HDP 上的数据。

在 SAP HANA Studio 中添加 SAP HANA 2.0 服务器，，如图 3 所示。图 3. 为 SAP HANA Studio 配置一个测试 SAP HANA 服务器

通过 IBM Power Systems 上运行的 SAP HANA Spark Controll