zeppelin安装包下载
mkdir /data && cd /data
wget https://dlcdn.apache.org/zeppelin/zeppelin-0.10.0/zeppelin-0.10.0-bin-all.tgz
tar zxvf zeppelin-0.10.0-bin-all.tgz
ln -s /data/zeppelin-0.10.0-bin-all /data/zeppelin
zeppelin配置文件修改
Zeppelin配置分为两个部分,一个是Zeppelin Server,另一个则是Interpreter。其中,Zeppelin Server相关配置需要在启动Zeppelin Server之前进行配置。而Interpreter的配置则是可以在Zeppelin Server启动之后,在WEB界面进行配置。
注意:note book级别的配置会覆盖全局配置。
Zeppelin Server配置
zeppelin server的配置文件为zeppelin-env.sh以及zeppelin-site.xml
其中,
-
zeppelin-env.sh定义环境变量
-
zeppelin-site.xml定义系统属性
按照优先级顺序,zeppelin-env.sh文件中定义的配置会覆盖zeppelin-site.xml中定义的配置。
以下列出部分参数,更多参数可参考相关文件。
zeppelin-env.sh | zeppelin-site.xml | Default value | Description |
---|---|---|---|
ZEPPELIN_ADDR | zeppelin.server.addr | 127.0.0.1 | Zeppelin server binding address |
ZEPPELIN_PORT | zeppelin.server.port | 8080 | Zeppelin server portNote: Please make sure you’re not using the same port with Zeppelin web application development port (default: 9000). |
具体修改点
cd /data/zeppelin/conf
cp zeppelin-site.xml.template zeppelin-site.xml
将zeppelin.server.addr配置项修改为0.0.0.0,这样子其他机器才可以访问该zeppelin界面。
zeppelin默认端口使用8080,如果和你本地端口冲突可将其改为别的端口,本文档将端口修改为8008,也就是将zeppelin.server.port配置项修改为8008
cp zeppelin-env.sh.template zeppelin-env.sh
填入以下变量:
export JAVA_HOME=/data/jdk
各变量请根据自己环境进行设置。
Interpreter 配置
- 全局参数配置
首页右上角点击interpreter进入zeppelin所有支持的interpreter界面。
进入如下界面:
在该界面对interpreter进行的配置修改则是全局生效的,下面以flink为例,可以修改其中的properties来使该配置全局生效。
- note book级别参数配置
同样以flink为例,新建flink interpreter对应的note book,进行如下配置。
启动zeppelin
bin/zeppelin-daemon.sh start
此时如果你们没有创建logs文件夹以及run文件夹,那么会在zeppelin目录下自动创建,如下所示:
[root@hadoop zeppelin]# bin/zeppelin-daemon.sh start
Log dir doesn't exist, create /data/zeppelin/logs
Pid dir doesn't exist, create /data/zeppelin/run
Zeppelin start [ OK ]
此时浏览器输入zeppelin服务器ip:8008或者hostname:8008即可进入如下页面:
基本使用
点击Notebook,点击Create new note,填写文本名称以及选定flink interpreter,如下所示:
新建完之后进入如下页面:
本文为从大数据到人工智能博主「xiaozhch5」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://lrting.top/backend/2098/