Zeppelin是一個基于Web的notebook,提供交互數(shù)據(jù)分析和可視化。后臺支持接入多種數(shù)據(jù)處理引擎,如spark,hive等。支持多種語言: Scala(Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等。本文主要介紹Zeppelin中Interpreter和SparkInterpreter的實(shí)現(xiàn)原理。
轉(zhuǎn)載請注明
http://www.cnblogs.com/shenh062326/p/6195064.html
安裝與使用
參考http://blog.csdn.net/jasonding1354/article/details/46822391
原理簡介
Interpreter
Zeppelin中最核心的概念是Interpreter,interpreter是一個插件允許用戶使用一個指定的語言或數(shù)據(jù)處理器。每一個Interpreter都屬于換一個InterpreterGroup,同一個InterpreterGroup的Interpreters可以相互引用,例如SparkSqlInterpreter 可以引用 SparkInterpreter 以獲取 SparkContext,因?yàn)樗麄儗儆谕粋€InterpreterGroup。當(dāng)前已經(jīng)實(shí)現(xiàn)的Interpreter有spark解釋器,python解釋器,SparkSQL解釋器,JDBC,Markdown和shell等。下圖是Zeppelin官網(wǎng)中介紹Interpreter的原理圖。