Spark有幾種部署的模式,單機(jī)版、集群版等等,平時(shí)單機(jī)版在數(shù)據(jù)量不大的時(shí)候可以跟傳統(tǒng)的java程序一樣進(jìn)行斷電調(diào)試、但是在集群上調(diào)試就比較麻煩了...遠(yuǎn)程斷點(diǎn)不太方便,只能通過(guò)Log的形式進(jìn)行數(shù)據(jù)分析,利用spark ui做性能調(diào)整和優(yōu)化。

那么本篇就介紹下如何利用Ui做性能分析,因?yàn)楸救说慕?jīng)驗(yàn)也不是很豐富,所以只能作為一個(gè)入門(mén)的介紹。

大體上會(huì)按照下面的思路進(jìn)行講解:

  • 怎么訪問(wèn)Spark UI

  • SparkUI能看到什么東西?job,stage,storage,environment,excutors

  • 調(diào)優(yōu)的一些經(jīng)驗(yàn)總結(jié)

Spark UI入口

如果是單機(jī)版本,在單機(jī)調(diào)試的時(shí)候輸出信息中已經(jīng)提示了UI的入口:

17/02/26 13:55:48 INFO SparkEnv: Registering OutputCommitCoordinator17/02/26 13:55:49 INFO Utils: Successfully started service 'SparkUI' on port 4040.17/02/26&n
        
		

網(wǎng)友評(píng)論