序:map客戶(hù)端使用jdbc向數(shù)據(jù)庫(kù)發(fā)送查詢(xún)語(yǔ)句,將會(huì)拿到所有數(shù)據(jù)到map的客戶(hù)端,安裝jdbc的原理,數(shù)據(jù)全部緩存在內(nèi)存中,但是內(nèi)存沒(méi)有出現(xiàn)爆掉情況,這是因?yàn)?.3以后,對(duì)jdbc進(jìn)行了優(yōu)化,改進(jìn)jdbc內(nèi)部原理,將數(shù)據(jù)寫(xiě)入磁盤(pán)存儲(chǔ)了。
原文和作者一起討論: http://www.cnblogs.com/intsmaze/p/6775034.html
微信:intsmaze
Sqoop是apache旗下一款“Hadoop和關(guān)系數(shù)據(jù)庫(kù)服務(wù)器之間傳送數(shù)據(jù)”的工具。Sqoop架構(gòu)非常簡(jiǎn)單,其整合了Hive、Hbase和Oozie,通過(guò)map-reduce任務(wù)來(lái)傳輸數(shù)據(jù),從而提供并發(fā)特性和容錯(cuò)。
導(dǎo)入數(shù)據(jù):MySQL,Oracle導(dǎo)入數(shù)據(jù)到Hadoop的HDFS、HIVE、HBASE等數(shù)據(jù)存儲(chǔ)系統(tǒng)。
導(dǎo)出數(shù)據(jù):從Hadoop的文件系統(tǒng)中導(dǎo)出數(shù)據(jù)到關(guān)系數(shù)據(jù)庫(kù)mysql等。