Hive學(xué)習(xí)筆記總結(jié)

01.Hive是什么

1. Hive介紹

  • Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫(kù)表,并提供類SQL查詢功能。

  • Hive是SQL解析引擎,它將SQL語(yǔ)句轉(zhuǎn)譯成M/R Job然后在Hadoop執(zhí)行。

2. Hive架構(gòu)

  • 用戶接口,包括 CLI,JDBC/ODBC,WebUI

  • 元數(shù)據(jù)存儲(chǔ),通常是存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)如 mysql, derby 中

  • 解釋器、編譯器、優(yōu)化器、執(zhí)行器

  • Hadoop:用 HDFS 進(jìn)行存儲(chǔ),利用 MapReduce 進(jìn)行計(jì)算

Ps:hive的元數(shù)據(jù)并不存放在hdfs上,而是存儲(chǔ)在數(shù)據(jù)庫(kù)中(metastore),目前只支持 mysql、derby。H

網(wǎng)友評(píng)論