圖形數(shù)據(jù)庫(Graph Database)是NoSQL數(shù)據(jù)庫家族中特殊的存在,用于存儲豐富的關(guān)系數(shù)據(jù),Neo4j 是目前最流行的圖形數(shù)據(jù)庫,支持完整的事務(wù),在屬性圖中,圖是由頂點(diǎn)(Vertex),邊(Edge)和屬性(Property)組成的,頂點(diǎn)和邊都可以設(shè)置屬性,頂點(diǎn)也稱作節(jié)點(diǎn),邊也稱作關(guān)系,每個節(jié)點(diǎn)和關(guān)系都可以由一個或多個屬性。Neo4j創(chuàng)建的圖是用頂點(diǎn)和邊構(gòu)建一個有向圖,其查詢語言cypher已經(jīng)成為事實上的標(biāo)準(zhǔn)。
關(guān)系型數(shù)據(jù)庫只對單個Join操作進(jìn)行優(yōu)化查詢,而多重Join操作查詢的性能顯著下降。圖形數(shù)據(jù)庫適合查詢關(guān)系數(shù)據(jù),由于圖形遍歷的局部性,不管圖形中由多少節(jié)點(diǎn)和關(guān)系,根據(jù)遍歷規(guī)則,Neo4j只訪問與遍歷相關(guān)的節(jié)點(diǎn),不受到總數(shù)據(jù)集大小的影響,從而保持期待的性能;相應(yīng)地,遍歷的節(jié)點(diǎn)越多,遍歷速度越慢,但是變慢是線性的,這使得圖形數(shù)據(jù)庫不適合做海量數(shù)據(jù)統(tǒng)計分析。對與存在大量豐富關(guān)系的數(shù)據(jù),遍歷的性能不受圖形數(shù)據(jù)量大小的影響,這使得Neo4j成為解決圖形問題的理想數(shù)據(jù)庫。
一,下載和安裝Neo4j
1,安裝Java JDK
Neo4j是基于Java的圖形數(shù)據(jù)庫,運(yùn)行Neo4j需要啟動JVM進(jìn)程,因此必須安裝JAVA SE的JDK。從Oracle官方網(wǎng)站下載 Java SE JDK,當(dāng)前的版本是JDK8。
2,下載Neo4j安裝文件
從Neo4j官網(wǎng)下載最新版本Neo4j 3.2 社區(qū)(Community)版本 “neo4j-community-3.2.0-windows。zip”,解壓到主目錄,“D:\Program Files\neo4j-community-3.2.”。
Neo4j應(yīng)用程序有如下主要的目錄結(jié)構(gòu):
bin目錄:用于存儲Neo4j的可執(zhí)行程序;
conf目錄:用于控制Neo4j啟動的配置文件;
data目錄:用于存儲核心數(shù)據(jù)庫文件;
plugins目錄:用于存儲Neo4j的插件;
3,創(chuàng)建系統(tǒng)環(huán)境變量
創(chuàng)建主目錄環(huán)境變量NEO4J_HOME,并把主目錄設(shè)置為變量值。
二,Neo4j的配置