剖析Elasticsearch集群系列涵蓋了當(dāng)今最流行的分布式搜索引擎Elasticsearch的底層架構(gòu)和原型實(shí)例。

本文是這個(gè)系列的第一篇,在本文中,我們將討論的Elasticsearch的底層存儲(chǔ)模型及CRUD(創(chuàng)建、讀取、更新和刪除)操作的工作原理。

Elasticsearch是當(dāng)今最流行的分布式搜索引擎,GitHub、 SalesforceIQ、Netflix等公司將其用于全文檢索和分析應(yīng)用。在Insight,我們用到了Elasticsearch的諸多不同功能,比如:

  • 全文檢索

    • 比如找到與搜索詞項(xiàng)(term)最相關(guān)的維基百科文章。

  • 聚合

    • 比如在廣告網(wǎng)絡(luò)中,可視化的搜索詞項(xiàng)的競(jìng)價(jià)直方圖。

  • 地理空間API

    • 比如在順風(fēng)車平臺(tái),匹配最近的司機(jī)和乘客。

正是因?yàn)镋lasticsearch如此流行并且就在我們身邊,我決定深入研究一下。本文,我將分享Elasticsearch的存儲(chǔ)模型和CRUD操作的工作原理。

 

當(dāng)我在思考分布式系統(tǒng)是如何工作時(shí),我腦海里的圖案是這樣的: