剖析Elasticsearch集群系列涵蓋了當(dāng)今最流行的分布式搜索引擎Elasticsearch的底層架構(gòu)和原型實例。

本文是這個系列的第一篇,在本文中,我們將討論的Elasticsearch的底層存儲模型及CRUD(創(chuàng)建、讀取、更新和刪除)操作的工作原理。

Elasticsearch是當(dāng)今最流行的分布式搜索引擎,GitHub、 SalesforceIQ、Netflix等公司將其用于全文檢索和分析應(yīng)用。在Insight,我們用到了Elasticsearch的諸多不同功能,比如:

  • 全文檢索

    • 比如找到與搜索詞項(term)最相關(guān)的維基百科文章。

  • 聚合

    • 比如在廣告網(wǎng)絡(luò)中,可視化的搜索詞項的競價直方圖。

  • 地理空間API

    • 比如在順風(fēng)車平臺,匹配最近的司機和乘客。

正是因為Elasticsearch如此流行并且就在我們身邊,我決定深入研究一下。本文,我將分享Elasticsearch的存儲模型和CRUD操作的工作原理。

 

當(dāng)我在思考分布式系統(tǒng)是如何工作時,我腦海里的圖案是這樣的: