Lucene是apache軟件基金會(huì)4 jakarta項(xiàng)目組的一個(gè)子項(xiàng)目,是一個(gè)開放源代碼的全文檢索引擎工具包,但它不是一個(gè)完整的全文檢索引擎,而是一個(gè)全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎。Lucene的目的是為軟件開發(fā)人員提供一個(gè)簡單易用的工具包.
粘貼這句話的意思就是想說明 Lucene僅僅是一個(gè)工具包,搜索引擎的工具包.
有人會(huì)問?Lucene和solr的區(qū)別,solr是一個(gè)搜索系統(tǒng),打個(gè)比方,就如servlet和struts2的區(qū)別 Lucene就是servlet,solr就好比solr,solr封裝了Lucene.
下面說說Lucene的原理:
我們使用Lucene,其實(shí)使用的是他的倒排查詢
什么是倒排查詢?舉個(gè)例子
新華字典,我們都用過吧,新華字典分為兩部分,第一部門就是目錄的邊旁部首,第二部分就是正文,一個(gè)一個(gè)字的解釋,
我們?cè)谟眯氯A字典的時(shí)候,一般我們都是通過邊旁部首找字,沒有人一頁一頁的翻字典找字吧.
Lucene的倒排就是如此,他會(huì)檢索文本,數(shù)據(jù)庫,web網(wǎng)頁,在把內(nèi)容分詞,就像邊旁部首
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動(dòng)安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識(shí)別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動(dòng)安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26