久久精品水蜜桃av综合天堂,久久精品丝袜高跟鞋,精品国产肉丝袜久久,国产一区二区三区色噜噜,黑人video粗暴亚裔
站長百科 | 數(shù)字化技能提升教程 數(shù)字化時代生存寶典
首頁
數(shù)字化百科
電子書
建站程序
開發(fā)
服務器
辦公軟件
開發(fā)教程
服務器教程
軟件使用教程
運營教程
熱門電子書
WordPress教程
寶塔面板教程
CSS教程
Shopify教程
導航
程序頻道
推廣頻道
網(wǎng)賺頻道
人物頻道
網(wǎng)站程序
網(wǎng)頁制作
云計算
服務器
CMS
論壇
網(wǎng)店
虛擬主機
cPanel
網(wǎng)址導航
WIKI使用導航
WIKI首頁
最新資訊
網(wǎng)站程序
站長人物
頁面分類
使用幫助
編輯測試
創(chuàng)建條目
網(wǎng)站地圖
站長百科導航
站長百科
主機偵探
IDCtalk云說
跨境電商導航
WordPress啦
站長專題
網(wǎng)站推廣
網(wǎng)站程序
網(wǎng)站賺錢
虛擬主機
cPanel
網(wǎng)址導航專題
云計算
微博營銷
虛擬主機管理系統(tǒng)
開放平臺
WIKI程序與應用
美國十大主機
編輯“
Lucene
”
人物百科
|
營銷百科
|
網(wǎng)賺百科
|
站長工具
|
網(wǎng)站程序
|
域名主機
|
互聯(lián)網(wǎng)公司
|
分類索引
跳轉(zhuǎn)至:
導航
、?
搜索
警告:
您沒有登錄。如果您做出任意編輯,您的IP地址將會公開可見。如果您
登錄
或
創(chuàng)建
一個賬戶,您的編輯將歸屬于您的用戶名,且將享受其他好處。
反垃圾檢查。
不要
加入這個!
[[Image:Lucene_Logo.gif|right]] '''Lucene'''是[[Apache]]軟件基金會jakarta項目組的一個子項目,是一個[[開源]]代碼的全文檢索引擎工具包,即它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎(英文與德文兩種西方語言)。Lucene的目的是為軟件開發(fā)人員提供一個簡單易用的工具包,以方便的在目標系統(tǒng)中實現(xiàn)全文檢索的功能,或者是以此為基礎建立起完整的全文檢索引擎。 '''Lucene'''的原作者是Doug Cutting,他是一位資深全文索引/檢索專家,曾經(jīng)是[[V-Twin]][[搜索引擎]]的主要開發(fā)者,后在Excite擔任高級系統(tǒng)架構(gòu)設計師,目前從事于一些[[Internet]]底層架構(gòu)的研究。早先發(fā)布在作者自己的<nowiki>http://www.lucene.com/</nowiki>,后來發(fā)布在SourceForge,2001年年底成為apache軟件基金會jakarta的一個子項目:<nowiki>http://jakarta.apache.org/lucene/</nowiki>。 ==發(fā)布歷史== Lucene最初是由Doug Cutting開發(fā)的,在SourceForge的網(wǎng)站上提供下載。在2001年9月做為高質(zhì)量的開源[[Java]]產(chǎn)品加入到Apache軟件基金會的 Jakarta家族中。隨著每個版本的發(fā)布,這個項目得到明顯的增強,也吸引了更多的用戶和開發(fā)人員。2004年7月,Lucene1.4版正式發(fā)布,10月的1.4.2版本做了一次bug修正。顯示了Lucene的發(fā)布歷史。 *0.01 2000年3月 第一個開源版本(SourceForge) *1.0 2000年10月 *1.01b 2001年7月 最后的SourceForge版本 *1.2 2002年6月 第一個Apache Jakarta版本 *1.3 2003年12月 復合索引格式,查詢分析器增加,遠程搜索,token定位,可擴展的[[API]] *1.4 2004年7月 Sorting, span queries, term vectors *1.4.1 2004年8月 排序性能的bug修正 *1.4.2 2004年10月 IndexSearcher optimization and misc. fixes *1.4.3 2004年冬 Misc. fixes2.4.1 2009年3月8日發(fā)布新版本 *2.3.0 2008年1月 更新為2.3.0 *2.4.0 2008年10月 更新為2.4.0 *2.4.1 2009年 5月 更新為 2.4.1 *2.9.0 2009年9月25號 更新為2.9.0 *2.9.1 2009年11月6號 更新為2.9.1 *3.0.0 2009年11月25號 更新為3.0.0 ==特點優(yōu)勢== 作為一個開放源代碼項目,Lucene從問世之后,引發(fā)了開放源代碼社群的巨大反響,程序員們不僅使用它構(gòu)建具體的全文檢索應用,而且將之集成到各種系統(tǒng)軟件中去,以及構(gòu)建Web應用,甚至某些商業(yè)軟件也采用了Lucene作為其內(nèi)部全文檢索子系統(tǒng)的核心。apache軟件基金會的網(wǎng)站使用了Lucene作為全文檢索的引擎,[[IBM]]的開源軟件[[Eclipse]]的2.1版本中也采用了Lucene作為幫助子系統(tǒng)的全文索引引擎,相應的IBM的商業(yè)軟件Web Sphere中也采用了Lucene。Lucene以其開放源代碼的特性、優(yōu)異的索引結(jié)構(gòu)、良好的系統(tǒng)架構(gòu)獲得了越來越多的應用。 Lucene是一個高性能、可伸縮的信息搜索(IR)庫。它使你可以為你的應用程序添加索引和搜索能力。Lucene是用java實現(xiàn)的成熟的、免費的開源項目,是著名的Apache Jakarta大家庭的一員,并且基于在Apache軟件許可 [ASF, License]。同樣,Lucene是當前與近幾年內(nèi)非常流行的免費的Java信息搜索(IR)庫。 Lucene作為一個全文檢索引擎,其具有如下突出的優(yōu)點: *(1)索引文件格式獨立于應用平臺。Lucene定義了一套以8位[[字節(jié)]]為基礎的索引文件格式,使得兼容系統(tǒng)或者不同平臺的應用能夠共享建立的索引文件。 *(2)在傳統(tǒng)全文檢索引擎的倒排索引的基礎上,實現(xiàn)了分塊索引,能夠針對新的文件建立小文件索引,提升索引速度。然后通過與原有索引的合并,達到優(yōu)化的目的。 *(3)優(yōu)秀的[[面向?qū)ο骫]的系統(tǒng)架構(gòu),使得對于Lucene擴展的學習難度降低,方便擴充新功能。 *(4)設計了獨立于語言和文件格式的文本分析接口,索引器通過接受Token流完成索引文件的創(chuàng)立,用戶擴展新的語言和文件格式,只需要實現(xiàn)文本分析的接口。 *(5)已經(jīng)默認實現(xiàn)了一套強大的查詢引擎,用戶無需自己編寫代碼即使系統(tǒng)可獲得強大的查詢能力,Lucene的查詢實現(xiàn)中默認實現(xiàn)了布爾操作、模糊查詢(Fuzzy Search])、分組查詢等等。 面對已經(jīng)存在的商業(yè)全文檢索引擎,Lucene也具有相當?shù)膬?yōu)勢。 '''首先''',它的開發(fā)源代碼發(fā)行方式(遵守Apache Software License]),在此基礎上程序員不僅僅可以充分的利用Lucene所提供的強大功能,而且可以深入細致的學習到全文檢索引擎制作技術和面相對象編程的實踐,進而在此基礎上根據(jù)應用的實際情況編寫出更好的更適合當前應用的全文檢索引擎。在這一點上,商業(yè)軟件的靈活性遠遠不及Lucene。 '''其次''',Lucene秉承了開放源代碼一貫的架構(gòu)優(yōu)良的優(yōu)勢,設計了一個合理而極具擴充能力的面向?qū)ο蠹軜?gòu),程序員可以在Lucene的基礎上擴充各種功能,比如擴充中文處理能力,從文本擴充到[[HTML]]、[[[PDF]]]等等文本格式的處理,編寫這些擴展的功能不僅僅不復雜,而且由于Lucene恰當合理的對系統(tǒng)設備做了程序上的抽象,擴展的功能也能輕易的達到跨平臺的能力。 '''最后''',轉(zhuǎn)移到apache軟件基金會后,借助于apache軟件基金會的網(wǎng)絡平臺,程序員可以方便的和開發(fā)者、其它程序員交流,促成資源的共享,甚至直接獲得已經(jīng)編寫完備的擴充功能。最后,雖然Lucene使用Java語言寫成,但是開放源代碼社區(qū)的程序員正在不懈的將之使用各種傳統(tǒng)語言實現(xiàn)(例如[[.net]] framework),在遵守Lucene索引文件格式的基礎上,使得Lucene能夠運行在各種各樣的平臺上,系統(tǒng)管理員可以根據(jù)當前的平臺適合的語言來合理的選擇。 ==設計原理== lucene的檢索算法屬于索引檢索,即用空間來換取時間,對需要檢索的文件、字符流進行全文索引,在檢索的時候?qū)λ饕M行快速的檢索,得到檢索位置,這個位置記錄檢索詞出現(xiàn)的文件路徑或者某個[[關鍵詞]]。 在使用[[數(shù)據(jù)庫]]的項目中,不使用數(shù)據(jù)庫進行檢索的原因主要是:數(shù)據(jù)庫在非精確查詢的時候使用查詢語言“l(fā)ike %keyword%”,對數(shù)據(jù)庫進行查詢是對所有記錄遍歷,并對字段進行 “%keyword%”匹配,在數(shù)據(jù)庫的數(shù)據(jù)龐大以及某個字段存儲的數(shù)據(jù)量龐大的時候,這種遍歷是致命的,它需要對所有的記錄進行匹配查詢。因此,lucene主要適用于文檔集的全文檢索,以及海量數(shù)據(jù)庫的模糊檢索,特別是對數(shù)據(jù)庫的[[xml]]或者大數(shù)據(jù)的字符類型。 ==安裝使用== [[Lucene入門使用]] ==相關資源== *官方地址:http://lucene.apache.org/ *軟件類型:開源軟件 *下載地址:http://www.apache.org/dyn/closer.cgi/lucene/java/ *推薦閱讀:[http://down.zzbaike.com/ebook/ajaxlucene-591.html 征服AJAX + LUCENE構(gòu)建搜索引擎] ==相關條目== *[[搜索引擎]] *[[Apache]] ==參考來源== *[http://www.chedong.com/tech/lucene.html 參考來源1] *[http://baike.baidu.com/view/371811.htm?fr=ala0_1_1 參考來源2] [[category:搜索引擎|L]] [[category:開放源代碼|L]] [[category:Lucene|L]]
摘要:
請注意,您對站長百科的所有貢獻都可能被其他貢獻者編輯,修改或刪除。如果您不希望您的文字被任意修改和再散布,請不要提交。
您同時也要向我們保證您所提交的內(nèi)容是您自己所作,或得自一個不受版權保護或相似自由的來源(參閱
Wordpress-mediawiki:版權
的細節(jié))。
未經(jīng)許可,請勿提交受版權保護的作品!
取消
編輯幫助
(在新窗口中打開)
取自“
http://kktzf.com.cn/wiki/Lucene
”