java的luence全文检索怎么做_教程

lucene是一个公用的全文索引组件，它的目标是把各种各样格式的数据转化成lucene特有的索引文件格式，这样才能通过lucene的高速检索机制进行全文检索。

你的数据来源可以是关系数据库，可以是word、execl、txt文档，可以是html网页，对于这些数据源，你必须将它们内部的数据读取出来，并封装成lucene的document实例，之后让lucene帮你构建索引。

举个例子：你的有一个用户数据库，里面存储了几十万的用户信息，你现在要对这个数据库进行全文索引，那么你要做的事情是：

1.写一段传统的JDBC程序，讲每条的用户信息从数据库读取出来

2.针对每条用户记录，建立一个lucene document

Document doc = new Document()

并根据你的需要，将用户信息的各个字段对应luncene document中的field 进行添加，如：

doc.add(new Field("NAME","USERNAME",Field.Store.YES,Field.Index.UN_TOKENIZED))

然后将该条doc加入到索引中，如： luceneWriter.addDocument(doc)

这样袱常递端郛得店全锭户就建立了lucene的索引库

3.编写对索引库的搜索程序（看lucene文档），通过对lucene的索引库的查找，你可以快速找到对应记录的ID

4.通过ID到数据库中查找相关记录

ITjob里学。习到的，希望对你有所帮助

1.启动eclipse，使用svn插件从https //svn apache org/repos/asf/lucene把trunk代码checkout出来。

2.如果你没有安装ant，那么先安装ant（ant.apache.org）。

3.进入cmd，切入到源代码目录（在lucene和solr目录的上一级）。

4.然后使用ant eclipse（如果你没有安装ivy的话，ant会提示你安装，按照提示安装）

5.在eclipse中创建java project，勾掉Use default location,选择luence，然后下一步直到完成导入lucene，同样的导入solr。

6.因为solr引用lucene，所以在solr的buildpath中加入对lucene项目引用。

欢迎分享，转载请注明来源：内存溢出

java的luence全文检索怎么做