java的luence全文检索怎么做_sql

lucene是一个公用的全文索引组件，它的目标是把各种各样格式的数据转化成lucene特有的索引文件格式，这样才能通过lucene的高速检索机制进行全文检索。

你的数据来源可以是关系数据库，可以是word、execl、txt文档，可以是html网页，对于这些数据源，你必须将它们内部的数据读取出来，并封装成lucene的document实例，之后让lucene帮你构建索引。

举个例子：你的有一个用户数据库，里面存储了几十万的用户信息，你现在要对这个数据库进行全文索引，那么你要做的事情是：

1.写一段传统的JDBC程序，讲每条的用户信息从数据库读取出来

2.针对每条用户记录，建立一个lucene document

Document doc = new Document()

并根据你的需要，将用户信息的各个字段对应luncene document中的field 进行添加，如：

doc.add(new Field("NAME","USERNAME",Field.Store.YES,Field.Index.UN_TOKENIZED))

然后将该条doc加入到索引中，如： luceneWriter.addDocument(doc)

这样袱常递端郛得店全锭户就建立了lucene的索引库

3.编写对索引库的搜索程序（看lucene文档），通过对lucene的索引库的查找，你可以快速找到对应记录的ID

4.通过ID到数据库中查找相关记录

ITjob里学。习到的，希望对你有所帮助

三种索引类型分别是：

1、主键索引：不允许具有索引值相同的行，从而禁止重复的索引或键值。系统在创建该索引时检查是否有重复的键值，并在每次使用 INSERT 或 UPDATE 语句添加数据时进行检查。

2、聚集索引：指数据库表行中数据的物理顺序与键值的逻辑（索引）顺序相同。一个表只能有一个聚集索引，因为一个表的物理顺序只有一种情况。

3、非聚集索引：索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同。非聚集索引的叶层不包含数据页。相反，叶节点包含索引行。

扩展资料

聚集索引对于那些经常要搜索范围值的列特别有效。使用聚集索引找到包含第一个值的行后，便可以确保包含后续索引值的行在物理相邻。

例如，如果应用程序执行的一个查询经常检索某一日期范围内的记录，则使用聚集索引可以迅速找到包含开始日期的行，然后检索表中所有相邻的行，直到到达结束日期。

频繁更改的列这将导致整行移动，因为 SQL Server 必须按物理顺序保留行中的数据值。这一点要特别注意，因为在大数据量事务处理系统中数据是易失的。来自聚集索引的键值由所有非聚集索引作为查找键使用，因此存储在每个非聚集索引的叶条目内。

参考资料来源：百度百科-非聚集索引

参考资料来源：百度百科-聚集索引

参考资料来源：百度百科-唯一索引

欢迎分享，转载请注明来源：内存溢出

java的luence全文检索怎么做