lucene搜索的时候可以去掉重复的索引只取一条吗?

lucene搜索的时候可以去掉重复的索引只取一条吗?,第1张

这个可能是对数据库里的同一条记录建了多次索引就出现重复的了。maxrocray 写道理论上当然是可以的。不过你要写个比较复杂的filter,对重复的索引的那个不同的field进行过滤。过滤的规则,我想会根据你这个重复的索引的情况而定,可能会很复杂。所以,常规来说,我们会对索引进行优化和整理,不允许重复的索引。

filter是过滤的函数

首先要用setfilter函数设置过滤条件,才能用filter函数执行。

setfilter函数的参数是字符型,里面的字符串用于设置过滤的条件,例如dw_control.setfilter("emp_name = 'Tom'"),设置好过滤条件后,dw_control.filter()。两个函数配合使用。

至于返回值,返回值为整型,如果返回1,表示此函数成功执行,如果返回-1表示执行过程中出现错误。

文献管理工具中的过滤器的原理是:

(1)Filters的功能,参考文献导入EndNote后,让EndNote知道来源库的原始数据与EndNote哪个字段对应;

(2)如何查看和编辑Filters,Edit——Import Filters——Open Filter Manager,选中目标Filter,双击打开;

(3)文献直接导入与格式转换导入的本质,直接导入:有些数据库在导出数据的同时,已经直接呼叫其对应的Filter,让使用者不需再做「选择Filter」的动作,而能达到直接导入的感觉。例如wos核心合集导入endnote,默认采用了ISI-CE这个内置filter。

格式转换导入:而有些数据库仅有数据导出功能,可能导出成.txt、Excel、或 html,使用者需多一道「选择Filter」的手续,才能将这些数据再导入至 EndNote;

(4)EndNote如何规定导入数据库对应哪个内置Filter,EndNote-Help-Search for help on-目录-Direct Export-Output Formats

(5)Filter查看数据导入源字段与EndNote字段的对应,打开filter,查看Templates。左边是数据导入源的字段Tag,右侧是对应到endnote的字段Field,注意先定文献类型;


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10039113.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-04
下一篇 2023-05-04

发表评论

登录后才能评论

评论列表(0条)

保存