sql 多字段百分比匹配查询

sql 多字段百分比匹配查询,第1张

如此这般:

select * from (

select a.姓名,a.性别,a.身份z号,

b.姓名,b.性别,a.身份z号,

(case when a.姓名=b.姓名 then 1 else 0 end)*0.3+

(case when a.性别=b.性别 then 1 else 0 end)*0.1+

(case when a.身份z号=b.身份z号 then 1 else 0 end)*0.6 权重

from tableA a,tableA b) b

where 权重>0.6

order by 权重 desc

象你这种情况不要用SQL语句实现了,用字符串的相似度匹配算法把.就是每次读取答题答案一条记录的字段内容与标准答案做基于TOKEN的相似度计算,根据相似度给分.数据库不是万能的,象这类应用还是应该使用程序实现的

有两个全文索引是非常重要的,一个是如何字的文字,一个索引数据结构。分割方法基本上是一个二元分词法,最大匹配方法和统计方法。索引数据结构基本上是倒排索引结构。

字查询生成的索引大小的质量和准确性。在中文分词的发展,及早并经常使用的方法是一个二进制字的词汇,这种方法的基本原理是开展句子包含中国二元,没有一个字的意思,只是一个字的二进制索引。因此,该方法的分离的较大数目的话,在一个巨大的索引数,该查询将是无用的检索数据时,好处是简单的算法,将不会错过检索到的数据。后来发展的最大匹配的分割方法,其中分为子字的最大正向和反向的最大字。的原理和字典,生成公共字的字典,所分析句子的最大匹配字典中的字词的过程,因此,分割成有意义的词的句子链。正向最大匹配分词官员容易出错的部分决议字,如“珠宝和服装,”将要“和服”字分离。达梦数据库是用来改善逆向最大的分割方法,该方法是更积极的词的准确性提高。是最复杂的统计方法分割方法。使用隐马尔可夫链,这是一个字后,取决于前一个字的概率发生的概率的方法,最后一个单词出现所有的最大字的基础上的统计概率。这种新的名词和地名的识别方法是远高于最大匹配方法,文本的准确性随着样品的数量增加,分别。 />/>两个元的分割方法和统计方法不依赖于词典中,最大匹配的图像分割方法是依赖于词典,字典的内容所决定的结构的词语是好还是坏。

全文索引被称为倒排索引,倒排索引,因为每个单词的索引条目,根据索引项查找包含单词文本。因此,索引的话,唯一的唱片公司是文本到很多的关系。的索引词排序,根据包含分类文本的字的字定位。

步骤1)阅读整个句子的变量str,请转到步骤2

步骤2)句末可变字读一个字,去第3步

步骤3)查找单词在字典中保存的话。如果有保存的字,则转到步骤4,否则转到步骤5)

步骤4)如果它是最大的字典中的字,或超过的最大数目字(确定为新词),除去尾部条款的话,返回到步骤2

步骤5)读字一个字前,形式新词,请转至步骤3)

>词库和单词记忆的数据结构库字匹配算法

不停地使用这个词的内存层次结构

承担以下字典中的字:中国全国人民民主共和国

在存储器方式如下,其中每个方块代表一个字符,箭头指向的第一个字被安排在层中的


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6808458.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-28
下一篇 2023-03-28

发表评论

登录后才能评论

评论列表(0条)

保存