sql 多字段百分比匹配查询_sql

如此这般：

select * from (

select a.姓名,a.性别,a.身份z号,

b.姓名,b.性别,a.身份z号,

(case when a.姓名=b.姓名 then 1 else 0 end)*0.3+

(case when a.性别=b.性别 then 1 else 0 end)*0.1+

(case when a.身份z号=b.身份z号 then 1 else 0 end)*0.6 权重

from tableA a,tableA b) b

where 权重>0.6

order by 权重 desc

象你这种情况不要用SQL语句实现了,用字符串的相似度匹配算法把.就是每次读取答题答案一条记录的字段内容与标准答案做基于TOKEN的相似度计算,根据相似度给分.数据库不是万能的,象这类应用还是应该使用程序实现的

有两个全文索引是非常重要的，一个是如何字的文字，一个索引数据结构。分割方法基本上是一个二元分词法，最大匹配方法和统计方法。索引数据结构基本上是倒排索引结构。

字查询生成的索引大小的质量和准确性。在中文分词的发展，及早并经常使用的方法是一个二进制字的词汇，这种方法的基本原理是开展句子包含中国二元，没有一个字的意思，只是一个字的二进制索引。因此，该方法的分离的较大数目的话，在一个巨大的索引数，该查询将是无用的检索数据时，好处是简单的算法，将不会错过检索到的数据。后来发展的最大匹配的分割方法，其中分为子字的最大正向和反向的最大字。的原理和字典，生成公共字的字典，所分析句子的最大匹配字典中的字词的过程，因此，分割成有意义的词的句子链。正向最大匹配分词官员容易出错的部分决议字，如“珠宝和服装，”将要“和服”字分离。达梦数据库是用来改善逆向最大的分割方法，该方法是更积极的词的准确性提高。是最复杂的统计方法分割方法。使用隐马尔可夫链，这是一个字后，取决于前一个字的概率发生的概率的方法，最后一个单词出现所有的最大字的基础上的统计概率。这种新的名词和地名的识别方法是远高于最大匹配方法，文本的准确性随着样品的数量增加，分别。 />/>两个元的分割方法和统计方法不依赖于词典中，最大匹配的图像分割方法是依赖于词典，字典的内容所决定的结构的词语是好还是坏。

全文索引被称为倒排索引，倒排索引，因为每个单词的索引条目，根据索引项查找包含单词文本。因此，索引的话，唯一的唱片公司是文本到很多的关系。的索引词排序，根据包含分类文本的字的字定位。

步骤1）阅读整个句子的变量str，请转到步骤2

步骤2）句末可变字读一个字，去第3步

步骤3）查找单词在字典中保存的话。如果有保存的字，则转到步骤4，否则转到步骤5）

步骤4）如果它是最大的字典中的字，或超过的最大数目字（确定为新词），除去尾部条款的话，返回到步骤2

步骤5）读字一个字前，形式新词，请转至步骤3）

>词库和单词记忆的数据结构库字匹配算法

不停地使用这个词的内存层次结构

承担以下字典中的字：中国全国人民民主共和国

在存储器方式如下，其中每个方块代表一个字符，箭头指向的第一个字被安排在层中的

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/6808458.html

sql 多字段百分比匹配查询

发表评论

评论列表（0条）