向量模型的基本简介_sql

假设序偶对的权重是准确的，非二元的。更进一步，在查询串中的索引术语也被赋予权重。假设是序偶对的权重，且 >0。查询向量 ,t表示数据库中索引术语的数目。和布尔模型中的一样，文档Dj的向量。

因此，文档Dj和用户查询串q以t维向量的形式表示如图2.1所示。该向量模型计算出文档Dj关于查询串q的相关度，即向量的相关性，这种相关性可以通过余（cosine）法则被量化：

图2.1 的余弦值即为

其中和是文档和查询向量的范数（norms）。元素并不影响返回的结果文档集，因为它对数据库中所有的文档都是一样的。元素在文档空间中提供标准化。因为，所以。这样该向量模型根据查询的相关度来标记文档的秩，而在布尔模型中文档相对于查询串，只有相关和不相关两种状态。因此即使有的文档只是部分匹配查询串，由于它相对于查询串具有较高的相关度，也会被返回。为了计算文档的秩，我们首先需要知道定义索引术语权重的方法。

首先你的这个里面的for循环是不是可以不要。

while都已经做rs是否为空的判断了，你再做一遍是不是有点多此一举，你的意思是不是这个意思，我们理解错吧！

while (rs.next()) {

for (int i = 1i <= columnCounti++){

list.add(rs.getString(i))

}

改为：

while (rs.next()) {

list.add(rs.getString(i))

}

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/sjk/6637689.html

向量模型的基本简介

发表评论

评论列表（0条）