向量模型的基本简介

向量模型的基本简介,第1张

假设序偶对 的权重 是准确的,非二元的。更进一步,在查询串中的索引术语也被赋予权重。假设 是序偶对 的权重,且 >0。查询向量 ,t表示数据库中索引术语的数目。和布尔模型中的一样,文档Dj的向量 。

因此,文档Dj和用户查询串q以t维向量的形式表示如图2.1所示。该向量模型计算出文档Dj关于查询串q的相关度,即向量 的相关性,这种相关性可以通过余(cosine)法则被量化:

q

图2.1 的余弦值即为

其中 和 是文档和查询向量的范数(norms)。元素 并不影响返回的结果文档集,因为它对数据库中所有的文档都是一样的。元素 在文档空间中提供标准化。因为 ,所以 。这样该向量模型根据查询的相关度来标记文档的秩,而在布尔模型中文档相对于查询串,只有相关和不相关两种状态。因此即使有的文档只是部分匹配查询串,由于它相对于查询串具有较高的相关度,也会被返回。为了计算文档的秩,我们首先需要知道定义索引术语权重的方法。

首先你的这个里面的for循环是不是可以不要。

while都已经做rs是否为空的判断了,你再做一遍是不是有点多此一举,你的意思是不是这个意思,我们理解错吧!

while (rs.next()) {

for (int i = 1i <= columnCounti++){

list.add(rs.getString(i))

}

改为:

while (rs.next()) {

list.add(rs.getString(i))

}


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/sjk/6637689.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-26
下一篇2023-03-26

发表评论

登录后才能评论

评论列表(0条)

    保存