信息检索的基本方法是什么

信息检索的基本方法是什么,第1张

信息检索的基本方法是:普通法、追溯法和分段法。

1、普通法:利用书目、文摘、索引等检索工具进行文献资料查找的方法。运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。普通法又可分为顺检法和倒检法。

2、追溯法:利用已有文献所附的参考文献不断追踪查找的方法,在没有检索工具或检索工具不全时,此法可获得针对性很强的资料,查准率较高,查全率较差。

3、分段法:追溯法和普通法的综合,它将两种方法分期、分段交替使用,直至查到所需资料为止。

扩展资料 

信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来。

信息检索的目标,或者说基本的任务,就是从一大堆信息中找到我们需要的某部分信息。进一步使之更加具体:信息检索的目标是在一大堆文档等非结构化信息中根据我们的需求挑选出我们需要的部分文档。

参考资料来源:百度百科-信息检索

1、明确你要查阅的主题

2、根据主题确定几个关键词

3、利用知网、万方数据库收索关键词,会有很多类似的文献

4、在搜索过程中,数据库会显示与你搜索内容相近的文献及关键词,你可以利用这些提示扩大搜索范围,以便获取更多有价值的文献

5、如果通过自己确定的关键词查不到类似文献,可尝试其他类似关键词(关键词的选取需要你平时的知识积累作为基础,如果平时积累不够或者你要搜索的文献是一个比较陌生的领域,那就需要你通过互联网多了解一些相关内容)

即简单检索、快速检索。检索的可选项少或者没有,输入查询词,就能快速得到结果。但检索的准确性差、精度低。

基本检索方法

一、布尔检索

利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。

(1)“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。

(2)“计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。

(3)“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。

检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。

二、截词检索

截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。

不同的系统所用的截词符也不同,常用的有、$、等。分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。下面以无限截词举例说明:

(1)后截断,前方一致。如:comput表示computer,computers,computing等。(2)前截断,后方一致。如:computer表示minicomputer,microcomputers等。

(3)中截断,中间一致。如comput表示minicomputer,microcomputers等。

截词检索也是一种常用的检索技术,是防止漏检的有效工具,尤其在西文检索中,更是广泛应用。截断技术可以作为扩大检索范围的手段,具有方便用户、增强检索效果的特点,但一定要合理使用,否则会造成误检。

三、原文检索

“原文”是指数据库中的原始记录,原文检索即以原始记录中的检索词与检索词间特定位置关系为对象的运算。原文检索可以说是一种不依赖叙词表而直接使用自由词的检索方法。

原文检索的运算方式,不同的检索系统有不同的规定,其差别是:规定的运算符不同;运算符的职能和使用范围不同。原文检索的运算符可以通称为位置运算符。从RECON、ORBIT和STAIRS三大软件对原文检索的规定,可以看出其运算符主要是以下4个级别:

(1)记录级检索,要求检索词出现在同一记录中;

(2)字段级检索,要求检索词出现在同一字段中;

(3)子字段或自然句级检索,要求检索词出现在同一子字段或同一自然句中;

(4)词位置检索,要求检索词之间的相互位置满足某些条件。

原文检索可以弥补布尔逻辑检索、截词方法检索的一些不足。运用原文检索方法,可以增强选词的灵活性,部分地解决布尔检索不能解决的问题,从而提高文献检索的水平和筛选能力。但是,原文检索的能力是有限的。从逻辑形式上看,它仅是更高级的布尔系统,因此存在着布尔逻辑本身的缺陷。

检索算符包括:布尔算符;截词检索符 ;限制检索符;位置逻辑检索符;加权检索。

它们的用法如下:

一、布尔逻辑算符:布尔检索式是采用逻辑加(“OR”或“+”)、逻辑乘(“AND”或“”) 和逻辑非(“NOT”或“—”)等算符,指定文献的标引词中必须存在的条件或不能出现的条件。

采用“OR”(“+”)算符时,检索式写作A OR B(即A + B),表明数据库中凡有检索词A或者B,或同时有A和B的记录均为命中记录。使用逻辑或可连接同一检索组面的多个同义词、近义词和相关词,扩大检索范围。

采用“AND”(“”)算符时,检索式写作A AND B(即A B),表明数据库中同时有检索词A和B的记录才为命中记录。逻辑与可增强检索的专指性,缩小检索范围。

采用“NOT”(“—”)算符时,检索式写作A NOT B(即A — B),表明数据库中凡有检索词A而不含检索词B的记录才为命中记录。使用逻辑非可以排除不希望出现的概念,增强检索的准确性。

二、截词检索算符:在实际检索中,常遇到词干相同、词义相近的检索词,或同一词的单、复数形式,动、名词形式,英美拼法等,所谓截词检索,就是将通配符如“”、“?”或“$”等等。

放在检索词中检索者认为合适的地方截断,用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中文献。

这样,检索者不必输入完整的检索词。截词方式有多种,按截断的字符数量分,有有限截断和无限截断;按截断的位置分,有后截断、前截断、中间截断。

三、限制检索算符:在编制检索式时,使用字段限制检索符可以限定检索词在数据库中出现的范围,对命中太多的记录再行筛选。

四、位置逻辑检索算符又称全文查找逻辑算符,相邻度检索算符,原文检索符。

由于布尔检索的“AND”运算要求AND两边的检索词在同一记录中同时存在才能命中文献,这就可能会引起误组配而造成大量误检,而位置逻辑检索是以原始记录中检索词与检索词间特定的位置关系为逻辑运算的对象,检索词用位置算符相连,就可以弥补布尔检索的缺陷。

此外,这种检索也不必依赖先组式词表而直接使用自由词进行检索,因而可使检索结果更准确。

扩展资料:

位置逻辑检索算符可分为:词位置检索算符、同句检索算符、同字段检索算符、同记录检索算符。

词位置检索算符:即要求检索词之间的相互位置满足某些条件而使用的检索算符,它们是: 

(W)与(nW)——(W)算符是“word”或“with”的缩写,表示此算符两边的检索词词序不能颠倒,两个词之间可有一个空格、或一个标点符号、或一个连接号。

(nW)则表示两个检索词之间最多嵌入n个词。例如,检索“CD-ROM”,则可用 ?S CD(W)ROM; 而用price(2W)inflation , 则可能检出price levels and inflation。

(N)与(nN)——(N)算符是“near”的缩写,表示此算符两边的检索词必须紧密相连,此间不允许插入其他单词或字母,但词序可以颠倒,而(nN)算符则表示在两个检索词之间最多可以插入n个单词,且词序可以颠倒。

(X)与(nX)——(X)算符要求其两边的检索词完全一致,并以指定的顺序相邻,中间不允许插入任何单词或字母;(nX)算符则表示两边的检索词之间最多可以插入n个单元词,但两边的检索词也必须一致。

词位置检索是很有用的检索技术,它可以规定词组中各词的前后次序,防止错误的搭配和输出;它也可以替代词组中的禁用词。

DIALOG系统有9个禁用词:AND、FOR、THE、AN、FROM、TO、BY、OF、WITH,如果在编制检索式时碰到禁用词,就要用词位置算符代替它。

同句检索算符:要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制,可用算符(S)(S是Sentence的首字母)。同句检索放宽了词位置检索的要求,使表达同一概念但不满足词位置条件的文献也可以被检索出来,从而提高了查全率。

同字段检索算符:对同句检索条件进一步放宽,可以用算符(F)、(L)、进行同字段检索。(F)(“Field”的首字母)表示各检索词必须同时出现在文献记录的某个或某些字段中,词序可变,字段类型可用后缀符限定。

此外,还有同记录检索符,用位置算符(C)要求它两侧的检索词同在一条数据库记录中出现,如A(C)B,其检索效果与布尔算符的检索式A AND B相同。

网络信息资源检索的步骤

一、分析信息资源,明确检索要求

信息资源的主题内容、研究要点、学科范围、语种范围、时间范围、文献类型等

二、选择信息检索系统,确定检索途径

1、选择信息检索系统的方法:

(1)在信息检索系统齐全的情况下,首先使用信息检索工具指南来指导选择;

(2)在没有信息检索工具指南的情况下,可以采用浏览图书馆、信息所的信息检索工具室所陈列的信息检索工具的方式进行选择;

(3)从所熟悉的信息检索工具中选择;

(4)主动向工作人员请教;

(5)通过网络在线帮助选择。

2、选择信息检索系统的原则:

(1)收录的文献信息需含盖检索课题的主题内容;

(2)就近原则,方便查阅;

(3)尽可能质量较高、收录文献信息量大、报道及时、索引齐全、使用方便;

(4)记录来源,文献类型,文种尽量满足检索课题的要求;

(5)数据库是否有对应的印刷型版本;

(6)根据经济条件选择信息检索系统;

(7)根据对检索信息熟悉的程度选择;

(8)选择查出的信息相关度高的网络搜索引擎。

三、选择检索词

确定检索词的基本方法:选择规范化的检索词;使用各学科在国际上通用的、国外文献中出现过的术语作检索词;找出课题涉及的隐性主题概念作检索词;选择课题核心概念作检索词;注意检索词的缩写词、词形变化以及英美的不同拼法;联机方式确定检索词。

四、制定检索策略,查阅检索工具

1、制定检索策略的前提条件是要了解信息检索系统的基本性能,基础是要明确检索课题的内容要求和检索目的,关键是要正确选择检索词和合理使用逻辑组配。

2、产生误检的原因可能有:一词多义的检索词的使用;检索词与英美人的姓名、地址名称、期刊名称相同;不严格的位置算符的运用;检索式中没有使用逻辑非运算;截词运算不恰当;组号前忘记输入指令“s”;逻辑运算符号前后未空格;括号使用不正确;从错误的组号中打印检索结果;检索式中检索概念太少。

3、产生漏检的原因或检索结果为零的原因可能有:没有使用足够的同义词和近义词或隐含概念;位置算符用得过严、过多;逻辑“与”用得太多;后缀代码限制得太严;检索工具选择不恰当;截词运算不恰当;单词拼写错误、文档号错误、组号错误、括号不匹配等。

4、提高查准率的方法有:使用下位概念检索;将检索词的检索范围限在篇名、叙词和文摘字段;使用逻辑“与”或逻辑“非”;运用限制选择功能;进行进阶检或高级检索。

5、提高查全率的方法有:选择全字段中检索;减少对文献外表特征的限定;使用逻辑“或”;利用截词检索;使用检索词的上位概念进行检索;把(W)算符改成(1N),(2N);进入更合适的数据库查找。

五、处理检索结果

将所获得的检索结果加以系统整理,筛选出符合课题要求的相关文献信息,选择检索结果的著录格式,辨认文献类型、文种、著者、篇名、内容、出处等项记录内容,输出检索结果。

六、原始文献的获取

1、利用二次文献检索工具获取原始文献

2、利用馆藏目录和联合目录获取原始文献

3、利用文献出版发行机构获取原始文献

4、利用文献著者获取原始文献

5、利用网络获取原始文献

参考资料:

>

文献生产的积累性、广泛性和文献利用的专指性,是文献检索的社会需求。为此,文献工作者便在搜集文献并使之有序化的同时,还编制各种检索工具或建立各种数据库等,这些都是使文献具有可检性以适应社会需求的业务基础工作。

一.文献检索及其原理

何谓文献检索?文献检索是一个查找文献的过程。《中华人民共和国国家标准情报与文献工作基本述语》(GB4884-85)对文献检索定义为:“从存贮的文献中找出特定文献的过程。”联合国教科文组织《文献与情报工作辞典》(1976年版)则定义为:“从一个文献集合中查找专门文献的活动、方法与程序。”两者表述方式虽有不同,但其内涵是一致的。即文献检索是从众多的文献群中查找出符合特定需要的文献信息的全部活动过程。从这个意义上讲,文献检索也就是信息检索(Information Retrieval)。按其查找对象的不同可分为三种不同类型的检索:

(一)书目检索,这是以检索工具(书目、索引、文摘、题录)为检索对象的一种检索。凡是查找某一主题(时代、地区、著者、文种等)有关文献的检索过程,均为书目检索。如“汕头经济特区投资环境研究都有哪些文献?”其检索结果是一条条的书目记录,包括论著题名、作者、文献出处等书目数据记录。

(二)事实检索(Fact Retrieval),这是以事实为检索对象,要求查出文献中的某些基本事实记录。如“汕头第一城与安居工程项目,李嘉诚先生各投资多少?他是否出席了项目签字仪式?”“汕头经济特区三资企业,生产高新技术产品最有发展前途的厂家有哪几家?”这不仅需要查出记录这些事实的资料,而且还要从中进行分析、比较,才能作出肯定性的回答。因此,事实检索也译作事项检索,属于数据检索的范畴。

(三)数据检索(Data Retrieval),这是以数据为检索对象要求查出文献中所载的专门数据,包括统计数据、计算公式、图表,以及物性数据、化学物质数据等。如“1994年汕头港进出口贸易额各多少?”“海湾大桥跨度有多长?建在妈屿岛上的铁索吊塔有多高?所用水泥、钢绳性能如何?”等,其检索结果都是经过高度浓缩可供直接利用的数据情报。

上述三种类型检索所提供的书目记录或事实性答案或数据,均来源于文献中的知识记录,属信息检索的范畴。文献检索是信息检索中最为主要的检索。

文献检索与一般的阅览既有联系又有区别。阅览是获取新知识的手段,也是文献检索筛选文献内容的过程,其中情报意识是关键。其区别在于:首先,所涉文献范围及其用书的目的有特殊需要与一般需要之别。文献检索是在文献海洋查找特定信息,强烈的情报意识支配着检索的全过程。而阅览往往是在一本书、一篇文章、一张报纸等个体文献中获取或多或少的新知识。其次,文献检索需要利用一定的工具,如书目、索引等检索工具;字典、词典、百科全书、手册、年鉴等参考工具书以及数据库等检索系统,否则事倍工半,甚至无从下手。一般的文献阅览只是遇到疑难问题时才利用参考工具书。其中利用工具书释疑解难的过程即是文献检索的过程。

文献检索与文献存贮有着密切的关系。存贮是为了有效的检索和利用;检索必须遵循文献存贮的方法;检索是存贮文献的逆过程,即用什么方法存贮文献信息,就用同样的方法把所需的文献或相关的知识,如数据、信息查找出来。这就是文献检索的基本原理。

文献存贮与检索示意图:

存贮过程 检索过程

文献内容 检索需要

│内容 │内容

↓分析 ↓分析

内容概念 内容概念

│文献 │

↓描述 ↓

信 息 检 索 语 言

↓ ↓

检索标识 提问标识

↓ ↓

�检 索 工 具 或 检 索 系 统

│ │

└—————→结 果←—————┘

还可参照:

>

CALIS+是中国高等教育图书馆文献联合目录系统,它提供了四种检索方式:

1、简单检索:用户只需在检索框中输入关键词,系统将根据关键词匹配检索到相关文献。

2、高级检索:用户可以根据具体需求,在检索框中输入多个检索词,然后选择“与”、“或”、“非”等逻辑关系,从而提高检索的精准度。

3、主题分类检索:用户可以选择主题分类,在相应的主题分类中进行检索。

4、全文检索:用户可以根据全文内容进行检索。

基本步骤如下:

简单检索:在检索框中输入关键词,点击“检索”按钮,系统将根据关键词匹配检索到相关文献。

高级检索:在检索框中输入多个检索词,然后选择“与”、“或”、“非”等逻辑关系,点击“检索”按钮,系统将根据输入的逻辑关系和检索词匹配检索到相关文献。

主题分类检索:在主题分类栏目中选择相应的主题,点击“检索”按钮,系统将匹配检索到相关文献。

全文检索:在检索框中输入全文内容,点击“检索”按钮,系统将根据输入的内容匹配检索到相关文献。

以上就是关于信息检索的基本方法是什么全部的内容,包括:信息检索的基本方法是什么、查阅文献的基本流程是什么、什么是基本检索等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zz/9509538.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-29
下一篇2023-04-29

发表评论

登录后才能评论

评论列表(0条)

    保存