
KYamamoto
(Koka Women's College,38 Kadonocho,Nishikyogoku,Ukyo,Kyoto 571,Japan)
NNishiwaki
(Nara University,1500 Misasagicho,Nara 631,Japan)
摘要 JAFOV是一个描述日本脊椎动物化石标本的数据库,存储了大约4500个标本的有关数据。数据库于1982年建立在日本Kyoto大学数据处理中心的大型机上,并以联机形式提供对外服务。这个系统使用不方便且图像处理功能弱,因此我们试图运用>
关键词 数据库 化石 脊椎动物 标本 因特网 >
1 引言
JAFOV是日本脊椎动物化石标本数据库。它于1982年建成,记录了大约4500个标本的描述数据。数据库存放在日本Kyoto大学数据处理中心的大型机上,以联机数据库的形式提供对外服务。然而,数据库还存在一些问题,如不易使用、图像(标本的照片或草图)联机处理功能弱等。
在本项研究中,我们试着应用>
在本项研究中,对要开发的目标系统有以下几点要求:
(1)数据检索可以通过>
(2)能处理的数据不仅包括文档和数字,还应包括化石的图像;
(3)检索到的数据能直接在终端上显示、打印或下载到用户计算机上。
2 JAFOV简介
21 数据库内容
名字JAFOV来源于jApanese FOssil Vertebrate(日本脊椎动物化石)的缩写。它是一个由日本脊椎动物化石标本描述的数据组成的数据库。JAFOV数据库的内容包括化石标本的文档、数字和图像数据,见图1。不过到目前为止,只有文档数据已经入库,而由于某些原因(主要是技术上的),数据库还远没有实现。
图1 JAFOV数据库的原始设计
JAFOV使用一个称为FAIRS的DBMS层次模型。它专为富士通公司制造的大型计算机而设计。这个DBMS适合于文档数据库,如正在使用的JAFOV,它为那些作为查找关键词而经常使用的数据项生成一个倒排文件以加速查找过程。这个模型不适合于处理数字和图像数据。
JAFOV由41个数据项(表1)组成,内容包括标本的描述、地理位置、地质层位、保管人及其它有关信息等。它们被归类为8个组,即:名字、类属、产地、化石形成层位、地质年龄、化石区段、标本保管人和相关参考书目。其中一部分数据项被定义为查找键,其余除少量仅供输出外,均作为文本数据项进行查找。
表1 JAFOV数据库中的数据项
大部分数据项的值直接从原始数据输入,其余则通过使用字典和/或转换表从其它数据项获取值。如转换表中箭头所示,有一些数据项的值通过已有的转换表生成,还有一些则从父数据项中摘取生成。这些数据项的存在减少了数据输入工作量并大大降低了数据出错率。
22 数据库结构
JAFOV数据库由JAFOV工作组建立和维护,它是日本脊椎动物化石学家协会(AVPJ)下的一个志愿小组。
建立JAFOV数据库的过程如图2所示。原始数据由日本的古生物研究所(所)及博物馆的志愿者提供。他们填写有关他们标本的数据采集单并交给工作组。工作组检查数据单并把内容输入到计算机形成原始计算机数据,由计算机的数据转换程序自动把它转换成JAFOV需要的输入数据。在这个过程中,一些数据项的数据通过参照从代码表得到的字典文件被生成,另一些项的数据则从父数据项中摘取。随后以JAFOV的格式打印出数据列表,并送回给数据提供者作校验。如果需要,原始计算机数据还将根据数据提供者的规范要求进行校正。此后,JAFOV的输入数据准备完毕,DBMS根据其数据定义将输入数据送到JAFOV。到这个时候,数据库中建立了两个文件:数据文件和它的倒排文件。
图2 建立JAFOV数据库的过程
23 当前提供服务的方式
目前,JAFOV作为联机数据库已经运行于Kyoto大学数据处理中心的大型机上,提供服务的主要方式见图3。可以通过直接或间接(即通过其它计算中心)联接到中心的一台终端来使用数据库。几年前因特网尚未建成,对数据库的存取只能通过连接在大学计算机互联网络(NACSIS)上的计算中心进行,而且还要对用户进行验证和收费。
图3 当前JAFOV提供服务的方式
图4显示的是目前JAFOV的使用方法。用户使用telnet将终端直接或通过前面提及的其它计算中心间接地连接到Kyoto大学数据处理中心的主计算机上,以telnet方式登录计算机,然后使用图中所示命令交互式地查询他需要的数据。
3 >
31 需要改进的地方及解决方法
现行的JAFOV系统有许多有待改进的问题,尤其是其服务方式。系统的使用应该更加容易、更加广泛,并且还应提供除文档处理以外的数据处理能力。存在的主要问题包括:
(1)不友好的用户界面:现在的用户界面是命令行方式(如图4),对研究人员很不方便;
图4 当前JAFOV的使用方式
(2)服务受限制:使用JAFOV之前需要注册到NACSIS的某一计算中心,也就是说只有注册的用户才能使用数据库;
(3)建立和维护多媒体数据库困难;
(4)在大型机上建立和维护JAFOV成本太高。
而>
(1)可以使用>
(2)通过因特网进行二进制数据变换很方便;
(3)提供很好的图像文件显示;
(4)通过因特网可以实现更广范围的存取。
为此,我们试着开发了JAFOV的一个>
图5 JAFOV的>
32 JAFOV的>
JAFOV的>
图6 JAFOV的>
图7 查询JAFOV得到的结果记录列表
图8 记录的内容
上例显示的查找过程与图4所示例子相同。毫无疑问,这里显示的方法比当前正在使用的方法对用户要友好得多。
33 >
在本项研究中,我们开发了一个原始DBMS,并以此建立了>
图9 >
主文件是一个文本型简单文件,其中定义了数据项/域。它由“项/域定义记录”和“标本数据记录”组成。项/域定义记录以CSV(即以逗号分隔的变量)的形式置于文件的第一个记录。接下去是与项/域定义记录有相同格式和顺序的标本数据记录。一个标本使用一个记录。文件可以由任意一种文本编辑器生成。
在检索生成的页面中,图像和文本文件以超文本形式连接起来。页面中嵌入了一个标志,它连接到图像或文本文件。当点取该标志时可以显示与之连接的图像或长文本数据。标志在页面上以可点取的按钮形式显示。
34 系统的查找过程
一般说来,>
图10 通过>
图11显示的是我们开发的系统中数据库检索及结果显示的机理。系统基本上使用CGI接口。首先,用户输入的条件通过CGI送到数据检索模块。模块在数据主文件中查找数据,并生成一个临时文件和一个HTML文件,检索到的记录在HTML文件中以可点取按钮(图7)的形式列出来。检索中可以使用多个查找条件,但条件之间只能是“与”的关系。
然后服务器把模块生成的HTML文件送回客户端。用户可以用鼠标单击记录以显示查到的详细资料。当单击任一标本登记号时,信息也是通过CGI送到显示模块。模块使用选定的文件生成HTML格式的显示页面,并将它送回客户端。于是,与记录有关的图像就通过相应的文件名连接到页面上。
图6~8是执行检索的一个例子。图6是用户输入查询条件的页面,即首页。图7是输入条件为“‘名字’中包含‘NAUMANNI’”时获得的查询结果。查询得到了两个标本并显示为图中可点取的按钮。这一页通过图11中的数据查询模块生成。同时,检索到的数据其全部内容保存在图11中的选定数据文件中。图8是单击图7中按钮后显示的记录内容。这一页通过图11中的显示模块生成,它从选定文件中检索出数据并使用一个模板来生成本页。
4 结论
在本项研究中,我们通过使用>
(1)显著改善了用户界面,用户对系统的使用更加方便;
(2)使用数据库的范围变得更为广泛,因为>
(3)数据库可以像处理文本数据那样方便地处理图像数据。
这些改进很好地解决了JAFOV当前版本中存在的大部分问题。
然而,要使这个系统在因特网上实际运行,还有一些问题需要解决,这些问题主要包括:
(1)查询数据需要的时间偏长;
数学地质和地质信息
(2)本项研究中开发的DBMS可以达到的实际容量是1000个记录,当存储记录数超过该数目时,数据查询将花费更长的时间。
通过使用功能更强大的DBMS如RDBMS作为搜索引擎,这些问题可以得到解决。因此,我们正在使用RDBMS来开发实用型系统。
致谢 笔者衷心感谢Toyo信息系统有限公司的Shintaro Inoue先生,他参与了本系统的开发,还要感谢CSK有限公司的Koushiro Miyauchi先生,他对本项研究中使用的计算机作了软硬件配置与调试。(龚仁辉译,陈建平校)
参考文献
[1]TKamei,KYamamoto,and NNishiwakiDatabase on Fossil Vertebrate Specimens Deposited in Japan:JAFOVBullData ProcCent,Kyoto Univ,1986,19(4):260~268(in Japanese)
[2]NNishiwakiDatabase on Fossil Specimens Deposited in JapanProc3rd InternConfGeosciInform(Adelaide,Australia)Australian Mineral Foundation,1986,1:62~70
[3]NNishiwaki,KYamamoto,and TKameiData Base on the Japanese Fossil VertebratesPSGlaeser(Ed)Data for Science and TechnologyProc8th InternCODATA Conf(Jachranka,Poland),North-Holland PubCo,1982,75~80
[4]KYamamoto,NNishiwaki,and TKameiJAFOV:Data Base on the Japanese Fossil Vertebrates(1)GeolData Proe,1982,7:21~30(in Japanese)
[5]KYamamoto,NNishiwaki,and TKameiPresent Status and Future Extension of JAFOV:Database on the Japanese Fossil VertebratesGeolData Proc,1987,12:142~150(in Japanese)
[6]KYamamoto,NNishiwaki,and YKawamuraAn Extension of the Japanese Fossil Vertebrates Database JAFOVBullData ProcCenter,Kyoto Univ,1994,27(3):117~120(in Japanese)
[7]HHoriike,YOzawa,YMurao,and TWatanabeUser's Manual:Database Retrieval with FAIRSData ProcCent,Kyoto Univ,1984(in Japanese)
[8]LAransonHTML Manual of StyleZiff-Davis Press,Emeryville,California,1994
很多,以下是经常用的全文数据库,pubmed大部分没全文:
1、OVID
2、EBSCO
3、proquest
4、scicnedirect
5、springer
6、wiely
用谷歌或者必应,里面将语言选择为英文,就可以了
Yahoo!(>
Yahoo!是目前最常用的引擎之一,是Internet引擎的"元老"。
Yahoo!的使用很简单,可以直接输入查找关键字,也可以先选分类主题进行分类查询
,它将返回三种信息:
1 满足查询条件的Yahoo目录(用户可以利用它们进行交叉引用);
2 满足条件的实际站点;
3 更广泛的含有页面索引的Yahoo!目录,是一种更 广泛的交叉引用。
Yahoo!也提供了一些简单的高级查询,其配置选项有:
S搜索的范围:Yahoo(缺省)、Usenet或E-mail Address;
S搜索词之间的关系:OR或AND(缺省);
S可以进行子串搜索,将其设置Substrings或Complete words两种,其中Substrings将
我们输入的词作为一个子串,Complete words表示进行完整的单词搜索,缺省是子串搜索
·控制每页显示的结果数目:10、25(缺省)、50或100。
Yahoo!在高级查询上并不是很完善,但是Yahoo!在其主页的末尾提供了其他引擎如A
ltaVista的超连接,如果用户在Yahoo!查不到所需资料,Yahoo!可以到这些地方去搜索。
从而弥补了Yahoo!的一些缺陷。
2 InfoSeek(>
InfoSeek是一个高效的搜索引擎,它的特点是:搜索精度高,查到的节点一般都与用
户的要求相符。其搜索结果按照相关程度依次显示。每一个结果显示该HTML文件的标题
、摘要、大小。
InfoSeek引擎拥有最好的搜索参数的集成,它允许用户在填写查寻要求时可以随心所
欲地不厌其详,而它在后台则施以适当的逻辑组合。这就意味着,用户可以忽略如何使用
搜索引擎,只要集中精力把自己想提的问题写好就行了。
InfoSeek数据库中每一网页的所有文本都被检索,它的搜索具有"事件敏感性"(case
sensitive),即对某些名字进行搜索时,搜索的效率会明显提高。用户输入一个短语后,I
nfoseek会使用与短语最接近的排位方法,提高搜索结果的相关性。
InfoSeek可以提供以下的搜索范围:
SWeb:在整个>
SNews:在实时新闻中查找;
SCompany:在公司名目中搜索;
SNewsgroups:在新闻组中搜索。
Infoseek的搜索方法包括:
1 词组(短语)搜索 这时需对词组加上双引号,以示与单个词的区别;
2 查找同时出现的词 对所要搜索的关键词加上[ ],表示括号内的词在文本中出现
时,其间隔不超过100个词。
3 AltaVista(altavistadigitalcom)
AltaVista自1996年12月开始服务以来,引起了世界各地网民的广泛注意,每天都要
接受200万次以上的访问。AltaVista自诩拥有2100多万全文索引的网页,可以称得上是最
大的网络搜索数据库。
相对其他搜索引擎而言,AltaVista的搜索结果总是比其他任何站点的搜索结果内容
更丰富,AltaVista的搜索范围大得惊人,有人说能对网络的天涯海角进行彻底搜索的仅此
一家,就连一些鲜为人知的偏僻站点也能找到。所以,使用AltaVista时,要花更多的时间
在搜索结果里寻找自己想要的信息。不过,如果你的目的就是想找到关于某个主题的站点
,多多益善,那么AltaVista是最好的选择。
根据检索的对象,AltaVista搜索引擎提供三大类信息检索:Web检索和新闻组检索、
商业检索以及人物检索。除公共检索服务外,AltaVista还提供免费E-mail、页面翻译等
相关服务。它的搜索方法分为简单和高级两种。
1 简单搜索
AltaVista搜索引擎推荐使用的检索方法, 是直接使用自然语言输入检索提问。检索
提问可以是自然语言的单词、词组或短语以及完整的问题。对使用AltaVista的最有用的
建议是, 由于它的索引是基于整个单词的正文的,在描述查找的单词时越精确越好,还要
去掉那些不感兴趣的单词。
2 高级搜索
高级搜索包含了简单搜索的所有特性,还可以有布尔和接近 *** 作符、括起来的逻辑组
合等。AltaVista支持二元 *** 作符AND、OR、NEAR和一元 *** 作符NOT。
AltaVista的接近 *** 作符(NEAR)很有特色。可以使用NEAR/n,n是两个被搜索词之间的
单词的数目,如:Microsoft NEAR/5 Internet表示在"Microsoft"和"Internet"这两个关
键字之间的单词数目不得超过5个。如果不输入n,表示两个词挨在一起。为了控制挨在一
起的两个词之间的顺序,可以使用 ADJ *** 作符,如:Microsoft ADJ Internet,表示Micro
soft 必须在Internet之前。
4 Lycos ( >
Lycos是最老资格的搜索引擎之一,只要能给出准确的搜索结果,Lycos通常能给出最
全面的结果(基本上与AltaVista相同)。 Lycos的搜索范围分的较细,这样可以减少命中
的数量,可选择的项目有:
The Web、Web Site Reviews、Personal Home- pages、Message Boards、Reuters
News、Weather (city)、Cities、Dictionary、Stock (symbol)、Music (artist)、B
ooks、Pictures、Sounds、Downloads、Recipes等。
Lycos不是周期性地更新数据库,而是采用累积的形式构筑数据库。在对新的和原来
存在的数据库进行信息升级时,Lycos软件通过观察其他站点通向某一站点的链接数而评
价这个站点的知名度。然后引擎在每次搜索时都使用这一知名度索引,所以每次搜索结果
的相关性在一定的程度上取决于站点的相对知名度。
Lycos搜索结果的容量非常之大,你如果试图在网上迅速找到某个内容,Lycos不是最
好的选择,如果你需要对网上的内容广进博收,多多益善,Lycos可能会为你找到一些其他
站点找不到的内容。
Lycos在支持逻辑搜索和高级搜索功能方面较弱。
Lycos不提供要求/排除单词的功能, 但可以在一个单词前加一个"-"号,表示在给结
果定等级时,不考虑这个单词。
Lycos的通配符是$符号。如gen$ 表示 genetic、 genesis、general等。它还提供
了英文句号()的使用,可以禁止扩展一个单词。如gene,只能得到gene,而得不到genet
ics和general。
5 Excite(>
Netscape在其Navigator浏览器的NetDirectory命令条中选中了Excite作为其中的一
个链接,这使Excite的知名度明显提高。众多的访问大大提高了Excite站点的流通量。
Excite使用的是基于关键词或基于概念的正文和主题搜索。概念搜索是指搜索引擎
不只简单地查找含有要查找的单词的文档,同时还搜索与要查找的概念相关的文档。缺省
的查找是概念查找。Excite既提供网络搜索引擎,又提供以类目形式组织起来的网络目录
(类似于Yahoo的目录索引)。
Excite中要求的单词和排除的单词的使用方法同AltaVista一样,使用+号和-号,Exc
ite支持二元 *** 作符AND、OR 和一元 *** 作符NOT,它也支持用括号来构成逻辑组。
6 Webcrawler(>
Webcrawler 是一个杰出的搜索引擎, 它的界面有些像 AltaVista。实际上,它在
高级搜索方面的功能要比AlataVista强。它提供事先分好类的19个主题,实现了基于主题
的搜索。
Webcrawler号称支持"自然语言搜索",所以可以输入像"highest mountain in the
world(世界上最高的山)"这样的查询条件。它抛弃了无意义的词,对其余的词做模糊的A
ND搜索,含有所有的词的页面等级最高, 但也能查到只含一个词的页面,这是那些最佳引
擎的通用策略。
Webcrawler的词组、逻辑和接近 *** 作符的使用类似于AltaVista。Webcrawler不支
持要求/排除的单词的查找,也不支持通配符。
WebCrawler的主要缺点是,它对搜索到的每个条目都不显示文本内容摘要。用户只能
看到网页题目和显示WebCrawler相关性排名的数字。所以,除非网页题目直接描述网页内
容,否则用户只能到这个站点访问,才能得知其网页内容。
在互联网上,中文内容只占约4%,绝大多数是英文内容,所以只有掌握英文搜索才能真正的深入互联网。但是,英文搜索引擎很多,变化也很快,应该用哪个搜索,和怎么搜索呢?今天,我就来介绍几个最有代表性的英文搜索引擎。
Ask (>
Ask是一个支持自然提问的搜索引擎,它的数据库里储存了超过1000万个问题的答案,只要你用英文直接输入一个问题,它就会给出问题答案,如果你的问题答案不在它的数据库中,那么它会列出一串跟你的问题类似的问题和含有答案的链接,供你选择。
根据网友们的使用经验,当你遇到一些属于事实型、原理型的问题时,使用Ask是最方便的。例如:“美国历任总统中就任时年纪最轻的是谁?”、“阿富汗的首都叫什么?”、“飞机是哪一年发明的?”、“雪为什么是白的?”、“为什么吃豆子的人爱放屁?”、“恐龙为什么灭绝?”、“后街男孩的网站在哪里?”。你还可以问它各种奇怪的问题,例如:“现在几点了?”、“罗马帝国为什么崩溃?”、“圣诞老人住在哪儿?”,它都会给你答案的。
dmoz(>
有的网友不喜欢自己输入英文单词搜索,而是喜欢用鼠标点击分类目录随意浏览,那么我向你推荐dmoz。
dmoz是互联网合作共享精神的结晶,它的4万多名志愿编辑都是各行各业的专业人员,大家走到一起免费制作dmoz,提供给任何个人和组织免费使用。dmoz已经收录了40多万子目录和近300万个网站,是世界上最大的、也是最好的网站分类目录,已经被世界各国400多个网站选做默认搜索引擎。dmoz使用起来非常方便,它提供相关目录使你不容易漏掉其它目录里的的相关内容,它还用一颗小星星推荐各个目录下最好的网站,使初学者不会被太多的网站弄迷途。
另外,任何人都可以申请成为dmoz的搜索引擎编辑,你也可以去申请,尝试一下亲自做搜索引擎编辑的感觉,不过,要被批准可得有点实力才行哦。
Google(>
Google是在国外很受欢迎的搜索引擎,界面简洁,以搜索结果的准确性著称,它的网页快照和搜索也很有特色。
网页快照就是网页的备份,你在Google搜索的时候,如果发现某条搜索结果点不进去,是死链接,那么只要点击搜索结果旁边的网页快照(Cached),就能看到Google保存的备份网页。
Google还有世界上最大的搜索引擎(imagesgooglecom),收集了互联网上33亿张,如果你想找哪个偶像的照片、想找某个名胜的风景照、想找军事兵器、、、只要输入合适的英文单词,很容易找到满意的。
search(>
search属于元搜索引擎,它收集了800多种专业搜索引擎和数据库,分为商业金融、娱乐、健康医药、新闻媒体、评论、计算机、游戏、国际、寻人、购物、下载、政府、音乐、参考资料、旅行共15个大主题,每个大主题又分许多小主题。
当你进入任何一个主题搜索的时候,它都可以同时搜索这个主题下的多个专业搜索引擎和数据库,然后在一个页面上显示来自不同搜索引擎的搜索结果。
比如进入大主题“新闻媒体”搜索,它把搜索结果分为头条新闻、商业新闻、体育新闻、娱乐新闻、科技新闻、杂志、报纸,如果再进入小主题“科技新闻”搜索,那么它可以同时搜索CNET、PC World、ZDNet、IDGnet、TechWeb这5个著名的科技新闻网站,足够保证你得到最全最新的科技新闻。
好了,每个搜索引擎都有独特的优缺点,不同的需要就应该使用不同的搜索引擎。
如果你搜索英文内容,那么我给你推荐的使用习惯是:上网随便逛逛就用dmoz,平时搜索就用google,有问题就问ask,要做特定的主题搜索就用searchcom。希望我的回答能够帮助您,还望采纳。
(1)中国生物医学文献数据库(CBM):收录1978以来1600余种中国生物医学期刊,以及汇编、会议论文的文献题录770余万篇,全部题录均进行主题标引和分类标引等规范化加工处理。年增文献40余万篇,每月更新。部分论文可直接链接到维普中文科技期刊全文库获取全文。
(2)中国医学科普文献数据库:收录2000年以来国内出版的医学科普期刊近百种,文献总量近25万篇,重点突显养生保健、心理健康、生殖健康、运动健身、医学美容、婚姻家庭、食品营养等与医学健康有关的内容。每月更新。可浏览全文。
(3)北京协和医学院博硕学位论文库:收录1981年以来协和医学院培养的博士、硕士研究生学位论文9700余篇,学科范围涉及医学、药学各专业领域及其他相关专业,内容前沿、丰富,可在线浏览全文。每季更新。可以在线浏览和下载文摘信息。在题录页面点击“原文阅读”可以在线阅读全文。提示:全文不提供下载!
(4)西文生物医学文献数据库(WBM):收录目前世界各国出版的7200余种重要生物医学期刊文献题录2286万余篇,其中协和医学院图书馆馆藏期刊4800余种,免费期刊2400余种。部分期刊可回溯至创刊年,全面体现协和医学院图书馆悠久丰厚的历史馆藏。年增文献60余万篇,每月更新。
(5)英文文集汇编文摘数据库:收录协和医学院图书馆馆藏生物医学文集、汇编以及能够从中析出单篇文献的各种参考工具书等240余种/册,文献量共计38700余篇。报道内容以最新出版的文献为主,部分文献可回溯至2000年。每月更新。
(6)英文会议文摘数据库:收录2000年以来世界各主要协会、出版机构的60余种生物医学学术会议文献,部分文献有少量回溯,文献量共计16540余篇。每月更新。
(7)俄文生物医学文献数据库:收录1995年以来俄国出版的俄文重要生物医学学术期刊30余种,部分期刊有少量回溯,文献量共计10420余篇。每月更新。
(8)日文生物医学文献数据库:收录1995年以来日本出版的日文重要生物医学学术期刊90余种,部分期刊有少量回溯,文献量共计76240余篇。每月更新。
以上就是关于提供WWW服务的JAFOV数据库全部的内容,包括:提供WWW服务的JAFOV数据库、常用的医药文献检索外文数据库有哪些、有N多搜索引擎上都会有英文搜索这是能搜索外国网站的东西的那有哪个搜索引擎上有日本搜索引擎这是等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)