RDF文件如何打开?RDF文件怎么打开?RDF文件是什么

RDF文件如何打开?RDF文件怎么打开?RDF文件是什么,第1张

RDF文件是资源描述框架语言编写文档文件,在互联网上表示信息资源。RDF文件包含有关网站的信息称为元数据的结构化格式,可能包括一个网站地图,更新日志、页面描述和关键字。 RDF文件也用于 Mozilla 网页浏览器,还有火狐浏览器,也保存创建设置和工具栏设置。

一、信息采集技术

信息采集技术包括对象数据采集和元数据采集。

1)对象数据采集主要包括文本信息采集和图像信息采集,文本信息采集工作主要指将原来纸介质文献进行数字化。这仅仅依靠人工录入、人工校对是远远不够的,要完成大量文本信息的数字化,需要可靠的扫描技术和OCR(Optical Character Recognition,光学字符识别)识别技术。图像信息的采集需要应用扫描技术,重要的现场图像可以应用数码摄像机、数码照相机等工具进行采集,而原来存储在录像带等介质上的图像资料可以通过相应的技术完成数字化。当前文档一般都提供数字化版本,只要按集成化的数字图书馆系统的要求进行加工存储组织即可。

2)元数据就是关于数据的数据。元数据最基本的用途就是管理数据,从而实现查询、阅读、交换和共享。元数据采集技术指从数据库系统、文件系统、HTML文件中采集元数据,从而形成本地元数据库仓储的技术。

二、信息加工技术

信息加工技术包括对象数据加工技术和元数据加工技术。

(1)对象数据加工技术是指采集的为对象数据,则按元数据标准和著录规范进行标引、分类工作。

(2)元数据加工技术采集的为元数据,则按元数据标准和著录规范,对采集数据进行转换和清洗工作,即对元数据进行规范化与标准化,去除不合要求的元数据。

(3)自动标引、人工标引技术主要涉及主题标引和分类标引,是信息资源加工的一个重要环节。自动标引技术以主题词表和分类表为基础,为标引人员自动生成主题词与分类。

三、信息存储技术

目前图书馆的书目信息主要存储在各种不同环境的数据库中,由于异构数据库间并不兼容,往往需要编制一些转换程序,使得信息共享的效率大大降低。同时,为了开发网上对图书馆信息的快速和准确查询服务,现有图书馆的书目信息库已不能满足这一要求,必须增加其他内容的数字化信息。由于目录信息是非结构的信息,也不适宜用现有的数据库来表示。因此,图书馆中部分数字化信息可以使用XML来表达和存储。用户的检索请求通过Web服务器调用程序传送给相应的系统内部服务器,在系统内部,所有的信息处理工作都是围绕着XML文件系统进行的,当然其前提是将数据库中的信息转化成XML文档,将书的目录信息通过相应工具生成XML文档,传送到用户的浏览器中进行显示,或传送到其他的Web服务器实现信息共享。

信息的存储、信息的检索、信息的分析都要利用数据库技术。传统数据库技术经历了网状数据库、层次数据库和关系数据库三个阶段。建立在信息集成基础上的数字图书馆提供的信息资源不仅有普通的可以结构化的电子文本,还有图像、音频、视频、软件等等各种类型的信息,由于这种多媒体信息的存在和网络的发展,推动了数据库技术的发展。面向对象数据库技术、非结构化数据库技术、多媒体数据库技术日臻成熟。这种数据库的记录长度是不定的,可以储存各种类型的信息,因而可以轻松地处理多媒体信息。使得建立在信息集成基础上的数字图书馆系统的功能不仅仅提供一次信息,还提供经过处理的二次信息,还可以对信息资源进行处理并进行信息分析提供决策服务。因此,支持管理决策过程的、面向主题的、集成的、稳定的、随时间而变的数据存储技术也是建设数字图书馆不可缺少的技术之一。

四、信息检索技术

信息检索技术发展非常迅速,尤其是Web化的搜索方式正在成为普遍的检索模式并构成当今信息检索的基本方法,它集超文本技术、网络技术和多媒体技术为一体。万维网的浏览器/服务器模式具有优化的结构和强大的功能,Web化的搜索方式具体表现为各种SearchEngine(搜索引擎)的应用。SearchEngine(搜索引擎)是互联网上具有查询功能的网页的统称,目前已多达数百种,包括WebSearChEngine(万维网搜索引擎)、FTPSearehEngine(文件搜索引擎)、Email/WhitePageSearehEngine(电子函件/白页搜索引擎)、YellwPageSearehEngine(黄页搜索引擎)、UsenetsearehEngine(新闻论坛搜索引擎)、Meta-SearehEngine(元搜索引擎)等类型。万维网是互联网上最先进的网络信息检索系统,也是最受检索者喜爱的信息检索系统之一。

将人工智能领域的Agent技术,运用于互联网网络化智能信息检索中,给出了一种新的互联网智能检索技术。智能软件Agents是能为用户执行特定的任务,具有一定程度的智能以允许自主执行部分任务,并以一种合适的方式与环境相互作用的软件程序。Agent技术具有主动性、智能性、协作性、移动性,通过内在联系,建立模糊关系,学习用户个性化的思维,进行模糊推理,这就能为用户提供高效而完整的信息服务,将Agent技术与模糊信息处理两者结合应用于检索服务中,得到了一个解决信息检索问题更有效的途径。

五、信息服务技术

1)索引技术:一般有内容索引、结构索引和链索引。这些索引在建立时涉及索引的结构、索引的可扩展性和分布特点、索引生成的并行化等技术问题。

2)开放式URL连接系统:因为一个连接系统需要与多个源点数据库互通,所以必需规划连接系统与源点数据库通信的方法,被提议的标准称为开放式的URL,用在URL里传送元数据。和开放式URL有兼容性的连接系统叫做开放式URL连接系统。开放式连接为连接程序提供了一个独立的系统。连接系统从某一个源点收到元数据后,再根据自己数据库里的数据,决定提供给用户的目标数据。

3)数据挖掘技术:网络信息挖掘技术,也可以称为数据库中的知识发现,是从大量数据中抽取出先前未知的、完整的、可信的、新颖的、有效的信息的高级处理过程,它是在已知数据样本的基础上,通过归纳学习、机器学习、统计分析等方法得到数据对象间的内在特性,据此采用信息过滤技术在网络中提取用户感兴趣的信息或者更高层次的知识和规律来做关键的决策。信息挖掘包括数据挖掘((DataMining)和文本挖掘(TextMining)两种,它采用先进的技术来分析信息资源。

4)信息推送技术:信息推送技术是指一种按照用户指定的时间间隔或根据发生的事件把用户选定的数据自动推送给用户的计算机数据发布技术。推送技术的发展方向将是多点播送和多址发送的内容传递。RSS技术是信息推送技术中的一种,RSS是一种 XML(Extensible Markup Language,扩展标记语言)格式,用于为内容整合客户端提供选择性的、汇总过的网页内容,更确切地说,是基于XML,RDF的描述资源集合(特别是网络资源等)的轻便、可扩展的元数据集。RSS作为描述和同步网站内容的格式,是目前使用最广泛的XML应用。

5)多语种技术:可以通过多语言浏览功能,通过机器翻译功能为用户提供多种服务。

6)音频、视频播放技术:利用互联网播放MPEG,MP3,WAVE等高质量的音频文件和AVI等视频文件。

分类: 电脑/网络 >> 互联网
问题描述:

web20到底怎么架构

主要使用什么技术

现在还是个概念吗

如果要学web20,得先从哪下手
谢谢!

解析:

Web 20是一个新生的术语,它的应用可以让人了解目前万维网正在进行的一种改变——从一系列网站到一个成熟的为最终用户提供网络应用的服务平台。这种概念的支持者期望Web 20服务将在很多用途上最终取代桌面计算机应用。Web 20并不是一个技术标准,不过它包含了技术架构及应用软件。它的特点是鼓励作为资讯最终利用者透过分享,使到可供分享的资源变得更丰盛;相反的,过去的各种网上分享方式则显得支离破碎。

概览

Web(在这里,指代“Web 10”)最早的概念包括不常更新(甚至不更新)的静态HTML页面。而时代的成功则是依靠一个更加动态的Web(指代“Web 15”),其中CMS(内容管理系统)可以从不断变化的内容数据库中即时生成动态HTML页面。从这两种意义上来说,所谓的眼球效应则被认为是固有的Web感受,也因此页面点击率和外观成为了重要因素。

Web 20的支持者认为Web的使用正日渐以交互性和未来的社会性网络为导向,所提供的服务内容,通过或不通过创建一个可视的、交互的网页来充分挖掘网络效应。某种观点认为,和传统网站相比,Web 20的网站更多表现为Point of presence或者是依赖用户的门户网站。

另一方面,其实早在1999年,著名的管理学者彼得·杜拉克 (Peter F Drucker)就曾指出当时的资讯科技发展走错了方向,因为真正推动社会进步的,是"Information Technology"里的"Information",而不是"Technology"。若然单单着重技术层面而忽略了资讯的话,就只是一具空的躯壳,不能使社会增值。而Web 20很明显是透过参与者的互动:不论是提供内容、为内容索引或评分,都能够使他们所使用的平台增值。透过参与者的互动,好的产品或资讯本着它的口碑,从一小撮使用者扩展到一大班人,一但超过了临界质量,就会“像病毒一样广泛留传”(葛拉威尔,2002)。

该词的来源

有不少人以为"Web 20"是一个技术的标准,其实这是个美丽的误会,因为Web 20只是一个用来阐述技术转变的术语。这个术语是由O'Reilly Media的Dale Dougherty 和 MediaLive 的 Craig Cline 在共同合作的脑力激荡(brain storming)会议上提出来的。Dougherty提出了Web目前正处于复兴时期,有着不断改变的规则和不断演化的商业模式。而Dougherty则是举例说明——“DoubleClick是Web 10,Google AdSense 则是Web 20。 Ofoto是Web 10;Flickr 则是Web 20”,而不是给出确切的定义,和补充一个商业前景,同时O'Reilly Media、Battelle和MediaLive 在2004年10月启动了第一个Web 20大会。第二次的年会已在2005年10月举办。

在他们的会议开场白上,O'Reilly和Battelle总结了他们认为的表现了Web 20应用特色的一些关键原则:

将Web作为平台;

驾驭群体智慧

资料将变成未来的“Intel Inside”;

软件不断发行与升级的循环将会终结(“永久的Beta版”)

轻量型程序设计模型;

通过内容和服务的联合使轻量的业务模型可行;

软件执行将跨越单一设备

丰富的使用者体验

分享和参与的架构 所驱动的网络效应;

通过带动分散的、独立的开发者把各个系统和网站组合形成大汇集的改革;

拉动长尾的能力;

快速的反应与功能新增

双向的互动

这种软件发布中的版本号的使用从某一方面也暗示了整个Web已经被看作是一种有着重大增值意义的新产品,而且正在被重新编写和发布。

同语义网的比较

对于Web 20这个词的一个较早的出现是作为语义网的同义词。这两个概念有点相似而且是互补的。结合了基于标签的Folksonomy(分众分类法)的社会性网络系统如FOAF和XFN,以及通过Blog和Wiki进行发表,已经创建了一个语义环境的天然基础。

技术

Web 20技术基础比较复杂而且还在演化中,但可以肯定的是包括服务器端软件、内容联合组织、消息协议、基于标准的浏览器和各种不同的客户端应用程序。(一般会避免使用非标准浏览器的一些增强功能和插件)这些不同但是互补的方法提供了Web20信息存储、创建和分发的能力,这些能力远远超出了先前人们对网站的期望。

如果一个网站使用了以下一些技术作为特色的话,就说他是利用了Web 20技术:

技术方面:

CSS, 语义化有效的XHTML标记,和Microformats

不突出的丰富应用技术(例如Ajax)

数据的联合,RSS/ATOM

RSS/ATOM数据的聚合

规则且有意义的URL

支持对网志发帖子

REST 或者是XML Web服务API

某些社会性网络方面

通用概念:

网站不能是封闭的——它必须可以很方便地被其他系统获取或写入数据。

用户应该在网站上拥有他们自己的数据。

完全地基于Web —— 大多数成功的Web 20网站可以几乎完全通过浏览器来使用

内容联合组织

Web 20的首要的也是最重要的发展,包括了使用标准化协议的网站内容的联合,这可以让最终用户在其他环境中使用网站的数据,包括另一个网站、浏览器插件、或者一个单独的桌面应用程序。这些联合协议包括RSS,资源描述框架(RDF),和Atom,这些都是基于XML的。特别的协议如FOAF和XFN(XHTML朋友网络)——这两者都是为了社会性网络开发的——扩展了网站的功能或者可让最终用户不集中于网站就可以进行交互。参见microformats,以查询更多的专门数据格式。

由于发展太快,很多这些协议都是事实上的标准而不是正式的标准。

Web服务

双向的消息协议是Web 20架构的关键元素之一。两个主要的类型是RESTful和SOAP方法。REST(Representational State Transfer)表示了一种Web服务 客户端传送所有的事务的状态。SOAP(Simple Object Access Protocal)和类似的轻量方法都依赖服务器来保存状态信息。两种情况下,服务是通过一个API调用的。这个API常常是根据网站的特殊需求定义的,但是标准的Web服务API(例如,给Blog发帖)的API依然被广泛使用。一般来说Web服务的通用语言是XML,但并不一定,还存在大量不同的其他语言,如JSON,YAML等。

最近,出现了一个被称之为Ajax的混合形式,用来增强基于浏览器的Web应用的用户体验。这可以用于一些特别的形式(如Google Maps、UrMap)或是一些开放的形式,可以直接利用Web服务API、数据联合,甚至是绘画。

宽泛得说,联合是一种Web服务的形式,但是Web服务形式的使用却不是很常见的。

参见 WSDL(Web服务描述语言)和Web服务规范表。

服务器软件

Web 20 的功能是在已有的Web服务器架构上建立的,但是更加强调后台软件。数据联合不仅仅是名称上和内容管理发布方法不同,而且Web服务要求更加强壮的数据库和工作流的支持,并且变得与传统的企业内部网的应用服务器功能更加相似。供应商不管是用一个通用服务器方法,可以把所有需要的功能都集中到一个服务器平台上,或者是一个Web服务器插件的方法,可以使用增强了API接口的标准发布工具和其他工具。不管选择的是哪种途径,Web 20的进化不会为这些选择做出重大改变。

社会影响

Web 20中出现的数据联合和消息传送能力,提出了潜在的一种可能性——在完全不同的在线社区之间创建一个更加紧密的社会构造。同时还出现了一些新的术语来 性地代表这些共同的社团,包括blogshpere:网志的世界,syndisphere:内容联合发布,以及 wikisphere,然而其他的观察者认为这些措辞和内在的含义太空泛了。

商业影响

可能的由Web 20带来的指数级增长的业务的原因,可归结为以人为本的消费和以计算机为本的消费的区别。

对于价值的鉴定和消费的过程中无需不同人为参与,由于Web 20的出现,也是完全可能的事情了。各个组织会不断使用诸如RSS/Atom/RDF之类的联合格式来联合他们的价值提案。除了价值的联合外,Web服务终点发布将简化联合的价值的消费过程。

事实上,至今没有人能给Web20下一个明确的定义。每个人眼中的Web20都有不同的表述。 技术研究者眼中的Web20是SNS、BLOG等社会性软件的兴起; 博客们则认为Web20是人与人之间更为便捷的互动; 在风险投资商眼中,Web20又代表了新的商业机会和行业游戏规则。

而从行销者的角度来看,Web20则至少意味着三个方面的内容: 一种创新的媒介形式、一个集中的社群环境,以及一种全新行销理念。

目前逐渐盛行的BLOG行销被认为是Web20行销的典型形式之一。

早期的网络行销不外乎是透过电子邮件发送、d出式视窗、横幅式广告等几种手法。 最常见的例子就是入口网站将其网页上的广告空间待价而沽,等到广告商上门之后,入口网站再依点选率或是摆放时间的长短来收取费用。 这样的缺点是,广告商永远无法知道你所摆放的广告是不是真的接触到你的目标客户,还是只是在茫茫的网海中找寻一两个真正有需求的消费者。 就像是Tim O'Reilly所说的一样,如果Web 10的代表者是Netscape,那Web 20的代表就是Google。 Google一改以往广告商寻找消费者的思考模式,而改以消费者自行查询广告的思维模式来经营。 Google将首页保持干净,但在关键字搜寻的时候提供你想要查找资讯的相关广告,不但确保每一个点选进网站的浏漤者都是对该资讯有兴趣的潜在消费者,也一并解决了消费者对广告视窗扰人的困扰。 而前一阵子Google推出的Google Page也有异曲同工之妙,利用免费提供部落格服务的形式,从中搜集更多消费者的习性,其中的用意就是要为消费者量身订做一个个人化的Google。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zz/10787711.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-11
下一篇2023-05-11

发表评论

登录后才能评论

评论列表(0条)

    保存