
3.4.1 信息加工的含义
所谓信息加工是指把搜集来的大量的原始信息,按照不同的目的和要求进行筛选和判断、分类和排序、著录和标引、编目和组织、存储和分析,而使之成为具有一定使用价值的信息的过程。
一般而言,搜集来的原始信息是一种初始的、零乱的、孤立的信息。只有把这种零次信息进行分类、排序,使之成为规则的、有序的、系统的高次信息,才能使用;只有通过著录和标引,使零次信息变成二次信息,才能便于信息的存储、检索和传递。因此,信息加工的过程就是在原始信息的基础上,生产出价值含量高、方便用户利用的新信息,使信息增值的过程。
按不同的标准,信息加工可分成不同的方式。
按加工处理响应时间的不同,可把加工分为实时处理加工和批处理加工。实时处理加工是指将送过来的数据立即进行处理,即时做出响应,一般适合常规的作业业务;批处理是指把送过来的数据存起来,达到一定的数量或时间后,再集中处理,一般适合统计分析业务。
按处理功能的深浅可把加工分为预处理加工、业务处理加工和决策处理加工。预处理加工是对信息简单整理;业务处理加工是对信息进行分析,综合出辅助决策的信息;决策处理加工是对信息进行统计推断,产生的是决策信息。
按加工的工具不同,可分为手工加工和计算机加工。手工加工是利用手工设备对信息进行处理,主要存在于信息加工的初期阶段。计算机加工是利用计算机进行数据处理,对原始数据进行加工处理,产生表格、图形等野旦结果。
3.4.2 信息筛选
信息筛选是信息加工的第一个环节,其目的是去伪存真、去粗取精,保段桐证信息的准确性和有效性。
3.4.2.1 信息筛选的程序
信息筛选的基本程序主要包括以下几个方面:
(1)信息整理。信息整理是信息筛选判别的前提,其目的是使零散的、杂乱无章的信息标准化、条理化,便于下一步的处理和分析。
(2)浏览审阅。浏览审阅是信息筛选判别的中心环节。其目的是清除那些明显错误或无用的信息,保留那些明显真实或有用的信息。对于一些一时无法确定去留的信息资料则放置一旁,留待进一步处理。
(3)再次审核。对于无法确定的信息,要采取会诊或其他科学的方法,对其再次进行分析研究,以便科学地确定其取舍,提高信息筛选和判别的准确性。
3.4.2.2 信息筛选的重点对象
(1)虚构信息。这类信息完全是虚构的、杜撰的,没有一点事实根据,其主要源自信息搜集者的不良动机,对这类信息一定要清除。
(2)添加信息。这类信息虽有一定的根据,但其中某些情节和内容是信息搜集者、传递者通过主观想象而不是根据事实依据添加进去的,需要对其进行分析区别。
(3)夸张信息。这类信息往往把事实夸大或缩小,是对事实的一种扭曲,会严重影响信息的真实度和可信度。
(4)偏颇信息。这类信息是片面地强调某一起作用的原因或扼杀某一起作用的要素。这类信息如果不加以校验、纠偏,会影响到信息的使用价值,甚至会给信息使用者造成重大损失。
(5)残缺信息。由于时间久远、信息获取途径不正确,或者由于信息源本身无法接近,而仅仅通过个别现象或特征得到的信息就是残缺的信息。这类信息一般需要进一步补充收集。
(6)模糊信息。这类信息是由信息搜集者道听途说、捕风捉影而来,往往带有“据说”、“听说”、“大概”、“也许”、“有迹象表明”等字样。这类信息可信度差,必须重新搜集验证。
(7)拼凑信息。这类信息往往把不同地点、不同时间、不同条件、不同性质的信息在搜集、加工、传递的过程中,人为地组合成同一地点、同一时间、同一条件、同一性质的同一信息,这种东拼西凑、张冠李戴的信息,从整体上看仍然是没有事实依据的。
3.4.2.3 信息筛选的方法
(1)感官判断法。感官判断法是指信息加工人员在浏览审阅原始信息过程中依靠自己的学识、技能和经验,凭直觉判断信息的真伪以及可信度大小的方法。
(2)对比分析法。对比分析法是指信息加工人员在筛选和判别信息过程中,通过对前后信息、左右信息、不同渠道搜集的同一信息进行对比分析,以确定信息的真伪和可信度的方法。
(3)专家判断法。专家判断法是指对一些一时无法取舍的信息交由专颂燃扰家裁决,确定其价值的方法。
(4)集体讨论法。集体讨论法是指通过集体的智慧对一些个人无法下结论的信息采用集体会诊的方法以确定其取舍。
(5)现场核实法。现场核实法是指对有疑虑的信息,责成信息搜集人员或信息加工人员深入现场核实真伪的方法。
(6)数学核算法。数学核算法是指当对原始信息有疑虑时,由信息加工人员重新予以核算的加工方法。这种方法可以及时纠正那些因信息搜集计算错误、笔误或传递过程中失误造成的信息失真现象。
3.4.3 信息分类
信息筛选是对信息的粗加工,信息分类就是对信息的细加工。只有对信息进行分类和排序,才能更好地对信息进行存储、检索、传递和使用。
3.4.3.1 信息分类的基本程序
(1)确定分类方法。目前信息分类的方法很多,有地区分类法、内容分类法、主题分类法、时间分类法及综合分类法等。到底采用哪一种分类法,直接决定着信息资料的分拣。因此,确定分类法是信息分拣的基础和前提。
(2)实施信息分拣。这是信息分类的第二个环节,即把信息资料分门别类地放置,以便后一环节工作的开展。
(3)进行信息排序。信息分类以后,同一类目的的信息资料的放置也有前后顺序的安排问题。通过信息的排序就能使信息成为井然有序的信息体系。
3.4.3.2 信息分类的具体方法
(1)地区分类法。地区分类法是指根据地区的不同而进行的信息划分方法。
(2)时间分类法。时间分类法是指依据时间顺序划分信息的方法。时间分类法也可以按年、月、日分层次进行划分。
(3)内容分类法。内容分类法是指依据信息所包含的内容不同进行分类的方法。例如,根据行业,信息可细分为农业信息、工业信息、商业信息、服务业信息、旅游信息、企业信息、基本建设信息、财政信息、金融信息等。
(4)综合分类法。综合分类法是以时间、地区、内容为依据综合划分信息的方法。按不同的组合,综合分类法又可分为时间地区分类法、地区时间分类法、内容地区分类法、内容时间地区分类法、地区时间内容分类法、地区内容时间分类法、时间地区内容分类法和时间内容地区分类法等。
3.4.4 信息著录
信息著录,亦称信息描述,是指根据一定的管理规则和技术标准,对信息的外在特征和部分内容特征进行分析、选择和记录的过程。通过信息著录,形成一条条反映原信息内容特征和外在特征的记录,这种记录就是条目或款目。将一批款目按照一定的次序编排而成的一种文献报道和检索工具就是目录。款目是一种文献的缩影,目录是一批文献的缩影。
3.4.4.1 信息著录的标准化
文献著录标准化是指在国家或国际范围内,对文献著录的原则、内容、格式等做出具有一定约束力的规范。为开发和利用文献资源,需要取得共同一致的书目情报语言来统一描述文献特征和报道、检索文献的方法。20世纪60年代,许多国家相继在本国范围内,实现了文献著录标准化。在此基础上,国际图书馆协会联合会(简称国际图联)专门工作小组,于1971年开始进行国际文献著录标准的制订工作,并于1974年正式出版了《国际标准书目著录》(ISBD),得到世界各国的普遍接受。《国际标准书目著录》成功地解决了下列问题:
(1)使各国的文献著录项目及其排列顺序具有互换性,即实现文献著录的国际统一。
(2)克服了语言障碍,使各国文献著录具有易识别性,即使不认识某种文字的读者,也能通过标识符号系统,识别著录项目。
(3)有助于将一般书目转换为机读目录形式。
为了建立和健全我国统一的文献报道体系,开展国际书目信息交流,更好地开发和利用文献信息资源,我国在全国文献工作标准化技术委员会第6分委员会(目录著录分委员会)和中国图书馆学会的共同努力下,1983年7月正式发表了全国文献著录标准系列中的《文献著录总则》(GB3792.1—83)。其后又出版了各个分则,包括《普通图书著录规则》、《连续出版物著录规则》、《地图资料著录规则》、《档案著录规则》、《古籍著录规则》、《检索期刊条目著录规则》、《文后参考文献著录规则》等。
3.4.4.2 MARC格式
MARC(Machine Readable Catalogue)是机器可读目录英文缩写,简称机读目录,就是以代码形式和特定结构记录在计算机存储介质上的、用计算机识别和阅读的目录。
1965年,美国国会图书馆开始研制机读目录。1966年生产了MARCⅠ磁带。1969年正式出版了MARCⅡ磁带,其后陆续出版了专著、连续出版物、档案与手稿资料、视觉资料、乐谱和地图等资料类型的MARC数据文件。由于MARCⅡ格式是美国国会图书馆开发的,故称为USMARC(又称为LCMARC)。1977年,国际图联首次出版了《UNIMARC通用机读目录格式》,以后又不断进行了修改。
CNMARC是我国国家书目机构依据 UNIMARC制订的《中国机读目录格式》(China MARC Format),作为中华人民共和国文化行业标准 WH/T0503—96推出,它与ISO2709的规定相一致,以 UNIMARC为依据,凡UNIMARC中定义的字段适合于我国出版物的有关规定都予以保留,并补充了我国出版物特有而 UNIMARC中所没有的字段定义。例如,它增加了如下字段和子字段:091统一书刊号;092订购号;093专利号;094标准号;690中国图书馆分类法;692中国科学院图书分类法;905馆藏信息等。
3.4.4.3 Dubin Core标准
Dubin Core标准简称 DC。DC元数据格式是在 1995年3月由 OCLC(Online Computer Library Center,Inc.)和NCSA(National Center for Supercomputing Application)联合召开的第一次专题研讨会(即DCLC/NCSA Metadata Workshop)上产生的,目的是寻求一套简洁有d性,且非专业图书馆人员也可轻易掌握和使用的信息资源著录格式,以提高网络信息资源的开发利用率。 *** 作对象局限于网络上的电子文本资源。会议结果产生了13个元数据项,并以开会的地点都柏林(Dubin)命名。在1996年9月第三次研讨会上,DC元数据将处理对象进一步扩充到图像资源。为了能对图像资源进行充分的著录,新增了两个著录项——描述项(Description)和权限管理项(Rights Management),同时修改了部分著录项名称,共产生了15个著录项。1997年10月,在芬兰赫尔辛基举行的第五次系列研讨会上,进一步明确了DC元数据格式的主要功能侧重于信息资源的著录或描述,而不是信息资源的评价,所以又将15个元数据项分为如下三类:
(1)资源内容描述类元数据项。该类中有下列元数据项:
题名项(Title):由资源创建者或出版者给定的资源名称。
创建者项(Creator):资源的创建者。
主题词项(Subject):能够揭示资源对象主题内容或学科内容的关键词。
描述项(Description):资源内容的文本描述,包括文献类对象的文摘或视觉作品的内容描述等。
语言项(Language):资源对象所用的语言类型。
来源项(Source):二次资源的出处信息。一般的元素只包含当前资源的信息,如果对于揭示当前资源是必要的话,该项可包含二次资源的日期、创建者、形式、标识或其他元数据。
关联项(Relation):二次资源及其与当前资源关系的标识。该元素允许在相关资源和资源描述间建立关联。例如,编目自(Is version of)、翻译自(Is based on)、节选自(Is part of)、格式转换自(Is format of)等。
覆盖范围项(Coverage):资源知识内容的时空特征。空间范围是指物理区域,如经纬度、规范的地名等;时间范围是指资源内容(时间段)而非资源产生的时间(时间点);时间描述采用与日期项(Date)相同的格式。
(2)知识产权描述类元数据项。该类中有下列元数据项:
著者项(Creator):对创造资源知识内容承担主要责任的个人或机构。
出版者项(Publisher):负责使资源成为当前形态的责任者,例如出版社、大学的学院或者公司实体等。
合作者项(Contributor):是指没有在 Creator元素中列出的对资源的知识内容具有重要贡献的个人或组织,其贡献次于创建者(如编辑、誊写员、插图作者等)。
权限项(Rights):一个权限管理的陈述,或者是指向一个权限管理陈述的标识,或者是指向提供资源权限管理信息内容的服务的标识。
(3)外部属性描述类元数据项。该类中有下列元数据项:
日期项(Date):是指与创建或使资源成为可利用状态相关的日期。
类型项(Type):资源的类别,例如小说、诗歌、报告、论文、词典等。
识别符(Identifier):唯一标识资源的字符串或数字。例如,网络资源标识中的URL和URN,其他通用唯一性标识,如国际标准书号(ISBN)或其他规范名称皆可作为标识符。
格式项(Format):资源的数据格式,用于注明需要什么软件或硬件来显示和执行这一资源,如文本、JPG图像、应用程序等。
3.4.5 信息标引
信息标引也称为信息揭示,是对信息的主要内容和其他形式特征进行选择、概括和提炼的过程。包括对信息形式特征进行选择,对信息的内容特征进行分析,并转换成反映信息内容主题的标识等具体内容。
3.4.5.1 信息标引的程序
信息标引的程序一般包括三个环节。
(1)主题分析。即对信息所包含的主题进行分析,主要包括主题数量分析,即该信息包含多少个主题;主题结构分析,即每个主题有多少个主题概念因素;主题内容分析,即具体说明该信息包含了什么主题、各个主题有哪些概念因素。
(2)主题标引。将主题分析结果转换为主题标识。根据对信息主题的揭示程度,主题标引方式可以有四种策略:①整体标引:即对某一信息实体的整体主题用一个标识来进行概括性标引。②全面标引:即对某一信息实体的所有局部主题或不同主题及其主题概念因素分别进行详细标引。③补充标引:即除对某一信息实体的整体主题作概括性标引外,还对部分局部主题及其主题概念因素单独进行标引。④重点标引:即对某一信息实体中与信息系统的性质、任务、目的有关的主题部分进行标引。
(3)检验审核,即对上述主题分析和主题标引的过程和结果进行检验和审核,最后正式形成信息揭示的结果。
3.4.5.2 信息标引的方法
根据标引过程中所给出的标识形态和性质的不同,信息标引通常可分为分类标引和主题标引两大类。
(1)分类标引。分类标引是给信息的内容或形式特征给予分类标识的方法。通过分类标引,可以将具有共同学科属性的信息类聚在一起,并依据各类信息之间的学科关系把所有信息组织成一个有层次、有条理的整体。从近现代分类法的编制方式来看,分类的方法主要有等级体系分类法、分面组配分类法和混合式分类法:
1)等级体系分类法。这类分类法是以文献内容的学科性质为对象,按照知识门类的逻辑次序从一般到具体、从简单到复杂,层层划分,所形成的一种等级体系,其主要特点是:按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类检索文献信息的途径。
2)分面组配分类法。这是一种依据分析兼综合的原则编制的分类法类型,其基本思想是:任何复合主题,不管多么复杂,都可以分解为相应的基本概念;同时它们也可以通过相应基本概念的组合加以表达,因此,分类法不必详尽列举所有主题,而只要在类表中按照范畴列出各种基本概念,并分别配以相应号码。
3)混合式分类法。这类分类法是整合上述两种分类法的优点,在详尽列举类表的基础上,广泛采用各种组配方式的方法。如《国际十进分类法》。
上述的等级体系分类法从古代起就广泛应用于图书馆中对文献资料的分类和检索,现在仍然在图书信息界广为使用。其优点是:强调知识的系统化组织,符合人们认识事物的习惯,便于用户按学科系统检索有关文献信息;类目的树形结构适用于文献的排架管理和检索工具的编排组织:通常采用的阿拉伯数字和拉丁字母标识,通用性强,使国际统一分类达到资源共享成为可能。当然,等级体系分类法也有局限性,如受其体系结构的限制,直接的专指性差;不适合多角度标引和检索;类目体系固定,事先列举,不能及时反映新学科、新事物,修订、增补很困难。
(2)主题标引。主题标引是一种以规范化或未经规范的自然语言作为信息主题标识的方法。按照选词原则、组配方式、规范措施和编制方法。主题法可分为标题词法、元词法、关键词法和叙词法。
1)标题词法。标题词法是以标题词(规范的事物名称、名词术语)作为信息主题内容的标识和检索标识的方法。标题词的来源主要是标引对象的名称或标题中通用的定型名词。标题词的汇编称为标题表,标题词法的主要特征是事先编表。标题词以固定的组合方式组织在词表中,检索按既定组配执行。标题词表的功能是对优选出来的标题词从词义、词形、词间关系和用法等方面进行管理和控制。保证一种事物只用一个标题词表达,一个标题词只表达一种事物或含义,避免使用过程中的混乱。标题词法有较好的直接性和专指性,通用性强,比较适用于特性检索,但灵活性较差。
2)元词法。元词法主张用最基本的、不能再分的词汇——单元词作主题词,单元词从信息内容中抽出,再经规范,能表达一个独立的概念。比如,“计算机软件”不是单元词,而“计算机”和“软件”是单元词,在英语中单元词经常是一个单词。元词法的突出特征是:强调词汇的单元化;强调后期组配。元词法虽然提高了主题法的灵活性,但由于它过分强调词汇单元化,词汇处理方法又不甚合理,易发生错误组配,误检率较高,故实用性不是很好。
3)关键词法。关键词法是直接从信息资料的标题、文摘或正文中抽取出能表达主题概念的具有实质意义的信息单元(关键词)作为主题词,然后按字顺序轮排以供信息检索的方法,关键词排序可组成供主题检索的索引系统,比如,《科学引文索引》中的“轮排主题索引”,其关键词就是从文献标题中抽取出来的。关键词法不受词表控制,快捷简便,适于用计算机组织和检索信息。但缺点是由于关键词法的词语不规范,影响了信息的查全率和查准率。
4)叙词法。叙词法是从叙词表中选取叙词,通过概念组配来描述信息资料的主题,使标引和检索达到更高专指度的方法。叙词法的显著特点是:检索时可由多个叙词形成任意合乎逻辑的组配,构成多种检索提问式。叙词法吸收了前述几种类型主题法的长处,具有直观、专指、灵活以及标引准确、查找方便等优点,在文献检索中得到了广泛的应用。目前,国内外大多数检索工具和数据库都采用叙词法,常用的叙词表有《INSPEC叙词表》、《原子能科学技术汉语主题表》、《国防科学技术主题词典》、《地质学汉语主题表》及《汉语主题词表》等。
3.4.6 信息存储
信息具有抽象性,它必须寄附在某种载体上才能表现出来。信息寄附在载体上的过程就是信息的存储过程。
3.4.6.1 信息存储的意义和作用
信息存储是指将经过加工处理后的信息按照一定的规定记录在相应的信息载体上,并将这些载体按照一定特征和内容性质组织成系统化的检索体系的过程。信息存储的意义和作用有以下几点。
(1)有利于共享。信息存储以后,用户就可以共享信息库,还可以反复使用,这样提高了信息的利用率。
(2)方便检索。将加工处理后的信息存储起来,形成信息库,就为用户检索到所需的信息提供了极大的方便。
(3)有利于集中管理信息,增大信息资源的拥有量和开发高层次的信息资源。
总之,在存储信息时,必须充分考虑到检索的方便性和高效性,做到存放条理化、分类合理化,检索清楚、取用方便。
3.4.6.2 信息存储的主要技术
传统的信息存储技术是指纸张印刷存储技术,现代信息存储技术主要包括缩微存储技术、声像存储技术、计算机存储技术以及光盘存储技术。它们具有存储容量大、密度高、成本低、存取方便等优点,所以得到了广泛的应用。
(1)纸张存储技术。纸张存储技术是最常用、使用时间最长的一种存储技术。但它有许多不足,表现为存储信息密度低、体积大、占用空间多,而且纸张易燃烧、受潮霉烂、遭虫蛀、风化等,不易保存。
(2)缩微存储技术。缩微存储技术是指利用摄影机将印刷品上的内容缩微拍摄到胶片上,冲洗成缩微胶片后予以存储。缩微存储技术的主要优点是:①存储密度高,可以节省用纸张存储信息空间的90%。②存储力法简单、成本低、比较经济。③保存期长,通常环境中保存期长达50年,在标准条件下可保存几百年。④缩微品忠实于原件,不易出错,同其他存储方法相比,其误码率为0。⑤采用缩微技术能将非统一规格的原始文件规范化管理。缩微技术还可以与计算机技术、通信技术结合使用,实现自动化检索。其不足之处是:必须借助缩微阅读机或缩微阅读复印机才能阅读,并且不能对照阅读,保存条件非常严格。
(3)声像存储技术。声像存储技术是指将信息通过录音或者录像等方式记录存储的一种信息存储技术,包括录音存储技术、录影存储技术和电影存储技术。
(4)光盘存储技术。光盘存储技术是利用激光和计算机,将各类信息数据化,并将其转化为光信号,记录在光盘上存储信息的新型存储技术。光盘存储技术具有以下特点:①存储密度高,容量大;②价格低廉,便于复制;③坚固耐用,存储寿命较长。光盘密封较好,不宜受尘土、有害气体以及电磁场的影响,而且它利用激光进行非接触式存取,使用寿命达10年以上。其主要缺点是:误码率比较高。
(5)计算机存储技术。计算机存储技术是指利用计算机的内外存储器来存储信息的一种技术,按照在计算机中的作用,可以将计算机的存储器分为内存储器和外存储器。其中,内存储器直接与CPU打交道,其主要特点是速度快、容量小、价格高;外存储器主要是内存储器的后备和补充,被人们广泛使用,其特点是存储量大、成本低、可以永久脱机保存信息。
3.4.7 信息分析
信息分析是信息组织过程中必不可少的重要一环,是通过已知信息提示客观事物的运动规律的过程。其主要任务就是信息研究人员借助于一定的方法和手段,使原有信息在更深入、更全面、更综合、更适用的层次上总结为全新的信息内涵,以满足用户解决特定课题的需要。
3.4.7.1 信息分析的功能
信息分析对其所研究的对象来说,具有整理、评价、预测和反馈四项基本功能。
(1)整理功能:对信息进行搜集、组织,使之由无序变为有序。
(2)评价功能:对信息价值进行评价,以去粗取精、去伪存真。
(3)预测功能:通过对已知修订稿内容的分析获取未知或未来信息。
(4)反馈功能:根据用户的实际消费效果对预测结论进行审议、评价、修改和补充。
一般来说,这四项基本功能是密切相关的,信息整理和评价是信息分析的两项基本性功能,是为预测和反馈功能的实现做准备;预测和反馈是信息分析的两项特征性功能,是信息整理和评价功能的进一步拓展和延伸。
3.4.7.2 信息分析的方法
信息分析方法是进行信息分析的工具,是实现信息分析工作的手段,虽然信息分析的内容千差万别,规模与范围大小各异,但它们的共同目标都是围绕特定的决策问题,通过对问题的发展历史与现状深入分析研究,来揭示其发展规律,预测其发展前途和趋势,这就决定了各种分析方法的共同特点和属性。信息分析方法主要有定性分析法和定量分析法。
(1)定性分析方法。定性分析方法即逻辑学方法,是建立在逻辑推理和辩证分析的技术之上,根据已知的信息,借助于比较、分析与综合、归纳与推理等一系列逻辑学手段来揭示事物的发展规律和因果关系的一种研究方法。定性分析法的优点是推论严密、直感性强。但不足之处主要是:其结论仅仅是一种定性的倾向而无定量的说明,不够具体和精细,不能完全适应技术经济或工程项目、市场预测等需要定量化研究的课题。
(2)定量分析方法。定量分析方法即数学方法,是利用基础数学、数理统计、应用数学及其他一切借助于数学处理和计算的研究方法的总称。这些方法的突出特点是:能对事物给出定量的描述,显示出事物发展的具体程度;运用数学方法研究事物关系时,研究者直接接触的是公式或模型等事物的同态系统,而不是事物本身。但定量分析法也有它的适用条件和局限性:数学计算时所采用的边界条件是人们依据客观事物抽象或假设出来的,这种抽象或假定是否合理,是否符合客观实际,在确定最终结论时要予以审核或验证;数学方法中所用的各种参量数据,有的是来自客观统计,有的则来自主观评估,因此数学方法研究的结果在信息分析研究的结论中只具有相对意义;客观事物往往是多参量的、动态的复杂系统,而客观事物的任何同态系统本质上都是近似的、静态的和简化的系统。
由此可见,逻辑学方法和数学方法各有所长。在信息分析研究中很难截然分开,一般来说,定性分析是定量分析的基础,定量分析旨在为定性分析的结论提供论据,印证定性分析的结果。在具体的信息分析活动中,往往趋向于把两种方法结合在一起使用。
1.确定调查对象。
注意:调查对象的选定是否恰当,对社会评价工作的成效具有至关重要的影响。
2.调查方案设计:调查方案的设计一般包括以下步骤:
(1)拟定调查提纲。(2)设计调查表。(3)决定调查研究的方式和方法
(4)制订工作计划,明确时间分配、人员配备、财务预算等。
3、收集整理资料
(1)按照调查提纲和调查表的问题全面地收集资料
(2)注意谈话技巧。
(3)应区别对象和场合决定采用神孝手记录方式或使用录音等工具,应以不游嫌影慎唯响被访者提供资料为原则
(4)为了克服语言和理解的差异,在被访者作答关键性的问题以后,访问者应重复答案以得到对方的确认或否定。
4、分析总结
一方面应用统计手段进行数量分析,研究这些调查资料所表现出的各种总体数量特征
另一方面应运用比较、归纳、推理或统计等方法发现各变量之间的内在联系,揭示数量特征及含义,得出社会调查结论。
信息组织即信息的有序化与优质化,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和排序,实现无序信息流向有序信息流的转换,从而使信息集合达到科学组合实现有效流通,促进用户对信息的有效获取和利用。 信息组织具有:类聚性,系统性,动态性,多重性,综合性。(1)信息选择:从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息,是信息组织过程的第一步。 (2)信息分析:按照一定的逻辑关系从语法、语义和语用上对选择过的信息内、外特征进行细化、挖掘、加工整理并归类的信息活动。 (3)信息描述与揭示:也称为信息资源描述,根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。 (4)信息存贮:将经过加工整理序化后的信息按照一定的格式和顺序存贮在特定的载体中的一种信息活动。 [编辑]
编辑本段信息组织的类型
1、按信息表现形式划分
(1)文字信息组织 (2)图像信息组织 (3)声音信息组织 (4)视频信息组织
2、按信息的加工程度划分
(1)一次信息组织 (2)二次信息组织 (3)三次信息组织
3、按信息的传播载体划分
(1)文献信息源 (2)非文献信息源 非文献信息源特指网络环境下没有以传统文献载体形式出现的信息源,如程序代码、网页、超文本等。为了学习的方便,我们统称为网络信息源。
(1)信息组织的渗透性
信息组织的渗透性指信息组织存在于各种信息揭示、存贮和检索活动之中。
(2)信息组织的依附性
信息组织的依附性指信息组织无法独立存在,它要以信息的识别、揭示等活动为前提。
(3)信息组织的增效性
信息组织的增效性指信息组织可以增加信息传播、检索、利用的效率,是其他信息加工活动和利用信息的保障。
编辑本段信息组织的原则
1.客观性原则
信息组织中进行描述和揭示的基本依据就是信息本身(the item obtained),因此,我们描述和揭示信息的外在特征和内容特征必须客观而准确,要根据信息本身所反映的各种特征加以科学地反映和序化,形成相应的信息组织的成果。
2.系统性原则
系统性原则要求在信息组织中把握好这四个棚毁关系: (1)宏观信息组织与微观信息组织的关系 (2)信息组织部门与其他部门的关系 (3)信息组织工作各个环节之间的关系 (4)不同信息处理方法之间的关系
3.目的性原则
信息组织具有鲜明的目的性,必须围绕用户的信息需求开展工作,注意信息机构的目标市场的需求状态及其变化特征,满足成本收益对称的原则。
4.现代化原则
信息组织现代化原则包括思想观念现代化和技术手段现代化两个方面。 信息组织的思想观念现代化集中体现在信息组织的标准化上,即信息组织工作漏厅的一致性、信息组织方法的规范性、信息组织系统的兼容性和信息组织成果的通用性。
编辑本段信息组织的要求
(1) 信息特征有序化。
一是要将内容或外在特征相同或者相关的信息集中在一起,把无关的信息区别开来;二是集中在一起的信息要有系统、有条理,按一定标识呈现链搜备某种秩序,并能表达某种意义;三是相关信息单元之间的关系要明确化,并能产生某种关联性,或者能给人某种新的启示。
(2) 信息流向明确化。
现代管理科学的基本原理表明,信息作用力的大小取决于信息流动的方向。信息整序要做到信息流向明确化。首先,要认真研究用户的信息需求和信息行为,按照不同用户的信息活动特征确定信息的传递方向;其次,要注意根据信息环境的发展变化不断调整信息流动的方向,尽量形成信息合力。
(3) 信息流速适度化。
信息流速的不断加快使人们感受到巨大的信息压力,眼花缭乱的信息流可能会降低决策的效率。同时,人们面对的决策问题在不断地发展变化,信息需要也在不断地更新。为此必须适当控制信息流动速度,把握信息传递时机,提高信息的效用。
编辑本段信息组织的目的
信息组织的目的可以概括为“实现无序信息向有序信息的转换”。具体地说,信息组织的目的应包括: ①减少社会信息流的混乱程度; ②提高信息产品的质量和价值; ③建立信息产品与用户的联④节省社会信息活动的总成本。
编辑本段信息组织的理论基础
信息组织是由来已久的一种人类社会实践活动,在其发展过程中,不断地从相关学科的理论和方法中汲取营养,使自身逐渐得到充实和完善。 (1)系统理论 系统科学的思想是20世纪20年代由奥地利学者路得维希.冯.贝塔朗菲(Ludwig Von Bertalanffy)在研究理论生物学的时候提出来的,他把系统定义为“相互作用的诸要素的复合体”,认为系统是处于一定的相互关系中并与环境发生关系的各个组成部分的总体。系统具有整体性、内部相关性、环境相关性、层次性、有序性、目的性等特征。信息组织使信息有序化,使有组织的信息整体功能大于各个信息单元的功能之和。 (2)耗散结构理论 耗散结构理论由比利时布鲁塞尔学派领导人伊利亚.普里高津(Ilya Prigogine)提出。其基本思想有两点:一是系统内部非平衡是有序之源;二是开放系统通过与外界交换物质、能量而增加、维持有序性。信息组织通过与外界交换物质、能量与信息,对信息整序加工使信息系统成为远离平衡态的开放系统。因此,耗散结构理论可作为信息组织的理论基础。 (3)协同性理论 协同性由德国科学家哈肯(Haken)于1970年提出,是一门研究系统进化普遍规律的科学,它研究由许多子系统构成的系统是如何通过协作从无序到有序演化的规律。由于信息由许多信息单元构成,如何建立各个信息单元之间的协同作用机制,使信息由无序向有序转化是信息组织的基本目标。 (4)突变理论 突变理论由法国数学家托姆(R. Thom)提出,它用形象而精确的数学模型来揭示和预测事物的连续性中断的质变过程。突变理论的一个重要观点是“突变是产生有序性的重要源泉”。突变理论为信息组织理论的发展与完善提供了理论基础。 (5)知识组织理论 知识组织理论最早由英国著名的分类法学家布利斯(Bliss)提出。所谓知识组织,是指对知识客体进行诸如整理、加工、揭示、控制等一系列组织化过程,是关于知识组织的理论与方法。知识组织可分为主观知识的组织和客观知识的组织。主观知识的组织在人的大脑中进行,表现为复杂的神经生理活动,人工智能、认知心理学等重点研究主观知识组织的内在机理;客观知识的组织是通过人的认知进行分类,并凭借一定的方法完成的。信息组织主要关注客观知识的组织活动。 (6)信息自组织理论 信息自组织是信息组织方法的拓展,是信息组织理论研究中的新课题。不借助外部控制而能实现从无序到有序的转变,并维持稳定有序状态的系统称为自组织系统。信息自组织是指作为信息系统组成要素的信息,由于人与人之间、人与系统其他要素之间存在的相关性、协同性和默契性而形成特定结构与功能的过程,也就是信息系统无需外界指令而能自行组织信息,自我有序化和优化的过程。近年来,信息总量的持续增长、信息技术的飞速发展,使信息系统显著地具备了自组织的条件,特别是网络信息已经具有自组织的开放性、远离平衡和非线性相关等特征。因此,研究信息自组织理论对于网络信息的组织具有非常重要的理论与实践意义。
编辑本段图书信息
第三节 分类标引的方法与规则 一、辨类的方法 二、分类标引的基本规则 三、分类标引的一般规则 四、各学科信息的分类标引规则 五、确定分类法使用本与图书改编 六、同类书区分 第四节 主题标引的方法与规则 一、主题概念分解与查表选词的方法 二、选择标引词的一般规则 三、各类型主题与各类型文献的主题标引规则
第七章 信息组织中的自然语言应用
第一节 自然语言在信息组织中的应用概述 一、自然语言的演化 二、自然语言区别于受控语言的特点 三、自然语言处理及其在信息组织和检索中的应用 第二节 自然语言在信息组织中的应用 一、自动标引的实现基础——自动分词 二、自然语言标引 三、自动分类 第三节 自然语言检索系统与自然语言检索 一、自然语言检索系统概述 二、自然语言检索 三、全文检索 四、搜索引擎的自然语言检索 五、自然语言检索系统的优点及存在的不足 第四节 后控制检索 一、后控制机制概述 二、国内外后控词表研究及其应用现状 三、网络检索系统中的后控制技术
第八章网络信息组织
第一节 网络信息类型与特点 一、网络信息及其类型 二、网络信息的环境特点和组织的难点 三、网络信息组织的目标 第二节 网络信息的分类组织 一、传统分类法应用于网络信息组织 二、网络信息分类法与分类模式 三、网络信息自动分类 第三节 网络信息的主题组织 一、基于网络的叙词表的发展 二、叙词表在网络多媒体信息组织中的应用 三、主题法在网关中的应用 第四节 基于本体的信息组织 一、语义网信息组织新模式 二、本体基本原理 三、网络本体描述语言 四、本体构造 五、本体标注 第五节 网络信息组织方式 一、文件方式 二、数据库方式 三、主题树方式 四、搜索引擎方式 五、Web2.0信息自组织方式 第六节 网络信息重组与知识挖掘 一、网络信息重组与导航 二、网络知识挖掘
第九章 数字图书馆信息组织
第一节 数字图书馆信息组织概述 一、数字图书馆的发展 二、数字图书馆的含义 三、数字图书馆信息资源特点 四、数字图书馆信息组织的特点 第二节 数字图书馆信息组织的基本原理与方法 一、数字图书馆系统的基本结构 二、数字信息资源的信息结构 三、数字图书馆用户获取信息的模式 四、信息资源组织的基本原则 五、数字图书馆信息资源组织步骤 第三节 数字信息资源的描述 一、元数据的定义、类型 二、DC 三、MODS 四、XML与RDF 第四节 数字信息资源的标引与整合 一、数字信息资源标引与整合的含义 二、数字信息资源的分类标引与主题标引 三、非文本信息资源的标引与整合 四、异构数字资源库的整合 第十章 信息组织的历史发展与未来趋向 第一节 古代信息组织 一、信息组织产生的基础 二、古代的信息组织 第二节 近代信息组织 一、近代国外信息组织 二、我国近代的信息组织 三、近代信息组织的特点 第三节 现代信息组织 一、现代信息组织方法的发展 二、网络信息资源组织的探讨与实践 三、现代信息组织的特点 第四节 信息组织的发展趋势 一、信息组织环境的变化 二、以用户需求为导向的信息组织 三、信息内容揭示深入化 四、信息组织方法集成化 五、信息组织技术智能化 六、信息组织系统兼容化与标准化 七、信息组织工具易用化 八、信息组织理论研究的拓展 主要参考文献 附录一 中外重要信息组织工具简介 附录二 “信息组织”课程推荐书目
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)