18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 情报数据库(数据库)

情报数据库(数据库)

时间:2022-11-07 00:30:01 | 来源:信息时代

时间:2022-11-07 00:30:01 来源:信息时代

    情报数据库 : 在情报检索系统中起支撑作用的数据库。根据ISO/DIS 5127(文献与情报工作术语)的定义,情报数据库是至少由一种文档(file)组成、能满足特定目的或特定数据处理系统需要的数据集合。
情报数据库的发展与信息检索的发展紧密相连。最早的情报检索系统可以追溯到1954年美国海军军械试验中心在IBM7O1上首次进行的情报检索实验,其后经历了脱机批处理、联机检索、光碟检索与网络化检索等四个阶段。在这个过程中,情报数据库存储的内容从早先的文献替代物发展到文献全文; 数据类型从文本发展到多媒体; 数据量从小规模发展到海量; 文档的组织方式也先后经历了流式文档、顺排文档、索引文档、倒排文档等形式,前两者是完整的顺序信息记录,后两者则是将前面文档中的可检属性抽出重排而派生出的数据记录。
根据情报数据库内容的形式可以将其划分为四大类:
(1)书目文献数据库(bibliographic databases):存储某个领域原始文献的书目,即二次文献数据库,记录内容通常包括文献的题名、著者、出处、文摘、关键词等。书目文献数据库大多是早先印刷型检索工具的机读版,如工程索引(EI compendex)、科学文摘(INSPEC)、化学文摘(CA search)等。
(2)事实型数据库(factual database):也称为指南数据库(dictionary databases),主要记录机构、人物、产品、项目简况等事实数据。通过该类数据库可以检索到公司、组织的地址、电话、产品目录、研究项目或名人简历等信息。
(3)数值型数据库(numeric databases):数值型数据库中信息内容的表示形式主要是数值型数据,通常用于记录试验、测量、计算、工程设计、经济分析和工业规划等方面的数据。该类数据库有时也会含有一些文字形式的信息内容,但数量极少且只用于定义数值数据,有学者称这类数据库为文本-数值型数据库(textual-numeric databases)。
(4)全文数据库(full-text databases):是将经典著作、学术期刊、重要的会议录、法律法规、新闻报道以及百科全书、手册、年鉴等的全部文字和非文字内容转换成计算机可读形式的数据库,简称全文库。全文数据库可以解决用户在检索书目文献数据库后难以获取原始文献的困难,能向用户提供一步到位的信息服务。近年来,全文数据库建设速度很快,在各类数据库中所占的比例逐年上升。
四类情报数据库中,书目文献数据库与指南数据库提供的信息通常不完备,用户在这些数据库中获取有关文献替代物的信息后还需进一步查找原始文献,不能提供一步到位的信息服务。数值型数据库与全文数据库提供的信息则相对完备,用户一般不必再检索其他信息源即可满足信息需求。
除了上述四种基本的情报数据库类型之外,还有多种混合类型,主要有光碟数据库以及引文数据库等。目前,随着多媒体技术的迅速发展和广泛应用,将图形、图像、文字、动画、声音等多媒体数据与数据库技术相结合所衍生出来的多媒体数据库已经比较成熟,该种类型的情报数据库有利于多媒体数据的存取、管理和应用,受到用户的普遍欢迎。另外,根据情报数据库内容的来源又可以将其划分为图书、期刊、报告、会议文献、专利文献、标准文献、学位论文、产品资料、技术档案以及报纸等类型的专用数据库。
尽管情报数据库已经得到了广泛的应用,但其技术本身仍然处于不断的发展之中,具体表现为以下几大发展趋势:
(1)社会化:情报数据库的内容从科学技术向经济管理、社会生活等各个领域拓展。目前,情报数据库已从科学技术领域扩大到企业、管理、市场、新闻、法律、社会生活等各个领域。
(2)产业化: 情报数据库作为一种智力型的产品,其生产和服务的市场产值越来越大,从产值或产业结构来看,情报数据库行业已经具有产业化的规模和地位。
(3)资源化:情报数据库的发展和对社会各领域的渗透,提高了信息产业的社会地位。人类的知识可以创造无穷的物质财富,情报数据库则是控制和处理知识的重要工具。
(4)加工深度化:信息技术在不断更新换代,情报数据库采用新信息技术的周期越来越短,新兴的网络技术、智能技术、多媒体与超媒体技术已经渗透到情报数据库的内核,信息技术的交叉融合提高了信息加工和利用的深度。
为了方便用户的检索利用,需要对情报数据库中的信息进行标引(indexing)。标引是将信息中具有检索特征的词语或标志(也称为索引点)抽出制成索引(index)的过程。标引可分为手工标引和自动标引两大类。标引的控制一般依据情报检索语言进行,具体的检索语言又可分为先组式和后组式,前者以各种分类法、标题词法等为代表,后者以停用词表、单元词法、叙词法和关键词法等为代表。手工标引一般多采用分类法、标题词法、单元词法以及叙词法等检索语言。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭