18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 知识库机(数据库)

知识库机(数据库)

时间:2022-12-09 18:30:01 | 来源:信息时代

时间:2022-12-09 18:30:01 来源:信息时代

    知识库机 : 针对知识库管理和知识处理需求特点而设计的一类用于数据/知识处理的非传统计算机系统,是智能信息处理系统或新一代计算机系统的重要组成部分。有两种开发知识库机的途径: 一种是把知识库和推理机制直接联系起来,构成智能信息处理系统的核心; 另一种是把知识库粗分为事实库(关系型数据库)和规则库两大部分,用数据库机实现对事实库的管理与操作。知识库机的实现仍可以关系数据库和关系代数为基础,通过研究具有并行处理、数据流处理、推理机、层次存储器控制、路径网络等各种先进的知识库机结构来构成,使之具有知识处理和管理功能,以支持大量知识/数据的存储、检索和更新。有关知识库机的概念,不同学者根据知识表达方式和所采用的程序设计语言的不同,提出和研发了具有多种不同体系结构的知识库机。
1. 知识库机及其发展
知识库机(knowledge base machine)可视为一种面向知识管理的数据库机,它能在硬件及软件上支持知识的表示、存储、检索、更新和获取等工作。同数据库机的产生和发展一样,知识库机一般也是建立在关系数据库系统的基础上。因为,关系数据模型具有较好的数据独立性和算法集的一致性,以关系运算和关系演算为基础,加上知识处理,可用于现实世界中的知识管理和知识处理。
知识处理和数据处理的主要区别在于: 前者总是与某种启发式搜索或推理机制结合在一起,而不仅仅是对知识库的检索。为了有效地支持知识处理,知识库机往往总是与包括数据库机在内的计算机系统,紧密地联系在一起。事实上,知识的编码表示本身,也离不开对数据库的存取操作。知识库机的提出和研发,是在20世纪80年代,受到日本提出的“第五代计算机”十年研究计划(1982~1991)的激励,随后英、法、德、美等发达国家竞相跟上,纷纷制订了各自所谓的“新一代计算机”研发规划而形成新一代计算机的研发热潮。例如,德国“欧洲计算机工业研究中心ECIRC”于80年代后期研制的一种PROLOG机ICMS;美国促进研究开发新一代计算机联合体MCC,则把知识库建立在一种多机并行处理的数据库机bubba的基础之上; 又如,日本新一代计算机研究所ICOT为支持在多个推理机组成的环境中,更为有效地进行知识处理,专门研制了一种关系型数据库机DELTA。此外,如果把数据库中所存储的内容,看作是一类断言性知识,或事实,也可以把数据库机作为知识库机的组成部分。
尽管数据库保存了客观世界的大量事实和关系(relation),甚至也可能包含约束条件和某些演绎推理规则,但是它只能回答对数据库中已有事实的查询(query); 知识库则不但能完成这种查询,而且还能根据已有的知识,进行演绎/归纳推理,推导出新的知识; 还可以通过机器学习,获得新的知识。
在知识库机研发过程中具有深远影响的两个重大事件应该是日本的“第五代计算机研究计划”和“现实世界计算”(real world computer,RWC)(也称“第六代计算机研究计划”了,是这些研究计划促进了数据库机向知识库机的演化与发展。
第五代计算机研究计划(知识信息处理系统KIPS): 在五代机计划实施前,有人曾经把直接支持某种知识表达方式的计算机归类为知识库机,如产生式机DADO等。按这种观点,KBM的基本结构就相当于一般理解的知识库系统,即它是由事实库、规则库、推理机制和控制机制所构成。按一般知识库机的概念,通常KBM主要有三种基本构造方式:①以推理机为核心,增加数据库的操作能力;②以数据库机为核心增加推理能力: ③将数据库机与推理机通过网络相结合构造成一个系统。然而,按日本第五代计算机计划KIPS中有关知识库机的设计方案,他们采用的就是第三种形式的知识库机构造方案。在第五代计算机的具体实施中,以关系型数据库机Delta与个人串行推理机PSI为核心组成知识库机,这种结构是以数据库机作为事实库与规则库构成智能存储部件,而推理机是根据需要来查询相应的事实库和规则库,并从事推理求证的操作,同时对规则库中规则的增减进行一致性检查,以实现对知识处理过程的控制。
作为第六代计算机计划的现实世界计算RWC是日本在第五代计算机(KIPS)计划后,针对现实世界的复杂性、不确定性、多变性和有误差等特点,提出并实施的新一代计算机计划,这个被称为RWC的21世纪新型信息系统,并不是要像第五代计算机(KIPS)计划的目标那样,要造出一种智能机器。RWC计划的构思是要引入像人那样的直感信息处理能力(intuitive information processing capability),使计算机系统不仅能处理数据和知识,而且能像形象思维那样进行灵活的信息处理。实际上,RWC着重于直感信息(形象思维)处理,即研究建立有关类似于人类灵活的信息处理(如处理图像等多媒体)和形象思维方面的智能理论及技术基础。其实,RWC计划中,大量涉及人工神经网络(artificial neural network,ANN)中大规模并行及分布式处理的概念与技术。在随后的知识库设计与实施的方案中都采用了人工神经网络、细胞(cellular)等结构来构建知识库机。
2. 知识库机的体系结构
知识库机宿主机的体系结构除冯·诺依曼的“存储程序概念”为核心的设计思想,即指令顺序对数据进行自动处理的计算机基本结构外,还可以采用:
(1) 数据流机: 以数据驱动为执行机制的非冯·诺依曼计算机结构。
(2) 归约机:基于归约模型的计算机结构,其基本思想是在函数的计算过程中通过替换来不停地修改计算目标,直到计算目标为最小单元为止。归约模型分为串归约和图归约两种,前者采用按值调用,后者采用引用调用。其典型代表是Berklin等研制的GMD串归约机和R.M.Keller等研制的图归约机。
(3)逻辑推理机:一种直接用产生式系统为计算模型的非冯·诺依曼计算机结构,是知识库机和知识库系统的有机组成,能直接用谓词逻辑进行演绎推理。
(4)脉动阵列:将若干简单的处理器连接起来组成计算阵列。可实现对数据进行流水式处理。脉动阵列算法具有模块性、规则性和邻接互连性,很适合采用VLSI实现。
(5)面向对象机制。
3. 知识库机的实现途径
与数据库机不同,知识库机的研发大都采用不同的计算机语言来实现,并以研发非冯·诺依曼体系结构的知识库机为目标,其主要实现途径如下:
(1)面向对象的程序设计语言的多机系统:采用面向对象(object oriented)程序设计风格,将数据结构及相关操作,即过程或函数,纳入“对象”之中。就“对象”外部而言,只有在“总控对象”调度下,通过“对象”间的消息交换,激发相应“对象” 内部,对其数据结构进行所定义的各项操作。
从20世纪70年代初开始,已先后提出了Smalltalk、Ada等多种面向对象的程序设计语言。由于“对象”的结构很适合知识的框架表达方式; “对象”之间的继承关系,又正好与语义网中的“IsA”语义联系相对应。因此,完全可以将面向对象的程序设计语言作为一种人工智能(AI)语言,用来研发知识库机。例如,日本ICOT(新一代计算机研究所)开发的ESP(extended self-contained Prolog)语言,就是把Smalltalk-80面向对象的概念和PROLOG逻辑程序设计语言相结合的一种AI语言环境。又如美国Intel公司于1981年投入市场的iAPX432,就是第一个实用的面向对象多处理机系统,该系统采用了Ada语言作为机器语言的重要组成部分,并利用Ada语言的“包块(package)”结构来表示“对象”。
(2)具有函数程序设计风格的多处理机系统:通常,函数程序设计有λ-函数和Backus函数两种不同的程序设计风格。前者可追溯到1930年Church提出的λ-运算(lambda calculus)。后来McCarthy在20世纪60年代初期开发的面向表(list)处理的语言LISP,就是一种典型的λ-函数程序设计风格的语言,并且在AI领域获得了广泛应用; 后者由John Backus提出,他系统地阐明了函数程序设计(FP)风格及其数学理论基础。1976年,MIT人工智能实验室研制了LISP机CONS; 随后经改进又分别研制了LISP机CADR、VLSI LISP处理器和Symbolics-3600LISP机。80年代开始,出现了一系列商品化的LISP机。例如: ①可运行在Xerox-1100工作站上的InterLISP的开发环境和仿真器;②美国Utah大学研制一种具有松耦合树型结构的LISP多处理机AMPS,其目的在于开发LISP程序的并行性。③美国 Lisp Machine Inc.(LMI)公司研制的LISP机Lambda,由一组NuBus高速总线的多处理器,并按模块扩充后组成。系统可提供较大的虚拟存储空间。④美国北卡州大学的Mago教授,针对Backus纯FP语言的特性,提出了一种采用二叉树互联结构的“细胞”机MAGO,每个“细胞”是一个VLSI处理器。MAGO是最早为实现Backus纯FP语言程序并行运作的多处理机系统结构之一。
(3)基于单赋值语言的数据流机:所谓单赋值语言是指在一个程序中,每一个变量只赋值一次。也就是说,不允许同名变量在不同语句的左边出现一次以上。例如,x=A+B,x=x+1,y=(x+c)×d不是单赋值语言。但x=A+B,x1=x+1,y=(x1+c)×d就体现了单赋值语言的性质。关于数据流计算模式的研究,可以追溯到20世纪60年代。但直到70年代末期至80年代,在美国、英国、日本等国的一些知名大学或研究机构都先后研制了各自的多种数据流机实验样机,其目的是验证数据流计算模式的可行性、合理性和有效性。例如,美国MIT的J.Dennis和Arwind等人研制了静态和动态两种不同的MIT数据流机试验系统; 英国曼彻斯特大学研制的一种数据流机实验样机于1981年投入运行; 日本电子综合研究所(ETL)则在20世纪80年代中期研制成功EM-3和SIGMA-11两种数据流机等。
(4)基于逻辑程序设计风格的并行推理机:1970年,英国帝国学院的R.Kowalski教授提出通过演绎推理将常规程序设计改变为逻辑程序设计风格,这为基于归结(resolution)原理的程序设计奠定了理论基础。1972年,R.Kowalski与法国马赛大学的A.Colmereaer教授创立了基于一阶谓词逻辑的PROLOG语言。但这种逻辑语言在传统计算机上实现演绎、推理,效率较低。后来,日本“第五代计算机”十年研究计划执行过程中,以PROLOG语言为基础研发了两种不同控制机制的并行推理机系统PIM-R和Kabu-wake多处理机系统。前者由100多个推理单元(IM)组成,每个IM是一个MC68000单板机; 后者也采用多个MC68000为处理单元(PE)组成。(kabu-wake在日语中是作业分裂{job split}的意思,其含义是,当进行目标分解的规约推理时,一个目标进程将派生若干个子进程。如果进程较大,不足以全部容纳在一个PE时,就自动把一个大的作业分裂为两个较小的作业,并把其中之一分配给另一空闲或尚有潜力的PE去处理)。
知识库机和智能计算机的实现途径主要有: ①在通用计算机上配置知识处理软件;②研制基于人工智能语言的知识库机及智能机,如LISP机、Symbolic 3600、Explorer;③研制功能专用的智能机,如数据库机(DBC、Delta等)、知识库机(Mu-X,PRISMA)、图像计算机(VICOM)等; ④在通用计算机上扩充专用的智能部件,如在通用计算机上增加神经计算机协处理器; ⑤研制新型部件支持的智能机,如神经计算机、光子计算机、分子计算机、细胞计算机等。上述多种实现途径,促使了多种知识库机的设计方案、实验样机和产品的出现。
4. 知识库机范例
知识库机及智能计算机的研究可分为两大类:一类是构造专用系统,支持符号计算。这类系统以日本五代机计划、ALICE、Flagship等为代表,其优点是能高效进行符号计算,获得符号处理系统的支持; 缺点是系统太专用,缺乏对数值计算的高效支持和丰富的软件系统,不能满足不同用户的多种需求。另一类是构造通用系统,并在其上建立支持符号计算的多种说明性语言系统。这类系统以GRIP、ESPRIT415子计划B、PAM等为代表,其特点是既能保持高速数值运算和较丰富的软件特色,又能满足多种用户的需求,达到高效支持符号计算的目的。以下为知识库机范例。
(1)个人串行推理机(personal sequencial inference machine,PSIM): 是日本第五代机计划初期的知识库机产品,由日本新一代计算机研究所ICOT1984年研制成功。该知识库机将系统分为事实库和规则库两部分。用数据库机实现对事实库的管理和操作,而规则库部分用于逻辑推理。系统相当于一台串行推理机(SIM)体系结构的工作站,由一种类似PROLOG语言的 KL-0作为核心语言,具有20K-30KIPS的逻辑推理能力。
(2) 并行推理机(parallel inference machine,PIM): 是日本五代机计划中由ICOT研制的作为五代机系统(FGCS)的硬件核心部件。由多个结构存储模块、推理模块和一个或多个互联网络组成。在体系结构上有多种灵活的实现方案。典型的代表有PIM-R和PIM-D。PIM-R采用归约(规约)机制,并以并行方式执行Concurrent PROLOG。PIM-D采用数据流机制,并能进行并行及合一操作。
(3) Delta: 是ICOT的K. Murakani等人利用局域网,将关系型数据库机与个人串行推理机(PSIM)连接起来,同时实现了数据/知识处理,这就是1984年由ICOT研制成功的Delta知识库机。Delta是五代机计划初期硬件环境的重要组成部分。原理上相当一个关系数据库机,由一个网络接口、一个控制处理器和四个关系处理机组成。关系处理机中有专门的排序和归并硬件,能对网络上接收到的关系查询作出快速响应和高效地进行复杂的数据库操作。Delta的设计目标是支持知识库的推理工作,作为五代机的知识库机的组成部分。Delta由RDBM管理器、处理子系统RSP和多级存储子系统HM构成。处理子系统RSP承担整个控制/监督和操作处理。多级存储子系统HM负责关系数据的存储、检索和修改。
(4) ICM3: 是欧洲计算机工业中心(European computer industry research center,ECRC)开发的一种PROLOG计算机,它作为协处理器运行在主机系统与工作站环境中。用于提高知识库机的推理效率。该系统为后来开发的PROLOG/LISP协处理器KCM(knowledge crunching machine)提供了经验。ICM3 的设计思想源于Warren抽象机(Warren abstract machine,WAM)。
(5) Bubba: 是美国新一代计算机研究开发机构MCC研制的一种并行数据库/知识库机,用以支持包括知识处理在内的广泛应用。系统由大量自主的结点处理机通过高速互联器件通信联系来组成。设计中,针对数据/知识处理的特点,系统采用了将数据库/知识库管理功能融合为一体的分布式操作系统的核心KEV,由它控制系统的运行。同时Bubba还采用基于对象模型的语言Fad作为用户接口,以支持用户自定义抽象数据类型。
(6)连接机(connection machine): 美国Thinking machine公司在20世纪80年代末期研制的知识库机产品,型号有CM-1、CM-2、CM-5等。该机器源于MIT的W.Daniel的设计思想: 将大量简单的存储-处理单元连接成多维机构,构成一个大容量的智能存储器,并采用常规的计算机控制程序和I/O等操作。如CM-5连接机是20世纪90年代产品,有16384个具有RISC处理器的结点组成。
(7)细胞机(cellular machine): 又称细胞阵列机(cellular array machine)。由大量相同功能的处理单元(细胞)构成的计算阵列。常见的如网状结构,每个处理单元连接对应网格上一个结点,与邻近的四个结点互联。细胞阵列可包含成千上万个单元。典型的有ILLIACⅢ、 CLIP、 DAP和MPP等细胞机。
(8)单元计算机TRANSPUTER: 美国INMOS公司在20世纪80年代研制的知识库计算机产品,是为适应多机系统而设计的一种知识库机组件。能将数据通信和计算有效结合,在多个TRANSPUTER芯片间进行高速传输。产品型号有T400、T800、T900等。
数据库和人工智能技术的进展,为数据库机、知识库机和智能计算机的发展创造了条件,经过多年来的努力,在研究和应用领域都取得了一定的成果,但其应用效果和解决实际应用问题的能力还不强。同智能计算机的研发一样,数据库机和知识库机还处于研究或试验阶段,尚没有完善的商品化产品。虽然近年来其研究和应用有些冷却,但在学术研究领域尚没有停止步伐。目前,数据库机、知识库机和智能计算机的研究和发展处于低潮,其原因是多方面的:①人类对智能的本质和特点了解不够;②关键技术还没有取得突破; ③对智能的基础研究重视不够。相信只要重视基础研究,突破关键技术,开拓应用领域,扬长补短,未来数据库机、知识库机和智能计算机的研究必将取得重大发展。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭