符号化知识表示
四种知识建模方式:严格结构化符号表示,松散结构化/自由形式 符号表示,数值化表示,数值与符号融合表示。
表示方法的衡量:表达能力、推理能力、计算能力、可读性。
目前的语义网革命并不是在科学上有革命性的突破,而大部分是工程上的挑战,其中标准化、规模化、系统开发与集成、用户交互等都是语义网技术面临的挑战。
课程复习使用。
一. 经典知识表示理论
1.1 产生式规则
-
产生式规则:用于表示事物之间的因果关系。
-
确定性规则:P->Q。
-
不确定性规则:P->Q(置信度)。当事实与前提条件不能精确匹配时,按照置信度的要求模糊匹配,并按特定算法将不确定性传递到结论。
-
产生式系统:由数据库、规则库和推理机三部分组成。
数据库:用来存放问题的初始状态、已知事实、推理的中间结果和最终结论等。
规则库:用来存放与求解问题有关的所有规则。
推理机:用来控制整个系统的运行,决定问题求解的线路,包括匹配、冲突消解、路径解释等。
正向推理:类似于命题逻辑(查看知识计算)中的前向链接,从事实出发,通过规则获取结论。
反向推理:类似于命题逻辑中的反向链接,从目标出发,反向使用规则,求得已知事实
1.2 语义网络
-
语义网络:一种将相关概念联系起来的 有向图表示的 知识系统。
-
语义基元:语义网络中最基本的语义单元,用三元组形式表示,<节点1,关系,节点2>。
-
语义网络系统:由知识库和推理机组成。
-
优点:使用直观的图结构来描述知识,表达自然,而且方便于计算机的存储和检索,有较为成熟的应用。
-
缺点:由于缺少形式化的语义定义,不同的语义网络之间难以互相操作,表示不完善。推理过程复杂。
1.3 框架
框架是一种描述所论对象属性的数据结构。
- 框架名:用来指代某一类或某一个对象。
- 槽:用来表示对象的某个方面的属性,语义网络中的三元组也可看作槽结构。
- 侧面:从不同侧面描述某个属性。
- 值:槽/侧面的取值。
- 类型:类框架,实例框架。
- 层次结构:子类-subclass of->父类,示例-instance of->类。
- 推理:继承推理(下层框架继承上层框架的信息),匹配推理(安装条件进行推理)。
1.4 脚本
脚本与框架类似,由一组槽组成,用来表示特定领域内一些事件的发生序列。但脚本表示的知识有明确的时间或因果顺序,因此它描述的是一个过程而非静态知识。
脚本的结构化表示包括:进入条件,角色,道具,场景,结果。
1.5 一阶谓词逻辑
由于语义网络、框架、脚本缺少形式化定义,不同网络之间难以相互操作,且推理过程复杂。因此引入了一阶谓词逻辑。参看知识计算。
1.6 描述逻辑
通过概念类别来描述物理世界,没有一阶谓词逻辑中变量和谓词的概念,但具有形式化定义。描述逻辑有概念描述、属性、个体三个基础部分组成。
- 概念描述:表示一类事物。
- 概念构造器:用两个概念描述构造出一个新的概念,有交集构造器、并集构造器、否定构造器。
- 属性:作用于概念,必须搭配全称量词 $\forall$,或存在量词 $\exists$使用。
- 个体:概念示例。
- 知识库:包括术语(TBox,描述概念定义、公理),断言(ABox,描述个体知识)两部分。
二.语义网的知识描述体系
- 本质:以Web数据的内容(即语义)为核心,用机器能够理解和处理的方式链接起来的海量分布式数据库。
- 特征:Web上的事物拥有唯一的URI(通用资源标识符),事物之间存在显示链接,事物链接又具有不同的语义类型。
- XML:由起始标签、元素内容和结尾标签构成,并且元素具有嵌套结构,同时没有约束嵌套的深度。
- RDF:Resource Description Framework。由于XML只定义了文档结构和数据类型,没有定义数据的语义,机器仍然无法理解文档的内容。为了让应用程序理解数据的语义,定义了RDF。RDF利用Web标识符(URI)来标识事物,并通过指定的属性和相应的值描述资源的性质或资源之间的关系。
注意:RDF并不是一种语言,只是一种书写规范。
-
RDFs
-
OWL: Web Ontology Language,相比于RDFS,添加了更多用于描述类和属性的建模原语,支持更加丰富的语义表达并支持推理。
-
RIF: Rule Interchange Format,一种不同的规则语言和推理引擎之间的交换格式。
三. 参考资料
中国科学院大学陈玉博老师 知识工程 课程课件