知识图谱的目标是构建一个能够刻画现实世界的知识库,为自动问答、信息检索等应用提供支撑。因此,对知识的持久化存储并提供对目标知识的高效检索/更新是合格的知识图谱(系统)必须具备的基本功能,也是知识图谱数据管理的主要研究内容。

课程复习使用。

一.符号化知识图谱数据管理

1.1 知识图谱数据模型

数据模型主要包含逻辑组织结构、操作、约束三部分,它决定了数据管理所采取的方法和策略,对于存储管理、查询处理、查询语言设计均至关重要。常见的数据模型有层次数据模型,网状数据模型,系数据模型。

  • 逻辑组织结构(数据结构):描述数据的类型、内容、性质以及数据间的联系等。
  • 数据操作:描述在相应的数据结构上的操作类型和操作方式。
  • 数据约束:描述数据结构内数据间的语法、词义联系、他们之间的制约和依存关系,以及数据动态变化的规则,以保证数据的正确、有效和相容。

图片 图片

1.2 知识图谱数据的存储

  • 基于表结构的存储:关系数据库。
  • 基于图结构的存储:常见的图数据库存储系统,如Neo4j, OrientDB, HyperGraphDB, InfiniteGraph, InfoGrid.

1.3 知识图谱数据的检索(查询)

知识图谱查询语言可分为 声明式语言(描述“是什么”而不是“怎么做”,它关注的是结果而不是实现结果的过程),过程式语言(描述“怎么做”,它定义了一系列的步骤或指令来实现目标,如图遍历、导航式游走)。

图片 图片

这些查询语言都有点类似于sql,可借助sql进行进一步理解。

二.参数化知识图谱(大模型)数据管理

2.1 大模型知识存储

一个流行的观点是:PLM的FFN(Feed Forward Nerual Network)模块存储了大量知识。

2.2 大模型的知识编辑(检索与更新)

  • 知识编辑的目标:定向更新模型中具有的知识,该过程应当尽可能地保证有效、能泛化、避免对无关知识产生不良影响
  • 逻辑研究对象:三元组
  • 评估方法:提示生成,看结果是否符合预期
  • 评估指标:有效性,泛化性,专一性,流畅度
  • 知识编辑的实现方法

图片 图片

三.参考资料

中国科学院大学陈玉博老师 知识工程课程课件