知识图谱数据管理
知识图谱的目标是构建一个能够刻画现实世界的知识库,为自动问答、信息检索等应用提供支撑。因此,对知识的持久化存储并提供对目标知识的高效检索/更新是合格的知识图谱(系统)必须具备的基本功能,也是知识图谱数据管理的主要研究内容。
课程复习使用。
一.符号化知识图谱数据管理
1.1 知识图谱数据模型
数据模型主要包含逻辑组织结构、操作、约束三部分,它决定了数据管理所采取的方法和策略,对于存储管理、查询处理、查询语言设计均至关重要。常见的数据模型有层次数据模型,网状数据模型,系数据模型。
- 逻辑组织结构(数据结构):描述数据的类型、内容、性质以及数据间的联系等。
- 数据操作:描述在相应的数据结构上的操作类型和操作方式。
- 数据约束:描述数据结构内数据间的语法、词义联系、他们之间的制约和依存关系,以及数据动态变化的规则,以保证数据的正确、有效和相容。
1.2 知识图谱数据的存储
- 基于表结构的存储:关系数据库。
- 基于图结构的存储:常见的图数据库存储系统,如Neo4j, OrientDB, HyperGraphDB, InfiniteGraph, InfoGrid.
1.3 知识图谱数据的检索(查询)
知识图谱查询语言可分为 声明式语言(描述“是什么”而不是“怎么做”,它关注的是结果而不是实现结果的过程),过程式语言(描述“怎么做”,它定义了一系列的步骤或指令来实现目标,如图遍历、导航式游走)。
这些查询语言都有点类似于sql,可借助sql进行进一步理解。
二.参数化知识图谱(大模型)数据管理
2.1 大模型知识存储
一个流行的观点是:PLM的FFN(Feed Forward Nerual Network)模块存储了大量知识。
2.2 大模型的知识编辑(检索与更新)
- 知识编辑的目标:定向更新模型中具有的知识,该过程应当尽可能地保证有效、能泛化、避免对无关知识产生不良影响
- 逻辑研究对象:三元组
- 评估方法:提示生成,看结果是否符合预期
- 评估指标:有效性,泛化性,专一性,流畅度
- 知识编辑的实现方法
三.参考资料
中国科学院大学陈玉博老师 知识工程课程课件
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.