分类目录: 《知识图谱从入门到应用》总目录
相关文章:
· 知识图谱的知识表示:基础知识
· 知识图谱的知识表示:符号表示方法
· 知识图谱的知识表示:向量表示方法

在前面的文章中已经多次提到,知识图谱采用图的方式描述和表达知识,相比于简单图,能建模更加复杂的事物关系,但比起形式化逻辑,又免于复杂的逻辑约束,使得知识的获取过程变得更加容易。但在知识图谱的实际实践中,不同的应用场景会对知识的建模采用不同表达能力的图表示方法。例如有些应用场景仅采用最简单的无向图,通常适合于对建模要求不高,偏于数据挖掘类的应用场景。知识图谱表示应用最多的是有向标记图(Directed Labelled Graph)。最常用的两种有向标记图模型,一种叫属性图(Property Graph),另外一种是RDF图模型,如下图所示:
基于图的知识表示方法
但有向标记图的表达能力依然是有限的,在很多专业领域,如医学本体构建等,需要更为复杂的关系语义的表示,例如描述对称关系、自反关系、传递关系等,这就需要用到OWL等本体描述语言。本文重点介绍知识图谱领域三种最常用的知识表示方法——属性图、RDF图模型和OWL本体语言。

属性图是图数据库Neo4J实现的图结构表示模型,在工业界有广泛应用。属性图的优点是表达方式非常灵活,例如,它允许为边增加属性,非常便于表示多元关系。属性图的存储充分利用图的结构进行优化,因而在查询计算方面具有较大优势,关于这一点将在知识图谱的存储文章中做更加具体的介绍。属性图的缺点是缺乏工业标准规范的支持,由于不关注更深层的语义表达,也不支持符号逻辑推理。在属性图的术语中,属性图是由顶点(Vertex)、边(Edge)、标签(Label)、关系类型和属性(Property)组成的有向图。顶点也称为节点(Node),边也称为关系(Relationship)。在属性图中,节点和关系边是最重要的表达要素。节点上包含属性,属性可以以任何键值形式存在。关系边连接节点,每条关系边都有拥有一个方向、一个标签、一个开始节点和一个结束节点。关系边的方向的标签使得属性图具有语义化特征。和节点一样,关系边也可以有属性,即边属性,可以通过在关系边上增加属性给图算法提供有关边的元信息,如创建时间等。此外还可以通过边属性为边增加权重和特性等其他额外语义。
属性图

RDF图模型

RDF是国际万维网联盟W3C推动的面向Web的语义数据标准,所以RDF本身的定位首先是数据交换标准规范,而非存储模型。RDF的基本组成单元是三元组,即 (s,p,o) ,例如,可以用一条三元组来描述 <浙江大学, 位于, 杭州> 。一条三元组代表关于客观世界的逻辑描述或客观事实。多个三元组头尾相互连接,就形成了一个RDF图。本质上,RDF图也是一个有向标记图。RDF还提供了基础的表达构件用于定义类、属性等Schema层的术语。例如, domain range 用于定义某个关系的头尾节点类型, subClassOf subPropertyOf 用于定义类及属性之间的层次关系等。有了RDFS,已经可以实现最简单的符号推理。如下图所示,如果将谷歌定义为一家人工智能公司,同时也知道人工智能公司是高科技公司,就可以推理得出谷歌也是一家高科技公司。这类简单的推理已经可以减轻数据维护的负担,因为很多查询结果可以通过推理间接得出,而不用对所有结果进行全量存储。
RDF图模型

OWL本体语言

RDF+RDFS的表达能力是非常有限的。在实际应用中,需要定义更为复杂的概念,刻画更为复杂的概念关系。这就需要用到OWL等本体表达语言。本体(Ontology)原来是一个哲学术语,后来被人工智能的研究人员作为知识表示研究的对象引入计算机领域。本体最常用的逻辑表达语言即描述逻辑(Description Logic)。系统性介绍描述逻辑的内容超出了本书的范围,接下来主要结合国际万维网联盟推动的OWL本体语言标准来介绍相关的基本知识。OWL首先可以被看作RDF Schema的扩展。OWL在RDF的基础上增加了更多的语义表达构件:

  • 通过多个类组合定义更加复杂的类
  • 刻画关系的一对多、多对一、多对多等关系基数(Cardinality)约束
  • 定义常用的全称量词和存在量词
  • 定义互反关系、传递关系、自反关系、函数关系等更加复杂的关系语义等

在这里举例介绍几种典型的OWL表达构件。例如可以使用等价性声明表达构件 owl:equivalentClass owl:equivalentProperty owl:sameIndividualAs 来分别声明两个类、两个属性或两个个体的等价关系。再比如可以声明传递关系,如 <exp:ancestor rdf:type owl:TransitiveProperty> 声明了 ancestor 是一个传递关系,当知识库中存在 <exp:小明exp:ancestor exp:小林> <exp:小林exp:ancestor exp:小志> 两条知识时,就可以推理得出 <exp:小明exp:ancestor exp:小志> 。类似地,也可以声明互反关系,如 <exp:ancestor owl:inverseOf exp:descendant>声 ancestor descendant 是互反的,当知道 <exp:小明exp:ancestor exp:小林> ,就可以马上在知识库中新增一条 <exp:小林exp:descendant exp:小明> 的新知识。

还可以声明某个关系必须满足函数约束,例如声明 <exp:hasMother rdf:type owl:FunctionalProperty> ,这样 exp:hasMother 就是一个具有函数性的属性,因为每个人只有一个母亲。这将作为约束作用到整个知识库,不允许知识库中出现一个人同时有两个母亲。还可以声明属性的全称限定,例如, owl:allValuesFrom 声明 exp:hasMother 在主语属于 exp:Person 类的时候,宾语的取值只能来自 exp:Women 类。同样地,可以声明属性的存在限定,通过 owl:someValuesFrom 声明 exp:publishedIn 在主语属于 exp:SemanticWebPaper 类的时候,宾语的取值部分来自 exp:AAAI 类。

OWL拥有众多的表达构件,本文不对它们做完整的介绍。OWL实际上有很多语言家族,不同的语言家族代表不同的表达构件的组合。不同的组合对应不同的推理计算复杂度以及它们所适用的场景。如下图所示,OWL-QL表示查询语言的意思,专为基于大规模的查询设计的子语言;OWL 2 RL在扩展RDFS表达能力的同时,保持了较低的复杂度;OWL 2 EL专为概念术语描述、推理而设计,在生物医疗领域广泛应用,如临床医疗术语本体SNOMED CT等。在后面的文章还将结合推理能力对表达语言进行介绍。
OWL本体语言
综上,属性图是工业界最常见的图谱建模方法,属性图数据库充分利用图结构特点做了性能优化,实用度高,但不支持符号推理。RDF是W3C推动的语义数据交换标准与规范,有更严格的语义逻辑基础,支持推理,并兼容更复杂的本体表示语言OWL。在三元组无法满足语义表示需要时,OWL作为一种完备的本体语言,提供了更多可供选用的语义表达构件。描述逻辑可以为知识图谱的表示与建模提供理论基础。描述逻辑之于知识图谱,好比关系代数之于关系数据库。

参考文献:
[1] 陈华钧.知识图谱导论[M].电子工业出版社, 2021
[2] 邵浩, 张凯, 李方圆, 张云柯, 戴锡强. 从零构建知识图谱[M].机械工业出版社, 2021

知识图谱 知识 表示 前言1. 概述 知识 定义 知识 分类 知识 表示 知识 表示 准则2. 一阶谓词逻辑 表示 法基本概念:命题与联结词基本概念:个体词、谓词与量词 一阶谓词逻辑 表示 法 产生式规则 表示 法 框架 表示 法 脚本 表示 法 语义网 表示 知识图谱 中的 知识 表示 分布式 知识 表示 1. 概述 知识 定义 Feigenbaum 知识 是经过削减、塑造、解释和转换的信息。简单地说, 知识 是经过加工的信息。 Bernstein 知识 是由特定领域的描述、关系和过程组成的。 Hayes-Roth
知识图谱 是人工智能领域的一颗掌上明珠,也是当前的一个新兴研究热点。 知识图谱 领域的研究和发展,对于智能问答、语意搜索等场景有着巨大 应用 潜力。当前对于 知识图谱 的研究也在如火如荼的快速进行。 而对于 知识图谱 的学习,首先要对所有 知识 点有一个整体的宏观的认识。 在本场 Chat 中,会讲到如下内容: 知识图谱 的基本概念 知识图谱 历史发展 知识图谱 的主要内容 国内外 知识图谱 的典型项目 适合人群: 对 知识图谱 有...
文章目录一、导读二、 知识图谱 的概念演化三、 什么是 知识图谱 四、 知识图谱 的数据类型和存储方式五、 知识图谱 的架构六、 知识图谱 的构建技术七、 知识图谱 应用 八、总结 注:首先声明,本篇博客是博主在查询 知识图谱 的资料的时候,看了数篇 知识图谱 综述以及阅读了相关资料后的一个总结以及自己的相关理解,仅是为了记录学习的过程。如果有侵权,请第一时间联系博主。博主是一位刚接触 知识图谱 的小白,初学乍练,希望可以每天进步...
根据复杂性从弱到强:命题逻辑(propositional logic)、一阶谓词逻辑、高阶逻辑。 (1)命题逻辑 定义了具有真假值的原子命题,并可通过与(⋀\bigwedge⋀)、或(⋁\bigvee⋁)、非 只要推论是真,命题就一定为真;推论为假的时候,看假设是否与推论的真值一致,一致的话,命题为真,不一致的...
基于 符号 知识图谱 表示 方法 RDF 是最常用的 符号 语义 表示 模型。 RDF 的基本模型是有向标记 (Directed Labeled Graph) 。 中的每一条边对应于一个三元组(Subject-主语,Predicate-谓语,Object-宾语) 。 一个三元组对于一个逻辑表达式或关于世界的陈述 (Statement) RDF S RDF 提供了描述客观世界事实的基本框架,但缺少类、 属性 等 Schema 层的定义手段。 RDF S( RDF Schema)主要用于定义术语集、类集合和 属性 集合,主要包括如下