相关文章推荐
急躁的煎鸡蛋  ·  【Nature ...·  1 年前    · 
高大的电脑桌  ·  ctrl c on mac terminal-掘金·  1 年前    · 
事理图谱:让机器学会分析决策

事理图谱:让机器学会分析决策

运用已有的知识与过往经验对事件进行分析、推演和选择是企业通常的决策模式,而事理图谱技术推动人工智能在认知领域取得了很大的进步,使得机器也可以像人一样进行分析决策。


引言:

通过建立描述事件、逻辑关系、转移概率的事理图谱,可以在日常分析决策场景中帮助我们快速梳理清楚事件的发展方向,影响范围,并推荐行动建议。机器学习属于黑盒算法,需依赖于大量的历史数据,其可解释性较弱,在企业经营分析领域的使用时具有局限性。而事理图谱则具有高可解释性、强逻辑性的特点,其运行原理也更类似我们思考问题的方法。目前该技术已在企业内部数据分析场景、金融投资分析场景、甚至国防情报分析场景有了创新型落地。


知识图谱:从事实到事理

人类是自然界创造的“智能体”,我们能在生物进化中成为地球主宰,其中最关键的是具有“认知”能力。认知能力是指经过人脑加工、存储和提取信息的能力。人类通过观察、学习、研究、理解、概括、推理、联想等能力,不断从客观世界获取各种各样的知识。并在人类的文明中不断将知识传递给下一代。
人类创造人工智,想要让机器具有“认知”,就要先赋予它知识、以及运用知识的能力。人脑,可以存储大量知识,并拥有强大的知识计算能力。人脑中主要包含两类知识,一类是常识知识,另一类是百科类知识。在计算机领域,以描述实体与实体、实体与属性值为形式的知识图谱是最近人脑信息存储的知识库。
我们应该如何理解知识图谱?

  • 从人工智能的视角来看,它是一种理解人类语言的知识库;
  • 从数据库视角来看,它是一种新型的知识存储结构;
  • 从知识表示视角来看,它是计算机理解知识的一种方法;
  • 从web视角来看,它是数据之间的一种语义互联;

事实图谱中的知识是静态的,就像刚提到人脑中百科类的知识库,不断存储知识可以让机器学识渊博。但却无法实现像人一样的思考与推理。
那么人类是怎么思考的呢?我们以“事件”为单元,社会活动通常是事件驱动的。我们会不断思考事件之间在时间、空间的相互关联与发展规律,这就是“事理——事情演进的道理”,塔是我们思考的路径。以事件作为知识的基本单元更能反映客观世界的知识,特别是动态的知识,它更符合人类的理解与思维习惯。

(实体是事件的组成部分,事件是事理的组成部分,知识。)


事理图谱 vs 事实图谱

哈工大信息检索实验室刘挺老师团队率先提出了“事理图谱”这一概念,它揭示事件的演化规律和发展逻辑,刻画和记录人类行为活动。本质上,事理图谱是一个事理逻辑知识库,描述了事件之间的演化规律和模式。
下面我们看下事理图谱与事实图谱的对比:

在知识的确定性上:

  • 事实图谱中的知识是以事实三元组为存储型的、确定的,知识状态相对静态,变化缓慢,但精度要求极高,实时性要求极高。用来回答when / who/ what/ where等常识问题
  • 事理图谱中的知识是一个包含事件、论元集合、逻辑关系等的多元组,知识逻辑是不确定的,存在一种转移概率。用来回答when / who/ what/ where等常识问题。

事实图谱只有分类关系,事理图谱的关系更丰富,事件与事件之间除了分类关系外,还存在非分类关系,如下图:


元年科技在事理图谱的应用探索

元年科技在事理图谱领域的应用探索主要面向企业内部经营分析策略的场景上,包括:构建业务&数据分析的知识库、辅助决策分析。

  1. 基于事理图谱的知识管理

无论是事实图谱还是事理图谱,本质上是一种以实体、实体属性、实体与实体/属性之间关系形成的一个知识库。我们开发了知识图谱编辑和管理工具,该工具可以支持对知识图谱中知识数据的“增删改查”操作。目前已经存储的知识主要包括:财税垂直领域的知识、企业内部经营分析的知识(分行业)。


(图1:基于杜邦分析是事理图谱)


(图2:基于事理图谱的知识管理系统)

  1. 辅助决策场景:基于事理图谱的问答&预警

知识推理是事理图谱的目标,创建事件知识库,通过事件传导路径等进行知识发现,可以在辅助决策上带来帮助。通过人工建立、半结构化数据自动抽取,两种方式构造事件传导链,进行探索式分析,可以完成对既定知识逻辑路线的发现。我们与国内某家电零售巨头共同探索了事理图谱在家电零售行业的应用,下面是我们的一些成果。
我们从家电零售业——热水器产业的细分类产业为切入点,建立垂直领域的事理图谱,用来回答关于“how”、“why”等具有逻辑推理的问题,并在回答后向用户提供可视化的逻辑推理链,让结果更具备可解释性。
在进行业务决策时,会产生类似于“应该在哪个城市加大燃气热水器的推广力度?”这个问题的本意是哪个城市最具有燃气热水器的“市场潜力”,其需求量最可能增长。
基于行业权威期刊,我们构建了庞大的事理图谱,通过供需关系,我们锁定了部分相关的事件。例如:房地产市场、居民消费水平、城市等级与燃气热水器的关系。再通过事实图谱找到下面指标,根据指标的当期数值与预测数值,就可以完成推理来进行辅助决策。

  1. 房地产市场景气程度的指标:房屋成交量、新房竣工面积等
  2. 民消费水平高低的指标:城镇人口可支配收入、高科技企业注册数等
  3. 城市等级:全国新一线、二线城市名单


我们还将事理图谱应用在企业的智能运营平台,可以实现智能风控预警。例如,还是上面的场景。当我们监控到某些城市出台了打压房地产市场的政策后,会通过事理图谱发现对房地产市场有抑制作用,从而影响燃气热水器的需求,这时就会进行风险预警。而传统预警系统往往要等到销售情况出现恶化时才会进行预警。通过事理图谱实现了风险的前置预判,可以为企业的争取更充分的时间进行计划分析,从而指定出更有效的经营决策。
事理图谱的挑战
事理图谱仍属于一个较新的前沿领域,技术与理论仍在逐步完善中,未来还有很长的路要走,如何找到一种灵活的事件表示方式,事理的执行、预测和推演机制,构造出一种知识的自我更新和生长方式,最终实现机器知识的自我更新和生长,将是未来漫漫长路中需要攻克的难题。

发布于 2022-07-12 10:11