[发明专利]用于从多模态源自动产生和更新知识图谱的设备和方法在审
申请号: | 202180003244.3 | 申请日: | 2021-09-01 |
公开(公告)号: | CN114270339A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 芦运照;林伟安;陈文财 | 申请(专利权)人: | 香港应用科技研究院有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31;G06F16/35;G06F16/65;G06F40/205;G06F40/237;G06N3/04;G10L15/26 |
代理公司: | 深圳宜保知识产权代理事务所(普通合伙) 44588 | 代理人: | 王琴;曹玉存 |
地址: | 中国香港新界沙田香港*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 多模态 源自 产生 更新 知识 图谱 设备 方法 | ||
本发明提供一种用于从多模态源自动产生和更新知识图谱的设备和方法。所述设备包括会话解析模块,所述会话解析模块被配置成用于:利用从所述多模态源提取而产生的带标记的字词来更新动态信息字集VD;基于从所述多模态源提取的所提取的关系模式元更新静态信息字集VS;以及基于所述动态信息字集VD、所述静态信息字集VS和一个或多个语句模式产生成对的问题和解答;及知识图谱载体,其被配置成用于基于所提取的目标实体和关系模式元而更新知识图谱。因此,实现了用于对非结构化数据进行问题分解、查询链构造和实体关联的高效且节约成本的方法。
版权声明
本专利文献的部分公开内容含有受版权保护的材料。版权所有者不反对任何人传真复制专利与商标局的专利文件或记录中出现的专利文献或专利公开内容,但无论如何都保留全部版权。
技术领域
本发明总体来说涉及用于产生和更新知识图谱的方法和设备,确切地说,涉及从多模态源产生知识图谱的方法和设备。
背景技术
知识图谱表示实体,例如字词、短语、元数据、知识模式以及甚至经由链接和语义元数据的问题和解答的互连描述的集合。以此方式,知识图谱可提供用于数据集成、统一、分析和共享的框架。
知识图谱已被提议在知识引擎和搜索引擎中作为关键的角色将复杂自然语言请求的语法映射到含义中,且最终将那些含义映射到已在信息系统中运行事务和查询的计算机应用程序。知识图谱亦已成为用于知识变换和表示的重要工具,以及用于信息挖掘、语义分析、知识产生和知识推理的重要手段。
机器学习的快速发展为知识图谱的构造和扩展的自动化提供了一定可行性。举例来说,机器学习已用于对非结构化数据进行问题分解、查询链构造和实体关联。
然而,对于一些信息查询应用程序,例如聊天机器人,仍需要由经验丰富的工程师准备问题和解答来构造知识图谱。在将问题和解答上传到知识库之前,从多模态数据中手动地标出问题和解答,且将其填充到具有各种查询和层次结构的各种模板中。多模态数据可包含大量历史数据,例如指导手册和客户服务会话的记录。搜索有意义的模式数据以及从大量历史数据中提取有用的问题和解答可能乏味又低效。
发明内容
在解决当前技术水平中的前述挑战时,本发明提供一种用于从多模态源自动产生和更新知识图谱的设备和方法。本发明的另一目标为提供此类设备和方法,其不需要从多模态源手动提取目标信息以用于产生问题和解答。因此,实现了用于对非结构化数据进行问题分解、查询链构造和实体关联的高效且节约成本的方式。
根据本发明的一个方面,本发明提供一种用于从多模态源自动产生和更新知识图谱的设备和方法。所述设备包括说话人分类模块,所述说话人分类模块被配置成用于:将输入音频流划分为音频片段;将所述音频片段的说话人分类为代理人或客户;以及基于说话人分类而将所述音频片段聚类;音频转录模块,其被配置成用于基于声学模型将所述经分类的音频片段转录成转录本;语音解析模块,其被配置成用于:从转录本提取目标实体和关系模式元;以及用来自领域特定语言模型的多种预定义标签标记与所提取的目标实体对应的转录本的字词;会话解析模块,其被配置成用于:利用从多模态源提取而产生的带标记的字词来更新动态信息字集VD;基于从多模态源提取的所提取的关系模式元更新静态信息字集VS;从领域特定语言模型检索一个或多个语句模式;以及基于动态信息字集VD、静态信息字集VS和一个或多个语句模式而产生成对的问题和解答;以及知识图谱载体,其被配置成用于通过以下操作来更新知识图谱:接收所提取的目标实体和关系模式元;将所提取的目标实体表示为知识图谱中的节点;以及将所提取的关系模式元表示为知识图谱中的节点之间的边的标签。
本发明提供了实现对非结构化数据进行问题分解、查询链构造和实体关联的高效且节约成本的方式。
附图说明
下文中参看图式更详细描述本发明的实施例,在图式中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于香港应用科技研究院有限公司,未经香港应用科技研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180003244.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种存储器CMOS电路
- 下一篇:用于在形成半导体设备中形成电介质层的方法