[发明专利]一种知识图谱的生成方法和装置及计算机可读存储介质在审

申请号：	202010038200.1	申请日：	2020-01-14
公开（公告）号：	CN111259163A	公开（公告）日：	2020-06-09
发明（设计）人：	张杰;付骁弈;于皓;陈栋;吴信东	申请（专利权）人：	北京明略软件系统有限公司
主分类号：	G06F16/36	分类号：	G06F16/36
代理公司：	北京安信方达知识产权代理有限公司 11262	代理人：	王康;栗若木
地址：	100084 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种知识图谱生成方法装置计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种知识图谱的生成方法和装置及计算机可读存储介质，包括：将语音信号转换为文本信息；对文本信息进行断句，在断句后的文本信息中相邻两个句子之间添加标点符号；对添加标点符号的文本信息进行口语修正；根据口语修正后的文本信息生成知识图谱。本发明实施例在将语音信息转换为文本信息后，对文本信息进行断句，添加标点符号和口语修正后，再生成知识图谱，由于对文本信息进行断句，添加标点符号和口语修正有助于分词，词性分析和句法分析，而生成知识图谱过程中往往需要进行分词，词性分析和句法分析，从而提高了知识图谱的准确率。

技术领域

本发明实施例涉及但不限于数据处理领域，尤指一种知识图谱的生成方法和装置及计算机可读存储介质。

背景技术

随着2012年谷歌在其搜索引擎中引入知识图谱，该项技术得到越来越广泛的关注和应用。知识图谱以图的形式可视化的展示知识片段之间的关系，相较于语音和文字，更加简洁、清晰，更符合人类的思维方式。然而，人们在表达内容的时候，更常用的、更自然的方式还是使用语音，因此如何在人们交谈时有效甚至实时将语音转换成知识图谱成为一个亟待解决的问题。

目前没有直接将语音转换为知识图谱的技术和产品，而且这两项技术的简单结合生成的知识图谱往往准确率较低，这是由于语音识别的误差在生成知识图谱的过程中会被放大，导致最终的知识图谱的准确率比较低。

发明内容

本发明实施例提供了一种知识图谱的生成方法和装置及计算机可读存储介质，能够直接将语音转换为知识图谱，且提高知识图谱的准确率。

本发明实施例提供了一种知识图谱的生成方法，包括：

将语音信号转换为文本信息；

对文本信息进行断句，在断句后的文本信息中相邻两个句子之间添加标点符号；

对添加标点符号的文本信息进行口语修正；

根据口语修正后的文本信息生成知识图谱。

在本发明实施例中，所述对添加标点符号的文本信息进行口语修正后，在根据口语修正后的文本信息生成知识图谱之前，该方法还包括：

对口语修正后的文本信息进行断句和标点符号的调整；

所述根据口语修正后的文本信息生成知识图谱包括：

根据进行断句和标点符号的调整后的文本信息生成所述知识图谱。