[发明专利]一种问答库生成方法及相关设备在审
申请号: | 202110400261.2 | 申请日: | 2021-04-14 |
公开(公告)号: | CN113064982A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 张献涛;暴筱;林小俊;支涛 | 申请(专利权)人: | 北京云迹科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/205;G06F40/279 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问答 生成 方法 相关 设备 | ||
1.一种问答库生成方法,其特征在于,包括:
获取所述基础信息库中的关键信息,其中,所述关键信息包括关键数据与属性信息;
基于所述关键数据确定对应所述关键数据的信息片段;
基于所述属性信息与预设问题列表获取对应所述属性信息的问题信息,其中,所述预设问题列表包括不同的属性信息与对应所述不同属性信息的问题信息;
利用所述问题信息替换所述信息片段对应的所述关键信息,生成对应所述关键信息的问题;
将对应所述关键信息的问题与所述关键信息组成问答对,对所述问答对进行存储,得到所述问答库。
2.根据权利要求1所述的问答库生成方法,其特征在于,所述获取所述基础信息库中的关键信息的步骤,包括:
对所述基础信息库中的基础信息进行分割,得到文本信息;
对所述文本信息进行词性分析和命名体识别,得到初始关键信息;
基于预设筛选规则对所述初始关键信息进行筛选,得到所述关键信息,其中,所述预设筛选规则为能够删除至少一种词性的初始关键信息的规则。
3.根据权利要求2所述的问答库生成方法,其特征在于,所述对所述基础信息库中的基础信息进行分割的步骤,包括:
通过识别句号、分号、问号或者叹号的方式对所述基础信息库中的基础信息进行分割。
4.根据权利要求2所述的问答库生成方法,其特征在于,所述基于所述关键数据确定对应所述关键数据的信息片段的步骤,包括:
基于所述关键数据查找对应所述关键信息的所述文本信息;
通过识别逗号或者分号的方式对所述文本信息进行分割,得到对应所述关键数据的信息片段。
5.根据权利要求1所述的问答库生成方法,其特征在于,在所述将对应所述关键信息的问题与所述关键信息组成问答对的步骤之前,还包括:
基于语法和语义验证所述对应所述关键信息的问题的合理性;
若所述对应所述关键信息的问题不合理,则删除所述对应所述关键信息的问题;
若所述对应所述关键信息的问题合理,则将对应所述关键信息的问题与所述关键信息组成问答对。
6.根据权利要求5所述的问答库生成方法,其特征在于,所述基于语法和语义验证所述对应所述关键信息的问题的合理性的步骤,包括:
将所述对应所述关键信息的问题作为第一搜索词;
将所述对应所述关键信息的信息片段作为第二搜索词;
在外部数据库中搜索所述第一搜索词与所述第二搜索词,分别获取对应所述第一搜索词的第一热度频次与对应所述第二搜索词的第二热度频次;
通过所述第一热度频次与所述第二热度频次验证所述对应所述关键信息的问题的合理性。
7.根据权利要求6所述的问答库生成方法,其特征在于,所述通过所述第一热度频次与所述第二热度频次验证所述对应所述关键信息的问题的合理性的步骤,包括:
计算所述第一热度频次与所述第二热度频次的比值;
通过比较所述比值与预设值的方式,验证所述对应所述关键信息的问题的合理性;
若所述比值大于所述预设值,则对应所述关键信息的问题的不合理,不进行存储。
8.一种问答库生成装置,其特征在于,包括:
数据获取模块,用于获取所述基础信息库中的关键信息,其中,所述关键信息包括关键数据与属性信息;
查找模块,用于基于所述关键数据确定对应所述关键数据的信息片段;
对比模块,用于基于所述属性信息与预设问题列表获取对应所述属性信息的问题信息,其中,所述预设问题列表包括不同的属性信息与对应所述不同属性信息的问题信息;
替换模块,用于利用所述问题信息替换所述信息片段对应的所述关键信息,生成对应所述关键信息的问题;
存储模块,用于将对应所述关键信息的问题与所述关键信息组成问答对,对所述问答对进行存储,得到所述问答库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云迹科技有限公司,未经北京云迹科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110400261.2/1.html,转载请声明来源钻瓜专利网。