[发明专利]智能问答系统中抽象语义库的更新方法及更新装置在审
| 申请号: | 201511026895.7 | 申请日: | 2015-12-31 |
| 公开(公告)号: | CN105677637A | 公开(公告)日: | 2016-06-15 |
| 发明(设计)人: | 曾永梅;张磊;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 徐伟 |
| 地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 智能 问答 系统 抽象 语义 更新 方法 装置 | ||
1.一种智能问答系统中抽象语义库的更新方法,包括:
收集语料;
生成每个语料所对应的抽象语义表达式;以及
将至少部分未存在于抽象语义库中的新生成抽象语义表达式添加至所述 抽象语义库。
2.如权利要求1所述的更新方法,其特征在于,所述生成每个语料所对 应的抽象语义表达式包括:
对所述语料进行分词以获得若干单独词;
将每一单独词识别为语义规则词或非语义规则词,所述语义规则词属于抽 象语义表达式用到的词语;
分别对每个非语义规则词进行词性标注,得到每个非语义规则词的词性信 息;以及
至少基于每个非语义规则词的词性信息将所述非语义规则词替换为相应 语义成分符以作为新生成抽象语义表达式的缺失语义成分。
3.如权利要求2所述的更新方法,其特征在于,所述将每一单独词识别 为语义规则词或非语义规则词包括:
在语义规则词库中查找每个单独词,所述语义规则词库包括属于抽象语义 表达式用到的所有词语的集合,若该单独词存在于所述语义规则词库中则将该 单独词识别为语义规则词,否则识别为非语义规则词。
4.如权利要求2所述的更新方法,其特征在于,所述至少基于每个非语 义规则词的词性信息将所述非语义规则词替换为相应语义成分符还包括:
基于所述语料的上下文将所述非语义规则词替换为相应语义成分符以作 为新生成抽象语义表达式的缺失语义成分。
5.如权利要求1所述的更新方法,其特征在于,所述将至少部分未存在 于抽象语义库中的新生成抽象语义表达式添加至所述抽象语义库包括:
将经确认正确的未存在于抽象语义库的所有新生成抽象语义表达式直接 添加至所述抽象语义库中。
6.如权利要求1所述的更新方法,其特征在于,还包括:
对未存在于所述抽象语义库中的新生成抽象语义表达式进行语义聚类处 理,以形成多个新生成抽象语义表达式群集;
对每个新生成抽象语义表达式群集中的抽象语义表达式进行合并处理,以 基于每个新生成抽象语义表达式群集获得精简数目的简并抽象语义表达式;
其中,所述将至少部分未存在于抽象语义库中的新生成抽象语义表达式添 加至所述抽象语义库包括:
将经确认正确的所有简并抽象语义表达式添加至所述抽象语义库中。
7.如权利要求6所述的更新方法,其特征在于,还包括:
基于每个新生成抽象语义表达式群集中抽象语义表达式的语义相似度进 行分组,
其中,所述对每个新生成抽象语义表达式群集中的抽象语义表达式进行合 并处理包括:
分别以每个新生成抽象语义表达式群集中的每一组抽象语义表达式进行 所述合并处理,以基于每一组抽象语义表达式获得一个简并抽象语义表达式。
8.一种智能问答系统中抽象语义库的更新装置,包括:
收集模块,用于收集语料;
抽象语义表达式生成模块,用于生成每个语料所对应的抽象语义表达式; 以及
抽象语义库编辑模块,用于将至少部分未存在于抽象语义库中的新生成抽 象语义表达式添加至所述抽象语义库。
9.如权利要求8所述的更新装置,其特征在于,所述抽象语义表达式生 成模块包括:
分词模块,用于对所述语料进行分词以获得若干单独词;
语义规则词识别模块,用于将每一单独词识别为语义规则词或非语义规则 词,所述语义规则词属于抽象语义表达式用到的词语;
词性标注模块,用于分别对每个非语义规则词进行词性标注,得到每个非 语义规则词的词性信息;以及
填充模块,用于至少基于每个非语义规则词的词性信息将所述非语义规则 词替换为相应语义成分符以作为新生成抽象语义表达式的缺失语义成分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511026895.7/1.html,转载请声明来源钻瓜专利网。





