[发明专利]场景纠错方法、装置、设备和存储介质有效
申请号: | 201910502574.1 | 申请日: | 2019-06-11 |
公开(公告)号: | CN110232129B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 付志宏;赖佳伟;邓卓彬;罗希意;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G10L15/22 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 杨瑾瑾;陈建民 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景 纠错 方法 装置 设备 存储 介质 | ||
1.一种场景纠错方法,其特征在于,包括:
利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;所述场景知识包括关键词词典、场景语料和对齐语料;
挖掘所述场景知识的关联知识;
利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。
2.根据权利要求1所述的方法,其特征在于,还包括:
利用与所述目标场景相关的关键词和预先设置的通用关键词,得到关键词词典;
利用所述关键词词典的各关键词挖掘得到场景语料;
利用所述场景语料训练得到关键词纠错模型。
3.根据权利要求2所述的方法,其特征在于,还包括:
利用关键词词典和关键词纠错模型对所述输入文本进行纠错。
4.根据权利要求3所述的方法,其特征在于,利用关键词词典和关键词纠错模型对所述输入文本进行纠错,包括:
利用所述关键词词典,对目标场景的输入文本中的关键词进行纠错;
利用所述关键词纠错模型对纠错后的文本进行结果验证。
5.根据权利要求3所述的方法,其特征在于,还包括:
利用所述场景纠错模型对所述输入文本或所述关键词纠错模型的输出结果进行纠错。
6.根据权利要求1所述的方法,其特征在于,还包括:
利用开放域纠错模型,对所述输入文本进行纠错;
将所述开放域纠错模型和所述场景纠错模型的纠错结果进行融合。
7.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:
从用户日志中挖掘得到新增的场景知识,所述场景知识包括场景语料和对齐语料;
利用新增的所述场景知识对所述场景纠错模型进行训练,以更新所述场景纠错模型。
8.一种场景纠错装置,其特征在于,包括:
语义理解模块,用于利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;所述场景知识包括关键词词典、场景语料和对齐语料;
第一挖掘模块,用于挖掘所述场景知识的关联知识;
第一训练模块,用于利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。
9.根据权利要求8所述的装置,其特征在于,还包括:
词典模块,用于利用与所述目标场景相关的关键词和预先设置的通用关键词,得到关键词词典;
第二挖掘模块,用于利用所述关键词词典的各关键词挖掘得到场景语料;
第二训练模块,用于利用所述场景语料训练得到关键词纠错模型。
10.根据权利要求9所述的装置,其特征在于,还包括:
关键词纠错模块,用于利用关键词词典和关键词纠错模型对所述输入文本进行纠错。
11.根据权利要求10所述的装置,其特征在于,所述关键词纠错模块还用于利用所述关键词词典,对目标场景的输入文本中的关键词进行纠错;利用所述关键词纠错模型对纠错后的文本进行结果验证。
12.根据权利要求10所述的装置,其特征在于,还包括:
场景纠错模块,用于利用所述场景纠错模型对所述输入文本或所述关键词纠错模型的输出结果进行纠错。
13.根据权利要求8所述的装置,其特征在于,还包括:
开放域纠错模块,用于利用开放域纠错模型,对所述输入文本进行纠错;
融合模块,用于将所述开放域纠错模型和所述场景纠错模型的纠错结果进行融合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910502574.1/1.html,转载请声明来源钻瓜专利网。