[发明专利]语义理解处理方法、装置、设备及可读存储介质在审
| 申请号: | 201911415186.6 | 申请日: | 2019-12-31 |
| 公开(公告)号: | CN111104803A | 公开(公告)日: | 2020-05-05 |
| 发明(设计)人: | 艾坤;梅林海;刘权;陈志刚;王智国;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语义 理解 处理 方法 装置 设备 可读 存储 介质 | ||
1.一种语义理解处理方法,其特征在于,包括:
对待分析语句进行分词处理,为分词结果设置对应的标签;所述标签包括用于表征通用词性的词性标签和用于表征专用词性的词典标签;
将所述标签代入所述待分析语句得到更新后的待分析语句,将所述更新后的待分析语句与预设的匹配规则进行匹配,获得匹配结果;
其中,所述匹配规则包括意图和规则,所述规则至少包括通过分隔符标记连接分词形成的N元组,所述规则中的关键词用其对应的所述词典标签表示,所述规则中的非关键词用其本身表示。
2.根据权利要求1所述的语义理解处理方法,其特征在于,将所述更新后的待分析语句与预设的匹配规则进行匹配,获得匹配结果,包括:
将所述更新后的待分析语句中的所述关键词与预设的匹配规则进行匹配,获得中间结果;
将所述更新后的待分析语句中的所述非关键词与所述中间结果中的匹配规则进行匹配,获得所述匹配结果。
3.根据权利要求2所述的语义理解处理方法,其特征在于,所述匹配规则包括多个,各匹配规则分别对应不同的匹配级别,且从高到低的各匹配级别所分别对应的匹配精度依次降低;
相应地,将所述更新后的待分析语句与预设的匹配规则进行匹配,获得匹配结果,包括:
根据所述匹配级别,按照从高到低的顺序依次将所述更新后的待分析语句与各匹配级别对应的匹配规则进行匹配,直到匹配成功,获得匹配结果。
4.根据权利要求3所述的语义理解处理方法,其特征在于,所述按照从高到低的顺序依次将所述待分析语句和所述标签与各匹配级别对应的匹配规则进行匹配,直到匹配成功,获得匹配结果包括:
若所述待分析语句仅属于一个领域,则根据此领域内匹配成功的匹配规则对应的匹配得分,确定所述匹配结果;
若所述待分析语句属于多个领域,则根据各领域内匹配成功的匹配规则对应的匹配级别和匹配得分,确定所述匹配结果。
5.根据权利要求4所述的语义理解处理方法,其特征在于,根据此领域内匹配成功的匹配规则对应的匹配得分,确定所述匹配结果,包括:
根据所述待分析语句中词性标签标注的个数、词典标签标注的个数,以及所述待分析语句与各匹配成功的匹配规则的匹配的长度,确定匹配成功的各匹配规则分别对应的匹配得分,根据所述匹配得分确定所述匹配结果;
所述根据各领域内匹配成功的匹配规则对应的匹配级别,确定所述匹配结果,包括:
比较各领域内匹配成功的匹配规则对应的匹配级别;
若匹配级别不相同,则将具有最高匹配级别对应的匹配规则作为所述匹配结果;
若匹配级别相同,则根据所述待分析语句中词性标签标注的个数、词典标签标注的个数,以及所述待分析语句与各匹配成功的匹配规则的匹配的长度,确定匹配成功的各匹配规则分别对应的匹配得分,根据所述匹配得分确定所述匹配结果。
6.根据权利要求1至5任一项所述的语义理解处理方法,其特征在于,所述方法还包括:
对收集的所有语料进行领域分类,应用各领域对应的分词系统对所述语料进行分词处理;
应用与所述领域对应的领域词典为分词结果设置词典标签;
利用所述分词结果中的动词,确定所述语料的意图;
根据所述意图、所述分词结果以及所述词典标签生成匹配规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911415186.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种油脂脱水干燥设备
- 下一篇:一种快速捷变的宽带频率合成器





