[发明专利]一种基于混合策略的复句用户查询语句的意图识别方法在审
申请号: | 201910371479.2 | 申请日: | 2019-05-06 |
公开(公告)号: | CN110096595A | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 缪炜;高丹;王东东 | 申请(专利权)人: | 上海互问信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200135 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户查询 意图识别 分句 语句 集合 混合策略 对话系统 逻辑判断 系统生成 性能提升 用户体验 用户意图 语法规则 语言符号 准确度 传统的 回复 解析 智能 研究 | ||
1.一种基于混合策略的复句用户查询语句的意图识别方法,其特征在于:包括以下步骤:
步骤1,根据用户查询复句q,利用语言符号、复句语法规则逐步获取、解析用户查询复句q相对应的候选分句集合C;
步骤2,利用传统的用户查询语句的意图识别模型分别对用户查询复句q、用户输入分句集合C进行意图识别,获取用户查询复句的候选意图Iq、候选分句意图集合IC;
步骤3,将用户查询复句的意图Iq与候选分句的意图集合IC进行逻辑判断;若用户查询复句的意图Iq与候选分句的意图集合IC均相同,则用户查询复句的意图Iq作为对话系统的意图识别结果输出;若用户查询复句的意图Iq与候选分句的意图集合IC的某一个意图不同,则利用意图集合{Iq,IC}中各意图的置信度θ进行判断,获得最终的对话系统意图识别结果。
2.根据权利要求1所述的基于混合策略的复句用户查询语句的意图识别方法,其特征在于:所述步骤1中根据用户查询复句q,用于逐步获取、解析用户查询复句q相对应的候选分句集合C的语言符号规则、复句语法规则,包括对复句进行以下处理:
总结能够对中文文本片段进行断句的标点符号,生成语言符号模板Ts=\p{Po},进而对用户查询复句q进行切分得到初级候选分句集合P={Pi|i=1,2,...,n};
基于复句的基本类型,生成复句语法规则模板集合TC={TCj|j=1,2,…,m},模板TCj的格式如下,TCj=label#模板=并列#(?<txt1>.+)(又|也|后|且|并|再)(?<txt2>.+)其中,label表示复句的基本类型,模板用于提取候选分句C1=txt1、C2=txt2;
利用复句语法规则模板TC对上述初级候选分句集合P中的每一个候选分句Pi进行处理,得到用户查询复句q的候选分句集合IC以及分句之间所表示的复句类型label。
3.根据权利要求1所述的基于混合策略的复句用户查询语句的意图识别方法,其特征在于:所述步骤2中对用户查询复句q、用户输入分句集合C进行意图识别的传统的用户查询语句的意图识别模型包括利用语义规则模板与机器学习算法的分类模型所构成的用户查询语句的意图识别方法、装置,并且根据语法规则模板得到的候选意图识别结果的置信度θ=1.0,利用机器学习算法的分类模型所得到的候选意图识别结果的置信度θ<1.0。
4.根据权利要求1所述的基于混合策略的复句用户查询语句的意图识别方法,其特征在于:所述步骤3中用户查询复句的意图Iq与候选分句的意图集合IC的某一个意图不同时利用意图集合{Iq,IC}中各意图的得分进行判断,获得最终的对话系统意图识别结果的过程包括以下处理:
删除意图集合IC中意图识别结果Ii为聊天意图的意图元素以及置信度θ<1.0的意图元素Ii,得到意图集合IC';
当或者IC'中所有意图元素的置信度均小于1.0(即{θIi<1.0|Ii∈IC'})时,返回用户查询复句的意图Iq;
当用户查询复句的意图Iq置信度时,根据IC'中各意图元素的相应的复句基本类型label确定最终返回的意图识别结果。
5.根据权利要求4所述的基于混合策略的复句用户查询语句的意图识别方法,其特征在于:候选分句{Ci,Cj|i≠j}的复句基本类型labelCi,Cj=“转折”,输出候选分句Cj的意图识别结果ICj;否则,IC'作为用户输入复句的意图识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海互问信息科技有限公司,未经上海互问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910371479.2/1.html,转载请声明来源钻瓜专利网。