[发明专利]意图识别数据处理系统有效
申请号: | 202110934400.X | 申请日: | 2021-08-16 |
公开(公告)号: | CN113377969B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 籍焱;薄满辉;唐红武;王殿胜;张丽颖;谭智隆;高栋 | 申请(专利权)人: | 中航信移动科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33;G06F40/242;G06F40/279 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 丁慧玲 |
地址: | 100041 北京市石景山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 数据处理系统 | ||
本发明涉及一种意图识别数据处理系统,实现:步骤S1、获取用户query,并进行预处理,得到用户query的第一分词列表{Q1,Q2,…QM},其中,M为用户query分词数量,Qi为第i个分词,初始化i=1,执行步骤S2;步骤S2、基于Qi检索知识图谱,判断是否存在对应标签信息,若存在,则设置Qi’=Qi+预设分隔符+Ti+预设分隔符,其中,Ti为Qi对应的标签信息,否则,设置Qi’=Qi;步骤S3、判断i是否小于M,若是,则设置i=i+1,返回执行步骤S2,否则,基于所有Qi’生成第二分词列表{Q1’,Q2’,…QM’};步骤S4、将{Q1’,Q2’,…QM’}转换为输入向量,输入所述意图分类模型中,生成意图识别结果。本发明提高了意图识别准确度。
技术领域
本发明涉及计算机技术领域,尤其涉及一种意图识别数据处理系统。
背景技术
随着人工智能的快速发展,意图识别在很多应用场景中尤为重要,例如语音识别、智能问答等应用场景。现有的意图识别技术主要基于闲聊等场景,但对于垂直领域的意图体系并不完善。以民航领域为例,现有的机场、航空公司的意图识别主要从客服沿用的知识库抽象而来,语料有限,且意图之间重叠、混淆的情况时有发生,无法实现意图界限分明、场景覆盖全面。部分现有技术的意图识别主要基于规则,缺乏灵活性,仅当用户输入的问题能够命中关键规则的时候,系统才能给到用户准确的意图识别结果,而用户的问题存在多样性、表述不规范及存在错别字等特点。此时,基于规则的方法则也很难准确识别用户意图。此外,现有的意图识别技术还缺乏对垂直领域基础知识的融合,以民航领域为例,民航业有很多专业性的词汇,包括航司名称、机场名称及简称、别名;甚至包括对于航班动态的掌握,目前的意图识别系统对于这些背景信息及民航知识图谱信息的融入很少,因此意图识别准确度低。由此可知,如何提高意图识别准确度成为亟待解决的技术问题。
发明内容
本发明目的在于,提供一种意图识别数据处理系统,提高了意图识别准确度。
根据本发明一方面,提供了一种意图识别数据处理系统,包括基于预设的垂直领域信息构建的知识图谱、意图分类模型,存储有计算机程序的存储器和处理器,当所述处理器在执行所述计算机程序时,实现以下步骤:
步骤S1、获取用户query,并对所述用户query进行预处理,得到用户query的第一分词列表{Q1,Q2,…QM},M为用户query分词数量,Qi为第i个分词,i的取值为1到M,初始化i=1,执行步骤S2;
步骤S2、基于Qi检索所述知识图谱,判断是否存在对应标签信息,若存在,则设置Qi’=Qi+预设分隔符+Ti+预设分隔符,其中,Ti为Qi对应的标签信息,否则,设置Qi’=Qi;
步骤S3、判断i是否小于M,若是,则设置i=i+1,返回执行步骤S2,否则,基于所有Qi’生成第二分词列表{ Q1’,Q2’,…QM’};
步骤S4、将{ Q1’,Q2’,…QM’}转换为输入向量,将所述输入向量输入所述意图分类模型中,生成意图识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中航信移动科技有限公司,未经中航信移动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110934400.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多轮智能问答数据处理系统
- 下一篇:一种基于生产数据的文本生成系统