[发明专利]用户查询意图理解方法、系统及计算机终端在审
申请号: | 201711487965.8 | 申请日: | 2017-12-30 |
公开(公告)号: | CN108228820A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 李成华;刘丽君;叶正 | 申请(专利权)人: | 厦门太迪智能科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 邓超 |
地址: | 361000 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户查询 语句 概念节点 链接 计算机终端 分类标签 概率 知识库 查询语句 返回结果 概念特征 检索概念 语句覆盖 语义表达 相似度 返回 覆盖 学习 | ||
本发明公开了一种用户查询意图理解方法、系统及计算机终端。该方法包括:以预定意图领域的种子概念为起点,爬取知识库内与该领域相关的概念和分类标签;根据爬取的概念和分类标签建立预定意图领域的概念链接图;计算概念链接图中节点属于预定意图领域的概率;获取用户查询语句,检索概念链接图,若用户查询语句覆盖概念节点,返回概念;否则利用深度学习模型,计算用户查询语句和概念节点之间的相似度,并返回与用户查询语句最相似的前K个概念;根据返回结果和概念节点属于预定意图领域的概率,计算用户查询语句属于预定意图领域的概率,并与预定阈值相比较以判断是否属于预定意图领域。本发明解决了查询语句的概念特征覆盖和语义表达问题。
技术领域
本发明涉及人工智能技术领域,具体而言,涉及一种用户查询意图理解方法、系统及计算机终端。
背景技术
用户查询意图的理解一直是搜索引擎技术中的核心问题,解决好此问题可以极大的提升用户体验。同时,随着人工智能的兴起,人机对话技术成为热点,而该技术也需要依托准确的用户查询意图理解。因此,如何准确理解用户查询意图的难题广泛地引起了学术界和工业界的关注。
目前,查询意图理解的主流方法是机器学习方法。该类方法首先建立意图分类体系,然后获取各分类的训练语料,训练意图分类器,最后应用该分类器,获得查询文本的分类结果。然而,由于语言的博大精深,训练语料往往存在数据稀疏的问题,即语料不能覆盖大部分的语言表达,不能全面表达特定意图。当查询语句中的概念特征不被训练语料覆盖时,意图分类器将不能得出准确的结果。通过人工标注更多的语料数据或者采用一些半监督的方法可以部分克服这一弊端,但需要耗费大量的人力。再者,用户的查询语句通常比较简短,特征有限,查询语句的语义表示成为一个难题。传统的方法通常基于词袋模型,这种方法存在高纬度和高稀疏的问题,特征表达能力很弱,且忽略了上下文关系,无法提取出抽象的语义信息。
因此,解决好查询语句的概念特征覆盖问题和语义表达问题将会有助于准确理解用户查询意图,对搜索引擎优化和人机对话应用产生有益的效果。
发明内容
鉴于上述问题,本发明提供了一种用户查询意图理解方法、系统及计算机终端,解决了查询语句的概念特征覆盖问题和语义表达问题,有助于准确理解用户查询意图,对搜索引擎优化和人机对话应用产生有益的效果。
需要说明的是,本发明中提及的术语“计算机终端”是广义上的术语,其可包括例如服务器、个人电脑、笔记本电脑、平板电脑、智能手机等,其既可以是例如服务器和个人电脑、智能手机的组合,也可以是单个计算机设备。另外,“计算机设备”也是一个广义上的术语,可以是例如服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
此外,在本发明的方法描述中,可能对各个步骤进行了编号,然而,这样的编号仅仅是为了方便描述,而并不意味着,这些方法必须按照所列序号依次进行,除非,在描述中明确地指出了执行这些步骤的先后顺序或者根据上下文的逻辑关系这些步骤必须先后进行。否则,这些步骤的执行顺序可以根据需要调整。
根据本发明的一个实施方式,提供一种用户查询意图理解方法、系统及计算机终端,包括:
S1以预定意图领域的种子概念为起点,爬取知识库内与该领域相关的概念和所述概念的分类标签;
S2根据爬取的所述概念和所述概念的分类标签建立预定意图领域的概念链接图;
S3计算所述概念链接图中概念节点属于预定意图领域的概率;
S4获取用户查询语句,检索所述概念链接图,若所述用户查询语句覆盖所述概念节点,返回所述概念节点所示概念;否则利用深度学习模型,计算所述用户查询语句和所述概念节点之间的相似度,并返回与所述用户查询语句最相似的前K个概念;
S5根据返回结果和所述概念节点属于预定意图领域的概率,计算所述用户查询语句属于预定意图领域的概率,并与预定阈值相比较以判断是否属于所述预定意图领域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门太迪智能科技有限公司,未经厦门太迪智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711487965.8/2.html,转载请声明来源钻瓜专利网。