[发明专利]一种信息处理方法及装置有效
| 申请号: | 201810589582.X | 申请日: | 2018-06-08 |
| 公开(公告)号: | CN108920452B | 公开(公告)日: | 2022-05-17 |
| 发明(设计)人: | 喻守益;邵蓥侠;张震 | 申请(专利权)人: | 北京明略软件系统有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/33 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;栗若木 |
| 地址: | 102218 北京市昌平区东小*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息处理 方法 装置 | ||
本文公开了一种信息处理方法及装置,包括:终端根据预先建立的属性归纳模型获取与获得的关键词对应的属性;根据预先建立的属性与标签的对应关系获取与获得的属性对应的标签;根据预先建立的标签组合与意图的对应关系,利用获得的标签获取目标意图;根据获得的关键词和目标意图生成查询语句。从本发明实施例可见,由于终端根据属性归纳模型、属性与标签的对应关系以及标签与意图的对应关系获取了关键词最能够表明的意图,进而在无需大量训练集的参与,简单地实现了查询语句的生成。
技术领域
本发明涉及计算机技术领域,尤其涉及一种信息处理方法及装置。
背景技术
在自然语言处理(Natural Language Processing,NLP)领域,由文档、段落、语句提取关键词的研究很多,但是利用关键词生成语句的研究较少。
相关技术中,利用关键词生成语句通常有两种方法:一是根据NLP工具word2vec对词汇进行相近词替换,然后在训练集中寻找包含所替换的词的语句;二是根据训练集得到词汇的上下文生成概率,生成若干备选语句,再用语言模型判断语句的通顺程度确定最终语句。
然而,这两种方法都需要依赖大量的训练集,但实际应用中,多数企业在业务开展前都难以获得该业务场景下的大量训练集,因此在缺乏大量训练集的情况下无法根据关键词生成语句。
发明内容
为了解决上述技术问题,本发明提供一种信息处理方法及装置,能够在缺乏大量训练集的情况下根据关键词生成语句。
为了达到本发明目的,本发明提供了一种信息处理方法,包括:
终端根据预先建立的属性归纳模型获取与获得的关键词对应的属性;
根据预先建立的属性与标签的对应关系获取与获得的属性对应的标签;
根据预先建立的标签组合与意图的对应关系,利用获得的标签获取目标意图;
根据获得的关键词和目标意图生成查询语句。
所述根据预先建立的标签组合与意图的对应关系,利用获得的标签获取目标意图,包括:
根据获得的标签获取能够由每一个获得的属性对应的一个标签组成的所有标签组合;
获取所有标签组合包含的标签的种类个数;
获取包含的标签的种类个数最小的标签组合作为备选标签组合;
如果所述备选标签组合的数量为一个,从所述标签与意图的对应关系中获取包含获得的备选标签组合中的标签的意图;
如果获得的意图的数量为一个,确定获得的意图为所述目标意图。
如果所述备选标签组合的数量为至少两个,还包括:
根据所述终端的搜索记录获取针对每一个备选标签组合中的标签的搜索次数;
获取标签的搜索次数最大的备选标签组合作为目标标签组合,并从所述标签与意图的对应关系中获取包含获得的目标标签组合中的标签的意图;
如果获得的意图的数量为一个,确定获得的意图为所述目标意图。
如果获得的意图的数量为至少两个,还包括:
获取每一个意图包含的标签的信息量;
获取包含的标签的信息量最大的意图作为备选意图;
如果所述备选意图的数量为一个,确定所述备选意图为所述目标意图;
如果所述备选意图的数量为两个,获取根据信息量大的标签去查找信息量小的标签的备选意图,作为所述目标意图。
所述根据获得的关键词和意图生成查询语句,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810589582.X/2.html,转载请声明来源钻瓜专利网。





