[发明专利]一种信息处理方法及装置有效

申请号：	201810589582.X	申请日：	2018-06-08
公开（公告）号：	CN108920452B	公开（公告）日：	2022-05-17
发明（设计）人：	喻守益;邵蓥侠;张震	申请（专利权）人：	北京明略软件系统有限公司
主分类号：	G06F40/295	分类号：	G06F40/295;G06F16/33
代理公司：	北京安信方达知识产权代理有限公司 11262	代理人：	王康;栗若木
地址：	102218 北京市昌平区东小***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种信息处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本文公开了一种信息处理方法及装置，包括：终端根据预先建立的属性归纳模型获取与获得的关键词对应的属性；根据预先建立的属性与标签的对应关系获取与获得的属性对应的标签；根据预先建立的标签组合与意图的对应关系，利用获得的标签获取目标意图；根据获得的关键词和目标意图生成查询语句。从本发明实施例可见，由于终端根据属性归纳模型、属性与标签的对应关系以及标签与意图的对应关系获取了关键词最能够表明的意图，进而在无需大量训练集的参与，简单地实现了查询语句的生成。

技术领域

本发明涉及计算机技术领域，尤其涉及一种信息处理方法及装置。

背景技术

在自然语言处理(Natural Language Processing，NLP)领域，由文档、段落、语句提取关键词的研究很多，但是利用关键词生成语句的研究较少。

相关技术中，利用关键词生成语句通常有两种方法：一是根据NLP工具word2vec对词汇进行相近词替换，然后在训练集中寻找包含所替换的词的语句；二是根据训练集得到词汇的上下文生成概率，生成若干备选语句，再用语言模型判断语句的通顺程度确定最终语句。

然而，这两种方法都需要依赖大量的训练集，但实际应用中，多数企业在业务开展前都难以获得该业务场景下的大量训练集，因此在缺乏大量训练集的情况下无法根据关键词生成语句。

发明内容

为了解决上述技术问题，本发明提供一种信息处理方法及装置，能够在缺乏大量训练集的情况下根据关键词生成语句。

为了达到本发明目的，本发明提供了一种信息处理方法，包括：

终端根据预先建立的属性归纳模型获取与获得的关键词对应的属性；

根据预先建立的属性与标签的对应关系获取与获得的属性对应的标签；

根据预先建立的标签组合与意图的对应关系，利用获得的标签获取目标意图；