[发明专利]一种句联想方法和装置在审
申请号: | 201811639917.0 | 申请日: | 2018-12-29 |
公开(公告)号: | CN111381685A | 公开(公告)日: | 2020-07-07 |
发明(设计)人: | 姚波怀;张扬 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郭化雨;朱静 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联想 方法 装置 | ||
本申请实施例公开了一种句联想方法和相关装置,根据已经上屏的上文内容,可以将其作为关键词进行网络搜索,得到对应的搜索结果,由于网络上与该上文内容相关的语料远多于本地高频句子模型的模型词库,故根据搜索结果更有可能确定出与上文内容对应的下文句子,根据确定出的下文句子生成上文内容对应的句联想候选项,不仅起到了为用户提供输入便利的作用,而且通过搜索的方式实现句联想功能,提高了句联想功能的适用范围。
技术领域
本申请涉及输入法领域,特别是涉及方法一种句联想方法和装置。
背景技术
输入法系统可以在用户输入过程中基于用户上屏的内容联想下文候选项,使得用户可以通过选择候选项直接上屏,为用户输入提供了便利。输入法系统通过句联想功能可以将联想出的下文句子作为句联想候选项,句联想候选项中包括句子,句子可以是多个词组成的词组或长句。若用户选择一个句联想候选项,可以一次上屏较多内容,提高了输入效率。
目前主要采用大词汇连续语音识别中常用的N-Gram模型实现句联想的功能。输入法系统通过统计用户历史语料中的高频句子组合,以此训练该模型,例如,若一个用户之前经常输入“吃葡萄不吐葡萄皮,不吃葡萄倒吐葡萄皮”这个句子组合,当该用户再次输入“吃葡萄不吐葡萄皮”时,输入法系统会通过模型匹配,联想得到“不吃葡萄倒吐葡萄皮”的句联想候选项。
然而由于目前的模型训练基于用户历史语料,同时离线的模型词库占用存储的要求严格,因此目前只能在已经上屏的上文内容中提取高频句子训练高频句子模型,并以高频句子模型实现句联想功能,以确定当前上文内容是否具有下文句子的句联想候选项,使得句联想功能的适用范围不大。
发明内容
为了解决上述技术问题,本申请提供了一种句联想方法和装置,不仅起到了为用户提供输入便利的作用,而且通过搜索的方式实现句联想功能,提高了句联想功能的适用范围。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供一种句联想方法,所述方法包括:
获取已经上屏的上文内容;
将所述上文内容作为关键词进行搜索得到搜索结果;
根据所述搜索结果确定所述上文内容对应的下文句子;
根据所述下文句子生成所述上文内容对应的句联想候选项。
可选的,所述根据所述搜索结果确定所述上文内容对应的下文句子,包括:
根据所述搜索结果中的分隔符将所述搜索结果分割为多个分割结果;
确定分割结果与所述上文内容间的第一匹配关系,所述第一匹配关系用于标识分割结果出现在所述上文内容之后的概率;
将所述第一匹配关系满足第一预设条件的分割结果确定为所述上文内容对应的下文句子。
可选的,所述根据所述搜索结果确定所述上文内容对应的下文句子,包括:
判断所述上文内容的类型是否为提问类型;
若是,根据所述上文内容,获取所述搜索结果的摘要内容;
将所述摘要内容作为所述上文内容对应的下文句子。
可选的,所述根据所述搜索结果确定所述上文内容对应的下文句子,包括:
从所述搜索结果中确定与所述上文内容的相似度满足第二预设条件的文本内容;
将所述文本内容在所述搜索结果中的下文句子作为所述上文内容对应的下文句子。
可选的,若根据所述搜索结果确定出所述上文内容对应的多个下文句子,所述根据所述下文句子生成所述上文内容对应的句联想候选项,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811639917.0/2.html,转载请声明来源钻瓜专利网。