[发明专利]候选词生成方法、装置以及用于候选词生成的装置有效
申请号: | 201610094784.8 | 申请日: | 2016-02-19 |
公开(公告)号: | CN107102746B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王丹;张扬 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选 生成 方法 装置 以及 用于 | ||
1.一种候选词生成方法,其特征在于,该方法包括:
响应于用户输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示所述用户当前打开应用的所属类别;
结合所述当前输入环境判断所述输入字符串是否有误,如果是,则根据所述当前输入环境对应的领域词库对所述输入字符串进行纠错,得到目标字符串,如果否,则将所述输入字符串确定为所述目标字符串,所述领域词库为所述当前输入环境对应的环境词库;
判断所述目标字符串在所述领域词库中是否存在对应的优选候选词,如果是,则将所述优选候选词对应的词频乘以预设激励值,得到优选词频,所述预设激励值用于放大所述优选候选词对应的词频,所述词频用于表示候选词在当前输入法的语料库中出现的次数;
比较所述优选词频与原始候选词对应的原始词频的大小,所述原始候选词为所述目标字符串在非领域词库中对应的候选词;
如果所述优选词频大于所述原始词频,则将所述优选候选词确定为目标候选词中的最佳候选词;
如果所述优选词频不大于所述原始词频,则将所述原始候选词确定为所述目标候选词中的最佳候选词;
将所述目标候选词在预设显示位置进行显示,其中,所述最佳候选词在显示序列中的顺序大于所述目标候选词中的非最佳候选词。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前输入环境对应的领域词库对所述输入字符串进行纠错,得到目标字符串,包括:
确定所述输入字符串对应的纠错候选串;
获取所述纠错候选串被输入成所述输入字符串的纠错概率,以及,纠错候选串对应的词频;所述纠错概率用于表示所述输入字符串是某一个所述纠错候选串的可能性,所述词频用于表示所述纠错候选串在所述当前输入环境的语料库中出现的次数;
依据所述纠错概率得分和所述词频确定最佳纠错串;
将所述最佳纠错串确定为所述目标字符串。
3.根据权利要求1所述的方法,其特征在于,在显示所述目标候选词之后,还包括:
响应于所述用户在所述最佳候选词上的选择操作,将所述最佳候选词输入至当前输入框中。
4.一种候选词生成装置,其特征在于,包括:
获取环境模块,用于响应于用户输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示所述用户当前打开应用的所属类别;
判断模块,用于结合所述当前输入环境判断所述输入字符串是否有误;
纠错模块,用于在所述判断模块的判断结果为是的情况下,根据所述当前输入环境对应的领域词库对所述输入字符串进行纠错,得到目标字符串,所述领域词库为所述当前输入环境对应的环境词库;
确定模块,用于在所述判断模块的判断结果为否的情况下,将所述输入字符串确定为所述目标字符串;
生成候选词模块,具体包括:
判断子模块,用于判断所述目标字符串在所述领域词库中是否存在对应的优选候选词;
计算子模块,用于在所述判断子模块的判断结果为是的情况下,将所述优选候选词对应的词频乘以预设激励值,得到优选词频,所述预设激励值用于放大所述优选候选词对应的词频,所述词频用于表示候选词在当前输入法的语料库中出现的次数;
比较子模块,用于比较所述优选词频与原始候选词对应的原始词频的大小,所述原始候选词为所述目标字符串在非领域词库中对应的候选词;
第一确定最佳候选词子模块,用于在所述比较子模块的比较结果为所述优选词频大于所述原始词频的情况下,将所述优选候选词确定为目标候选词中的最佳候选词;
第二确定最佳候选词子模块,用于在所述比较子模块的比较结果为所述优选词频不大于所述原始词频的情况下,将所述原始候选词确定为所述目标候选词中的最佳候选词;
所述候选词生成装置,还包括:
显示模块,用于将所述目标候选词在预设显示位置进行显示,其中,所述最佳候选词在显示序列中的顺序大于所述目标候选词中的非最佳候选词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610094784.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电子装置与按键模块
- 下一篇:一种信息输入方法、装置和用于信息输入的装置