[发明专利]候选词生成方法、装置以及用于候选词生成的装置有效
申请号: | 201610094784.8 | 申请日: | 2016-02-19 |
公开(公告)号: | CN107102746B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王丹;张扬 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选 生成 方法 装置 以及 用于 | ||
本申请提供了一种候选词生成方法及装置,其中,候选词生成方法包括:响应于用户输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示用户当前打开应用的所属类别;判断所述输入字符串是否有误,如果是,则结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,如果否,则将所述输入字符串确定为目标字符串;参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词;所述领域词库为所述当前输入环境对应的环境词库。采用本申请实施例,可以提高用户的输入速度,提升用户的输入体验。
技术领域
本申请涉及输入法技术领域,特别涉及一种候选词生成方法、装置以及一种用于候选词生成的装置。
背景技术
随着互联网技术的飞速发展,用户使用互联网设备进行交流的机会越来越多,也因此对输入法有越来越多的输入需求。可是目前的输入法在使用时,如果用户的字符串输入错误,会结合系统词库中的常用候选词,比如使用概率较大的候选词来对字符串进行纠错,最后再根据纠错后的字符串来生成最终的候选词。
发明内容
但是发明人在研究过程中发现,随着移动设备和各种类型APP的广泛应用,输入环境与用户输入需求之间的关系越来越密切,而现有技术的纠错及获取候选往往是一个相对孤立的过程,没有考虑到输入环境因素对用户输入需求的影响,不足以提供用户在不同输入场景下的最优候选。例如同一输入串往往会对应多种类型的候选词,例如地点、歌名,还有可能是饭店的名字,现有技术在所有输入环境下提供的候选结果及排序都是相同的,往往与用户实际想要输入的内容相差甚远,用户体验较差。
基于此,本申请提供了一种候选词生成方案,依据当前输入环境得到纠错结果并生成候选项,有效提高了首项或者首页候选词命中用户目标词的可能性,从而提高用户的输入效率,进一步提升用户的输入体验。
本申请还提供了一种生成候选词的装置,用以保证上述方法在实际中的实现及应用。
本申请公开的一种候选词生成方法,该方法包括:
响应于用户在当前输入框中输入字符串的操作,获取当前输入环境,所述当前输入环境用于表示用户当前打开应用的所属类别;
判断所述输入字符串是否有误,如果是,则结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,如果否,则将所述输入字符串确定为目标字符串;
参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词;所述领域词库为所述当前输入环境对应的环境词库。
其中,所述结合所述当前输入环境对所述输入字符串进行纠错,得到目标字符串,包括:
确定所述输入字符串对应的纠错候选串;
获取所述纠错候选串被输入成所述输入字符串的纠错概率,以及,纠错候选串对应的词频;所述纠错概率用于表示所述输入字符串是某一个纠错候选串的可能性,所述词频用于表示所述纠错候选串在所述当前输入法的语料库中出现的次数;
依据所述纠错概率得分和词频确定最佳纠错串。
其中,所述参考当前输入环境对应的领域词库,将所述目标字符串生成对应的目标候选词,包括:
判断所述目标字符串在所述当前输入环境的领域词库中是否存在对应的优选候选词,如果是,则将所述优选候选词对应的词频乘以预设激励值,得到优选词频;
比较所述优选词频与原始候选词对应的原始词频的大小,所述原始候选词为所述目标字符串在非领域词库中对应的候选词;
如果优选词频大于所述原始词频,则将优选候选词确定为目标候选词中的最佳候选词;
如果优选词频不大于所述原始词频,则将所述原始候选词确定为目标候选词中的最佳候选词。
其中,在生成对应的目标候选词之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610094784.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子装置与按键模块
- 下一篇:一种信息输入方法、装置和用于信息输入的装置