[发明专利]一种面向印地语的多语言混合输入方法及装置在审
申请号: | 201810713058.9 | 申请日: | 2018-06-29 |
公开(公告)号: | CN108897438A | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 许晏铭;吴晓强 | 申请(专利权)人: | 北京金山安全软件有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拼写 词汇 候选词 多语言混合 输入法界面 候选字符 输入词汇 字符序列 串列 输入效率 选择操作 映射关系 语言模型 字符形式 多语言 键入 展示 | ||
1.一种面向印地语的多语言混合输入方法,其特征在于,包括:
获取输入法界面键入的当前输入词汇的拉丁字符序列;
根据第一语言模型,获取所述拉丁字符序列对应的拉丁字符形式的第一候选字符串列表,所述第一语言模型为预先建立的以拉丁字符形式拼写印地语的语言模型;
根据预先建立的印地语词汇的拉丁字符拼写形式和印地语字符拼写形式之间的映射关系,获取目标印地语词汇列表,所述目标印地语词汇列表包括:第一候选字符串列表中的拉丁字符拼写形式的印地语词汇所对应的印地语字符拼写形式;
根据所述第一候选字符串列表和目标印地语词汇列表,生成包括拉丁字符拼写形式和印地语字符拼写形式的词汇的第一候选词列表;
在输入法界面展示所述第一候选词列表;
获取对所述第一候选词列表中的词汇的选择操作,将被选中的词汇作为输入词汇进行输入。
2.根据权利要求1所述的面向印地语的多语言混合输入方法,其特征在于,所述根据第一语言模型,获取所述拉丁字符序列对应的拉丁字符形式的第一候选字符串列表,包括:
当所述拉丁字符序列为完整的拉丁字符拼写形式的印地语词汇时,将所述拉丁字符序列对应的印地语词汇加入所述第一候选字符串列表;以及
获取扩展选项,所述扩展选项包括:含有所述拉丁字符序列的拉丁字符拼写形式的印地语词汇或者词汇片段,将所述扩展选项加入第一候选字符串列表。
3.根据权利要求2所述的面向印地语的多语言混合输入方法,其特征在于,所述根据第一语言模型,获取所述拉丁字符序列对应的拉丁字符形式的第一候选字符串列表,还包括:
当所述第一语言模型中不存在含有所述拉丁字符序列的拉丁字符拼写形式的印地语词汇时,获取与所述拉丁字符序列相似度最高的拉丁字符拼写形式的印地语词汇,并将之作为扩展选项加入第一候选字符串列表。
4.根据权利要求1所述的面向印地语的多语言混合输入方法,其特征在于,获取对所述第一候选词列表中的词汇的选择操作,将被选中的词汇作为输入词汇进行输入之后,还包括:
根据所述输入词汇对应的语言模型,预测所述输入词汇的后续词汇,并根据预测结果生成第二候选词列表;
在输入法界面展示所述第二候选词列表;
获取对所述第二候选词列表的词汇的选择操作,将被选中的词汇作为下一个输入词汇进行输入。
5.根据权利要求4所述的面向印地语的多语言混合输入方法,其特征在于,所述根据输入词汇对应的语言模型,预测所述输入词汇的后续词汇,并根据预测结果生成第二候选词列表,包括:
判断所述输入词汇的拼写形式是拉丁字符还是印地语字符;
当所述输入词汇的拼写形式是拉丁字符时,根据第一语言模型预测后续输入词汇;
当所述输入词汇的拼写形式是印地语字符时,根据第二语言模型预测后续输入词汇,所述第二语言模型为预先建立的以印地语字符形式拼写印地语的语言模型。
6.根据权利要求1所述的面向印地语的多语言混合输入方法,其特征在于,所述根据第一语言模型,获取所述拉丁字符序列对应的拉丁字符形式的第一候选字符串列表,所述第一语言模型为预先建立的以拉丁字符形式拼写印地语的语言模型,其中,
所述第一语言模型的预先建立,包括:
获取以拉丁字符形式拼写印地语的语料数据,并对所述语料数据进行预处理以去除其中的错误语料和低频语料,得到有效语料;
去除所述有效语料数据中的冗余部分,得到整理后的语料;
使用整理后的语料构建语言模型。
7.根据权利要求6所述的面向印地语的多语言混合输入方法,其特征在于,所述使用整理后的语料构建语言模型,包括:
使用整理后的语料构建N-Gram形式的语言模型,并计算语言模型的参数,其中,所述语言模型的参数包括:语言模型中的词汇,以及N元词汇排列中,第N个词汇关于前N-1个词汇的条件概率,N为正整数;以及
对所述条件概率的数据进行平滑处理,以使所述整理后的语料中未出现的N元词汇排列对应的条件概率不为零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山安全软件有限公司,未经北京金山安全软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810713058.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防水易清洁可方向调节键盘
- 下一篇:基于体感的计算机控制系统