[发明专利]获取限制词信息的方法、优化输出的方法和输入法系统有效
申请号: | 200710099644.0 | 申请日: | 2007-05-25 |
公开(公告)号: | CN101055588A | 公开(公告)日: | 2007-10-17 |
发明(设计)人: | 吕杰勇 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F3/023 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 100084北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 限制 信息 方法 优化 输出 输入法 系统 | ||
1、一种获取限制词信息的方法,其特征在于,包括:
获取一目标词;
获取该目标词相应的特征信息,所述特征信息以数值表示;
判断所述特征信息或利用特征信息进行计算的结果是否符合预置条件,如果符合,则确定该目标词为限制词并记录相关限制信息,所述限制词是指具有语言学或使用习惯上缺陷的词,所述限制信息用于限制该目标词单独输出时的排序。
2、如权利要求1所述的方法,其特征在于,
所述特征信息为:该目标词中位于词首的单字在预设语料库内作为词首的特征值,以及该目标词中位于词尾的单字在预设语料库内作为词尾的特征值;
所述预置条件为:上述特征值中是否存在至少一个特征值属于预置范围。
3、如权利要求1所述的方法,其特征在于,
所述特征信息为:该目标词中所包含的各个单字词和/或多字词的语言学搭配关系在预设语料库内的特征值;
所述预置条件为:上述特征值中是否存在至少一个特征值属于预置范围。
4、如权利要求1所述的方法,其特征在于,
所述特征信息为:该目标词在输入法应用中用户单独输入的特征值;
所述预置条件为:该特征值是否属于预置范围。
5、如权利要求1所述的方法,其特征在于,
所述特征信息包括:该目标词中位于词首的单字在预设语料库内作为词首的特征值;该目标词中位于词尾的单字在预设语料库内作为词尾的特征值;以及该目标词的通用词频;
所述预置条件为:上述特征值中至少一个特征值与该目标词通用词频的比值是否属于预置范围。
6、如权利要求1所述的方法,其特征在于,
所述特征信息包括:该目标词中所包含的各个单字词和/或多字词的语言学搭配关系在预设语料库内的特征值;以及该目标词的通用词频;
所述预置条件为:上述特征值中至少一个特征值与该目标词通用词频的比值是否属于预置范围。
7、如权利要求1所述的方法,其特征在于,
所述特征信息为:该目标词在输入法应用中用户单独输入的特征值;以及该目标词的通用词频;
所述预置条件为:该特征值与该目标词通用词频的比值是否属于预置范围。
8、如权利要求1所述的方法,其特征在于,
所述特征信息为:该目标词在针对同一输入编码的各候选词中的用户排序位置信息;以及该目标词的原始排序位置信息;其中,所述用户排序位置信息与该目标词在输入法应用中用户单独输入的特征值相关;所述原始排序位置信息与该目标词的通用词频相关;
所述预置条件为:所述用户排序位置信息与所述原始排序位置信息的差值是否属于预置范围。
9、如权利要求1-8所述的任一方法,其特征在于,所述限制信息包括:该限制词在各预设场景下的限制单独输出的权重。
10、如权利要求1-8所述的任一方法,其特征在于,
所述限制信息包括:该限制词在预设语料库中的语言学搭配参数;所述语言学搭配参数用于限制该词在智能组词输出时的排序。
11、如权利要求1-8所述的任一方法,其特征在于,还包括:
生成一词库或词表,所述词库或词表包括所述限制词及其相关限制信息;
或者,生成一词库,所述词库包括所述限制词及其相关限制信息,以及通用字词。
12、一种获取限制词信息的方法,其特征在于,包括:
获取一目标词;
获取该目标词在预设语料库中的语言学搭配参数,所述语言学搭配参数以数值表示;
判断所述语言学搭配参数是否符合预置条件,如果符合,则记录该目标词的限制信息,所述限制信息包括相应的语言学搭配参数,所述限制信息是对具有语言学或使用习惯上缺陷的词进行限制,所述限制信息用于限制该目标词智能组词输出时的排序。
13、如权利要求12所述的方法,其特征在于:
所述语言学搭配参数为一通用参数;
或者,所述语言学搭配参数包括针对各预设场景的分参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710099644.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:在微通道中填充催化剂的方法
- 下一篇:芽苗菜生产方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置