[发明专利]一种输入法评测方法、装置、设备及存储介质在审
申请号: | 202010076352.0 | 申请日: | 2020-01-23 |
公开(公告)号: | CN111324528A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 杨勤英;殷运鹏;宋明 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F3/023 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 输入法 评测 方法 装置 设备 存储 介质 | ||
1.一种输入法评测方法,其特征在于,包括:
从目标群体的历史输入文本中确定出至少一个文本单元集合,每一文本单元集合中的各文本单元对应同一编码信息;其中,所述同一编码信息的编码规范与待评测输入法的编码规范一致;
分别将每一文本单元集合对应的编码信息输入待评测输入法,得到与每一文本单元集合对应的解码结果集合,所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果;
至少根据各个文本单元集合及其对应的解码结果集合,确定所述目标群体对所述待评测输入法的评测结果。
2.根据权利要求1所述的方法,其特征在于,所述从目标群体的历史输入文本中确定出至少一个文本单元集合,包括:
获取目标群体在设定时间段内的历史输入文本;
对所述历史输入文本进行文本单元划分处理,得到各个文本单元,以及分别确定与各个文本单元对应的编码信息;
由所述各个文本单元中的、与同一编码信息对应的各个文本单元,组成与该同一编码信息对应的文本单元集合。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定各个文本单元集合中的各个文本单元的评分分值,以及确定各个解码结果集合中的各个解码结果的评分分值;其中,所述评分分值至少基于词频属性确定,所述词频属性为高频,或中频,或低频;
则,所述至少根据各个文本单元集合及其对应的解码结果集合,确定所述目标群体对所述待评测输入法的评测结果,包括:
根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值,以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值,确定所述目标群体对所述待评测输入法的评测结果。
4.根据权利要求3所述的方法,其特征在于,所述确定各个文本单元集合中的各个文本单元的评分分值,包括:
分别确定各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性;
至少根据各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性,以及预设的基于词频属性的评分规则,分别确定各个文本单元集合中的各个文本单元的评分分值。
5.根据权利要求4所述的方法,其特征在于,所述分别确定各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性,包括:
对应各个文本单元集合中的每个文本单元,分别根据其字长和其在所述目标群体的历史输入文本中出现的次数,确定其词频属性。
6.根据权利要求4所述的方法,其特征在于,所述基于词频属性的评分规则为评分分值大小与词频属性和/或词频排名相关的评分规则。
7.根据权利要求3所述的方法,其特征在于,所述确定各个解码结果集合中的各个解码结果的评分分值,包括:
分别确定各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性;
对应每个解码结果集合中的每个解码结果,分别将与该解码结果所在的解码结果集合对应的文本单元集合中的、与该解码结果的内容相同的文本单元的词频属性,设定为该解码结果的词频属性;
至少根据各个解码结果集合中的各个解码结果的词频属性,以及预设的基于词频属性的评分规则,分别确定各个解码结果集合中的各个解码结果的评分分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010076352.0/1.html,转载请声明来源钻瓜专利网。