[发明专利]一种文本输入方法及装置有效
申请号: | 201910833984.4 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110569505B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 熊蜀峰;王丙坤;娄鹏宇;宁菲菲;刘玉坤 | 申请(专利权)人: | 平顶山学院 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/289;G06F18/214;G06N3/048;G06N3/08;G06F3/023 |
代理公司: | 郑州睿信知识产权代理有限公司 41119 | 代理人: | 韩天宝 |
地址: | 467000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种文本输入方法及装置,属于输入法技术领域。文本输入方法包括:获取拼音序列;将拼音序列输入训练好的PS2CS模型,通过训练好的PS2CS模型对该拼音序列对应的汉字序列进行预测;PS2CS模型的训练过程为:根据lookup表将训练集数据中的拼音序列样本的每个字母进行向量转化,生成每个字母对应的向量;lookup表包括28个字符和对应字符的向量表示;28个字符包括26个拼音字母和2个占位符号;根据拼音序列样本向量矩阵通过预测层输出预测结果;将预测结果与训练集数据中对应的标准汉字序列样本进行比对,求取损失函数。本发明通过原始的拼音字符序列进行向量化,进而预测对应的汉字序列,大大的节省了内存空间,而且预测地更加准确。 | ||
搜索关键词: | 一种 文本 输入 方法 装置 | ||
【主权项】:
1.一种文本输入方法,其特征在于,包括以下步骤:/n获取拼音序列;/n将拼音序列输入训练好的PS2CS模型,通过训练好的PS2CS模型对该拼音序列对应的汉字序列进行预测;所述PS2CS模型的训练过程为:/n根据lookup表将训练集数据中的拼音序列样本的每个字母进行向量转化,生成每个字母对应的向量;所述lookup表包括28个字符和对应字符的向量表示;28个字符包括26个拼音字母和2个占位符号;/n根据编码公式生成拼音序列样本中每个字母的位置编码向量和初始时间循环步编码向量;/n根据拼接公式将拼音序列样本中每个字母的向量、位置编码向量和初始时间循环步编码向量进行拼接,得到拼接结果;/n将拼接结果作为第一输入输入到自注意力单元的抽取层中,进行迭代,每次迭代更新时间循环步编码向量并相应更新抽取层的输入,达到指定条件后停止迭代,得到拼音序列样本的特征表示;/n将特征表示作为预测层的输入,通过预测层输出拼音序列样本的预测结果;/n将预测结果与训练集数据中对应的标准汉字序列样本进行比对,求取损失函数,重复上述过程得到训练好的PS2CS模型。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平顶山学院,未经平顶山学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910833984.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种关系词确定方法及装置
- 下一篇:一种基于医疗词典的医疗命名实体识别方法