[发明专利]文本输入法以及相关装置在审

专利信息
申请号: 202111666573.4 申请日: 2021-12-31
公开(公告)号: CN114356116A 公开(公告)日: 2022-04-15
发明(设计)人: 王永灿;丁克玉 申请(专利权)人: 科大讯飞股份有限公司
主分类号: G06F3/023 分类号: G06F3/023;G06F40/295;G06F40/30;G06N3/04;G06N3/08
代理公司: 深圳市威世博知识产权代理事务所(普通合伙) 44280 代理人: 刘希
地址: 230088 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 输入法 以及 相关 装置
【说明书】:

本申请公开了一种文本输入法以及相关装置,包括:获取字符串和融合候选词向量库;将字符串输入解码模型,得到字符串的解码词;其中,解码模型用于获取字符串的语义特征,利用字符串的语义特征和融合候选词向量库,得到字符串的解码词;融合候选词向量库中包括多个候选语义特征,候选语义特征是候选字的融合语义特征,候选字的融合语义特征是候选字的通用语义特征与候选字的人名语义特征的加权融合,解码词为字符串中各字符的候选字的组合。这样可以基于神经网络一体化建模,实现通用输入与人名输入的统一建模协同解码,并且在保障解码效果的同时,避免给用户引入更多操作成本,从而改善人名解码效果,提升人名输入效率。

技术领域

本申请属于人工智能技术领域,具体涉及一种文本输入法以及相关装置。

背景技术

随着电子设备在人们的生活工作中越来越高的普及率,输入法作为人与电子设备的交互入口,发挥着越来越重要的作用,极大地方便了人们的输入过程。但是,人名输入作为日常输入中的一个常见场景,由于与通用输入差异较大,除极少数常用人名外,难以直接获取想要的人名解码候选结果,进而给人名输入造成了极大不便。

目前,当前输入法中输入人名主要还是基于通用引擎解码,当相应人名在词典中,则可解码出相应人名;如果不在词典中,则用户只能通过单字过滤,逐字输入人名。主要存在以下几种缺陷:(1)直接使用通用引擎解码,解码出人名结果数量太少,除少数在词典中的高频人名外,几乎都要用户自主选字组合而成,严重影响输入效率;(2)分别构建通用解码引擎与人名解码引擎,需要进行两次解码,效率低下,且需用户进行手动切换,输入体验不够智能;(3)判断人名输入概率依赖通用解码引擎人名解码能力或上下文文本内容;(4)直接使用常用姓、名等资源匹配解码不充分,解码结果严重依赖姓、名等资源丰富度,且依赖音节切分等解码前置步骤效果。因此,有必要提出一种新的方法来解决上述问题。

发明内容

本申请主要解决的技术问题是提供一种文本输入法以及相关装置,可以实现通用输入与人名输入的统一建模协同解码。

为解决上述技术问题,本申请采用的一个技术方案是:提供一种文本输入法,包括:获取字符串和融合候选词向量库;其中,所述字符串包括按键序列、语言序列及笔画序列;将所述字符串输入解码模型,得到所述字符串的解码词;其中,所述解码模型用于获取所述字符串的语义特征,利用所述字符串的语义特征和所述融合候选词向量库,得到所述字符串的解码词;所述融合候选词向量库中包括多个候选语义特征,所述候选语义特征是候选字的融合语义特征,所述候选字的融合语义特征是候选字的通用语义特征与候选字的人名语义特征的加权融合,所述解码词为所述字符串中各字符的候选字的组合。

其中,所述解码模型还用于获取所述字符串为人名字符串的概率值,将所述概率值作为候选字的人名语义特征的权重系数,以加权融合候选字的通用语义特征与候选字的人名语义特征,候选字的通用语义特征的权重系数与候选字的人名语义特征的权重系数的和为1。

其中,所述解码模型包括端到端神经网络结构,所述端到端神经网络结构包括预测模块,所述预测模块包括编码器以及与所述编码器连接的分类网络,所述编码器用于对所述字符串进行编码得到所述字符串的语义特征,所述分类网络用于获取所述字符串为人名字符串的概率值。

其中,所述端到端神经网络结构还包括解码模块;所述解码模块用于逐字符地从所述融合候选词向量库中获取匹配当前字符的候选语义特征,匹配当前字符的候选语义特征为多个;融合前一字符的解码信息计算匹配当前字符的各个候选语义特征的概率。

其中,所述编码器的网络结构为BiLSTM或压缩的预训练语言表征训练模型BERT;所述分类网络的网络结构为包括全连接层的分类网络;所述解码模块的网络结构为长短期记忆网络LSTM或transformer模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111666573.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top