[发明专利]基于人工智能的文字输入方法和装置有效
申请号: | 201611138387.2 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106843523B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 王知践;钱胜 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 文字 输入 方法 装置 | ||
1.一种基于人工智能的文字输入方法,其特征在于,包括以下步骤:
将用户所输入的拼音序列输入声学模型,以使得所述声学模型预测得到所述拼音序列所拼读的各语音,查询发音符合所述各语音的字,根据查询到的所述字组合得到候选文本,以及候选文本中每一个字的声学概率;
针对所述候选文本,按照字的方式进行扩展,得到字组成的序列;
在由每一个字对应的字状态所确定出的所述候选文本对应字状态序列中,基于字状态的语言模型进行预测,确定所述候选文本中各个字的语言概率,其中,所述字状态序列是根据每一个字和对应的字状态之间的映射关系确定的;所述字状态指示了相应字对应的标号标识;
根据所述候选文本中各个字的所述语言概率和所述声学概率,从所述候选文本中选出目标文本进行输出。
2.根据权利要求1所述的基于人工智能的文字输入方法,其特征在于,所述根据所述候选文本中各个字的所述语言概率和所述声学概率,从所述候选文本中选出目标文本进行输出,包括:
将所述候选文本中的各个字分别对应一条查询路径的起点,获得各个查询路径;
针对每一条查询路径,将所述候选文本中,在所述起点对应的字之后出现的字,依次作为所述查询路径的当前节点,根据所述语言概率和所述声学概率,计算从所述查询路径的起点开始至当前节点的总概率;
若从所述查询路径的起点开始至当前节点的总概率低于预设阈值,则筛选掉所述查询路径;
根据筛选保留的查询路径,确定所述目标文本。
3.根据权利要求2所述的基于人工智能的文字输入方法,其特征在于,所述根据筛选保留的查询路径,确定所述目标文本,包括:
对至少两条查询路径采用前向和/或后向方式进行合并,获得所述至少两条查询路径中的公共部分;
根据所述公共部分中各节点对应字,确定所述目标文本。
4.根据权利要求2所述的基于人工智能的文字输入方法,其特征在于,所述总概率是根据各节点对应字的所述语言概率和所述声学概率进行加权,获得字的概率之后,对各个字的概率进行求和所获得的。
5.根据权利要求1-4任一项所述的基于人工智能的文字输入方法,其特征在于,所述将用户所输入的拼音序列输入声学模型,得到候选文本,以及候选文本中每一个字的声学概率,包括:
将用户所输入的拼音序列输入经过训练的声学模型,预测所述拼音序列所拼读的各语音,以及拼读各语音的声学概率;
根据预设字典,查询发音符合所述各语音的字;
按照各个字的拼音在所述拼音序列中出现的先后顺序,由所查询到的字组合成所述候选文本;其中,所述候选文本中每一个字的声学概率是根据所述字的语音的声学概率获得的。
6.根据权利要求1-4任一项所述的基于人工智能的文字输入方法,其特征在于,所述针对所述候选文本,按照字的方式进行扩展,得到字组成的序列,包括:
针对所述候选文本,以每一个字作为一个元素进行划分,得到字组成的序列。
7.根据权利要求1-4任一项所述的基于人工智能的文字输入方法,其特征在于,所述在由每一个字对应的字状态所确定出的所述候选文本对应字状态序列中,基于字状态的语言模型进行预测,确定所述候选文本中各个字的语言概率,包括:
根据预先确定的字与字状态之间的对应关系,查询所述候选文本中每一个字对应的字状态,得到所述候选文本对应的字状态序列;
将所述字状态序列,输入所述基于字状态的语言模型,以预测所述候选文本中各个字与在所述字之前出现的字组合后,形成通顺短语的语言概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611138387.2/1.html,转载请声明来源钻瓜专利网。