[发明专利]口语信息处理方法、装置和电子设备有效
| 申请号: | 202011461385.3 | 申请日: | 2020-12-08 |
| 公开(公告)号: | CN112651231B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 林雨;蒙嘉颖;吴培昊 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
| 主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/253;G06F40/58;G10L15/26 |
| 代理公司: | 泰和泰律师事务所 51219 | 代理人: | 祝海燕 |
| 地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 口语 信息处理 方法 装置 电子设备 | ||
1.一种口语信息处理方法,其特征在于,包括:
确定初始口语信息中各个单词对应的词干,并基于所述各个单词对应的词干得到与所述初始口语信息对应的初始口语词干向量;
根据所述初始口语信息对应的初始口语向量和所述初始口语词干向量,确定与所述初始口语信息中各个单词对应的标签;所述标签至少包括:顺滑、非顺滑;
根据所述各个单词对应的标签处理所述初始口语信息,得到顺滑的目标口语信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述初始口语信息对应的初始口语向量和所述初始口语词干向量,确定与所述初始口语信息中各个单词对应的标签,包括:
将所述初始口语信息对应的初始口语向量和所述初始口语词干向量输入预先训练好的口语处理模型中,得到与所述初始口语信息中各个单词对应的标签。
3.根据权利要求2所述的方法,其特征在于,所述口语处理模型包括第一预设口语处理模型、第二预设口语处理模型和第三预设口语处理模型,以及所述口语处理模型预先基于如下步骤训练:
构建训练样本集;所述训练样本集中包括多个非顺滑样本信息;
针对每一个所述非顺滑样本信息,确定该非顺滑样本信息中各个样本单词对应的样本词干,并基于所述各个样本单词对应的样本词干得到该非顺滑样本信息对应的非顺滑样本词干向量;
利用所述非顺滑样本信息对应的非顺滑样本向量、所述非顺滑样本词干向量分别训练所述第一预设口语处理模型和所述第二预设口语处理模型至收敛;
将收敛的所述第一预设口语处理模型和所述第二预设口语处理模型的输出标签向量按照预设规则进行拼接,并将拼接后的组合向量作为所述第三预设口语处理模型的输入,训练所述第三预设口语处理模型至收敛,得到所述口语处理模型。
4.根据权利要求3所述的方法,其特征在于,所述构建训练样本集,包括:
获取顺滑样本信息;
在预设词库中查找所述顺滑样本信息中的各个样本单词对应的原始形态单词;所述预设词库中包括所述各个样本单词对应的原始形态单词;
确定查找到的所述原始形态单词对应的样本单词在所述顺滑样本信息中的位置;
以所述位置为起始位置,并以所述样本单词为起始单词,插入预设重复长度、预设重复次数的多个样本单词。
5.根据权利要求3所述的方法,其特征在于,所述构建训练样本集,包括:
获取顺滑样本信息;
在所述顺滑样本信息中随机插入至少一个重复单词,得到所述非顺滑样本信息;所述重复单词包括在插入位置处的初始样本单词。
6.根据权利要求3所述的方法,其特征在于,所述构建训练样本集,包括:
获取顺滑样本信息;
在所述顺滑样本信息中随机插入语气单词,得到所述非顺滑样本信息。
7.根据权利要求1所述的方法,其特征在于,所述根据所述各个单词对应的标签处理所述初始口语信息,得到顺滑的目标口语信息,包括:
删除被标记为非顺滑的标签对应的单词,得到所述目标口语信息。
8.一种口语信息处理装置,其特征在于,包括:
确定模块,用于确定初始口语信息中各个单词对应的词干,并基于所述各个单词对应的词干得到与所述初始口语信息对应的初始口语词干向量;
标注模块,用于根据所述初始口语信息对应的初始口语向量和所述初始口语词干向量,确定与所述初始口语信息中各个单词对应的标签;所述标签至少包括:顺滑、非顺滑;
处理模块,用于根据所述各个单词对应的标签处理所述初始口语信息,得到顺滑的目标口语信息。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011461385.3/1.html,转载请声明来源钻瓜专利网。





