[发明专利]口语信息处理方法、装置和电子设备有效
| 申请号: | 202011461385.3 | 申请日: | 2020-12-08 |
| 公开(公告)号: | CN112651231B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 林雨;蒙嘉颖;吴培昊 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
| 主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/253;G06F40/58;G10L15/26 |
| 代理公司: | 泰和泰律师事务所 51219 | 代理人: | 祝海燕 |
| 地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 口语 信息处理 方法 装置 电子设备 | ||
本公开实施例公开了一种口语信息处理方法、装置和电子设备。该方法的一具体实施方式包括:确定初始口语信息中各个单词对应的词干,并基于各个单词对应的词干得到与初始口语信息对应的初始口语词干向量;根据初始口语信息对应的初始口语向量和初始口语词干向量,确定与初始口语信息中各个单词对应的标签;标签至少包括:顺滑、非顺滑;根据各个单词对应的标签处理初始口语信息,得到顺滑的目标口语信息。能够基于初始口语向量和初始口语词干向量处理初始口语信息,利于初始口语信息的去重处理,得到顺滑的目标口语信息。
技术领域
本公开涉及互联网技术领域,尤其涉及一种口语信息处理方法、装置和电子设备。
背景技术
在使用英语作为沟通语言时,常常需要将说话者的口语信息进行处理,以用于翻译成其他语言的文本信息或者转换为较为规范的文本信息进行传阅等。在这过程中,可以对该口语信息进行去重处理,继而实现下游任务(例如口语信息中的语法纠错、抽取短句进行分析等)对该口语信息的进一步处理操作。
发明内容
提供该公开内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该公开内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开实施例提供了一种口语信息处理方法、装置和电子设备。
第一方面,本公开实施例提供了一种口语信息处理方法,该方法包括:确定初始口语信息中各个单词对应的词干,并基于所述各个单词对应的词干得到与所述初始口语信息对应的初始口语词干向量;根据所述初始口语信息对应的初始口语向量和所述初始口语词干向量,确定与所述初始口语信息中各个单词对应的标签;所述标签至少包括:顺滑、非顺滑;根据所述各个单词对应的标签处理所述初始口语信息,得到顺滑的目标口语信息。
第二方面,本公开实施例提供了一种口语信息处理装置,该装置包括:确定模块,用于确定初始口语信息中各个单词对应的词干,并基于所述各个单词对应的词干得到与所述初始口语信息对应的初始口语词干向量;标注模块,用于根据所述初始口语信息对应的初始口语向量和所述初始口语词干向量,确定与所述初始口语信息中各个单词对应的标签;所述标签至少包括:顺滑、非顺滑;处理模块,用于根据所述各个单词对应的标签处理所述初始口语信息,得到顺滑的目标口语信息。
第三方面,本公开实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面所述的口语信息处理方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面所述的口语信息处理方法的步骤。
本公开实施例提供的口语信息处理方法、装置和电子设备,通过确定初始口语信息中各个单词对应的词干,并基于所述各个单词对应的词干得到与所述初始口语信息对应的初始口语词干向量;然后根据所述初始口语信息对应的初始口语向量和所述初始口语词干向量,确定与所述初始口语信息中各个单词对应的标签;所述标签至少包括:顺滑、非顺滑;最后根据所述各个单词对应的标签处理所述初始口语信息,得到顺滑的目标口语信息。通过上述方案能够基于初始口语向量和初始口语词干向量处理初始口语信息,利于初始口语信息的去重处理,得到顺滑的目标口语信息。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为根据本公开的口语信息处理方法的一个实施例的流程图;
图2为根据本公开涉及的训练口语处理模型的一个实施例的流程示意图;
图3为根据本公开的口语信息处理装置的一个实施例的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011461385.3/2.html,转载请声明来源钻瓜专利网。





