[发明专利]语句的处理方法、装置及电子设备在审
| 申请号: | 202111321370.1 | 申请日: | 2021-11-09 |
| 公开(公告)号: | CN116108828A | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 廖振宇 | 申请(专利权)人: | 广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/242;G06F40/253 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;黄健 |
| 地址: | 510530 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语句 处理 方法 装置 电子设备 | ||
本申请提供一种语句的处理方法、装置及电子设备,通过自动语音识别将语音数据转换为文本形式的语句后,进一步将语句拆分成多个处理部分,并根据多个处理部分的拼音对语句中包括的实体词条进行模糊查询,得到实体索引中处理部分对应的实体词条,并在处理部分的文字和实体词条中文字不同时,使用实体词条对语句中的处理部分进行替换,从而保证语句中实体词条的文本正确,进而保证后续可以通过自然语言理解准确地确定语句的命令,最终准确执行用户指示的命令,提高电子设备的用户体验。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种语句的处理方法、装置及电子设备。
背景技术
随着科学技术的不断发展,手机、电脑等电子设备上越来越多地设置有语音对话系统,使电子设备的用户能够通过“对话式”的方式实现对电子设备的控制。
现有技术中,当用户向电子设备说出所指示的命令后,电子设备可以通过麦克风等语音采集设备采集到用户的语音数据,并将语音数据转为为文本形式的语句,再确定语句对应的命令后最终执行该命令。
但是,现有技术中所使用的自动语音识别等方式并不能完全准确地将语音数据转换为文本形式的语句,从而导致后续无法准确理解用户的命令并执行,影响电子设备实现基于语音数据进行智能化的控制,降低电子设备的用户体验。
发明内容
本申请提供一种语句的处理方法、装置及电子设备,用于对通过语音数据得到的文本形式的语句进行处理,修正其中实体词条的文字,提高语句中实体词条的准确性,进而保证电子设备能够准确地实现基于语音数据进行的智能化控制,提高电子设备的用户体验。
本申请第一方面提供一种语句的处理方法,包括:获取待处理语句;其中,所述待处理语句是识别语音数据得到的,所述待处理语句包括顺序排列的多个文字;将所述待处理语句拆分为多个处理部分;其中,所述处理部分包括所述语句中的一个文字,或者连续的多个文字;从所述多个处理部分中,确定与实体索引中的第一实体词条对应的第一处理部分;其中,所述第一实体词条和所述第一处理部分的文字数量相同,且所述第一实体词条和所述第一处理部分中排列位置的相同的文字的拼音相同,所述实体索引包括多个实体词条、实体词条的第一级索引和实体词条的第二级索引,所述第一级索引包括所述实体词条中每个文字的拼音,以及该文字在实体词条中的排列位置,所述第二级索引包括多个实体词条中所有文字的排列位置;当所述第一处理部分的文字与所述第一实体词条的文字不同,使用所述第一实体词条的文字代替所述第一处理部分的文字。
在本申请第一方面一实施例中,所述从所述多个处理部分中,确定与实体索引中的第一实体词条对应的第一处理部分,包括:根据所述实体索引,确定每个处理部分的每个文字的拼音所对应的候选实体词条集合;所述候选实体词条集合包括至少一个实体词条;从所述多个处理部分中,确定每个文字对应的候选实体词条集合中包括相同的第一候选实体词条的处理部分为所述第一处理部分。
在本申请第一方面一实施例中,确定所述处理部分中每个文字的拼音对应的候选实体词条集合,包括:根据所述处理部分中的第一文字在所述处理部分中的第一排列位置,从所述实体索引中,确定所述第一排列位置的第二级索引;根据所述第一文字的拼音,从所述第二级索引所指示的多个第一级索引中确定至少一个候选第一级索引;其中,所述候选第一级索引指示的实体词条中,在第一排列位置上的第二文字的拼音符合第一预设条件;将所述候选第一级索引所指示的实体词条加入所述候选实体词条集合。
在本申请第一方面一实施例中,所述第一预设条件,包括:所述第一文字的拼音和所述第二文字的拼音相同;或者,所述第一文字的拼音和所述第二文字的拼音之间的编辑距离与第一长度之比,小于第一阈值;其中,所述第一长度为所述第一文字的拼音长度和所述第二文字的拼音长度中的最大长度。
在本申请第一方面一实施例中,所述实体索引还包括:所述多个实体词条中每个实体词条的声调,所述将所述第一级索引所指示的实体词条加入所述候选实体词条集合,包括:将所述第一级索引所指示的实体词条中,声调满足第二预设条件的实体词条加入所述候选实体词条集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司,未经广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111321370.1/2.html,转载请声明来源钻瓜专利网。





