[发明专利]多语语音识别及主题语意分析方法与装置在审
| 申请号: | 201911216220.7 | 申请日: | 2019-12-02 |
| 公开(公告)号: | CN112988955A | 公开(公告)日: | 2021-06-18 |
| 发明(设计)人: | 卢文祥;简君聿;沈绍全;叶威呈 | 申请(专利权)人: | 卢文祥 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/263;G10L15/00;G10L15/26 |
| 代理公司: | 北京先进知识产权代理有限公司 11648 | 代理人: | 邵劲草 |
| 地址: | 中国台湾台*** | 国省代码: | 台湾;71 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 主题 语意 分析 方法 装置 | ||
1.一种多语语音识别及主题语意分析方法,包含:
通过语音识别器依据语音对照表,取得对应于语音输入信号的拼音字符串;
通过该语音识别器依据多语词汇集,判断该拼音字符串对应于多个原始词;
通过该语音识别器依据该多语词汇集及该原始词形成一语句;
通过语意分析器依据该语句及主题词汇语意关系数据集,选择性地执行矫正流程、执行分析状态判断流程或输出该语句;
通过该语意分析器在判断该矫正流程成功时,输出经矫正后的该语句;以及
通过该语意分析器在判断该矫正流程失败时,执行该分析状态判断流程以选择性地输出判断结果。
2.如权利要求1所述的多语语音识别及主题语意分析方法,其中该语句包含整合语言的多个转换词,且通过该语意分析器依据该语句及该主题词汇语意关系数据集,选择性地执行该矫正流程、执行该分析状态判断流程或输出该语句包含:
依据该语句及该主题词汇语意关系数据集判断该转换词的错误比例;
当该错误比例位于第一错误比例范围内时,输出该语句;
当该错误比例位于第二错误比例范围内时,执行该分析状态判断流程;以及
当该错误比例位于第三错误比例范围内时,执行该矫正流程。
3.如权利要求2所述的多语语音识别及主题语意分析方法,其中依据该语句及该主题词汇语意关系数据集判断该转换词的该错误比例包含:
将该语句判断为一个或多个子句;
针对每一该一个或多个子句,依据该主题词汇语意关系数据集,判断该子句中的该转换词的同主题比例;以及
依据每一该一个或多个子句的该同主题比例取得该错误比例。
4.如权利要求2所述的多语语音识别及主题语意分析方法,其中通过该语意分析器依据该语句及该主题词汇语意关系数据集,选择性地执行该矫正流程、执行该分析状态判断流程或输出该语句还包含:
从多个既存主题词汇语意关系数据集中选择一个作为该主题词汇语意关系数据集,其中每一该既存主题词汇语意关系数据集对应于不同语言,且该主题词汇语意关系数据集对应于该整合语言。
5.如权利要求1所述的多语语音识别及主题语意分析方法,其中该矫正流程包含:
使用语言辨识声音模型以产生混淆句集,其中该混淆句集包含多个候选句;
依据该原始词以及该多语词汇集,补充该混淆句集;
依据该主题词汇语意关系数据集,判断对应的该混淆句集中的该候选句中是否有适用者;
当判断有该适用者时,以该适用者取代该语句,且该矫正流程成功;以及
当判断无该适用者时,该矫正流程失败。
6.如权利要求1所述的多语语音识别及主题语意分析方法,其中该分析状态判断流程包含:
判断通过该语音识别器依据该多语词汇集判断该拼音字符串对应于该原始词的执行次数是否超过默认值;
当该执行次数未超过该默认值时,指示该语音识别器重新依据该多语词汇集判断该拼音字符串对应于其他多个原始词,并将该执行次数加1;以及
当该执行次数超过该默认值时,输出失败提示或语音输入要求。
7.如权利要求6所述的多语语音识别及主题语意分析方法,其中依据该多语词汇集判断该拼音字符串对应于该原始词是通过第一断词方法来执行,而重新依据该多语词汇集判断该拼音字符串对应于其他该原始词是通过第二断词方法来执行,其中该第一断词方法异于该第二断词方法。
8.如权利要求1所述的多语语音识别及主题语意分析方法,其中通过该语音识别器依据该多语词汇集及该原始词形成该语句包含:
依据该原始词的语系分布比例选择整合语言;以及
依据该多语词汇集,取得该原始词所对应的多个转换词,并以该转换词形成该语句;
其中该转换词属于该整合语言。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卢文祥,未经卢文祥许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911216220.7/1.html,转载请声明来源钻瓜专利网。





