[发明专利]一种多用户语音识别产品开发平台和开发方法在审
申请号: | 202110297986.3 | 申请日: | 2021-03-19 |
公开(公告)号: | CN112965687A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 陈思应;杨林;高君效 | 申请(专利权)人: | 成都启英泰伦科技有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L15/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多用户 语音 识别 产品 开发 平台 方法 | ||
1.一种多用户语音识别产品开发平台,其特征在于,包括网页界面模块、输入模块、命令词预处理模块、播报词预处理模块、固件参数解析模块、语言模型生成模块、播报音生成模块、语音固件生成模块、输出模块;
所述网页界面模块用于提供用户交互界面和账号管理;
所述输入模块用于从用户输入界面获取用户输入信息;
所述命令词预处理模块用于将用户输入的命令词表文件生成分词文件,并发送给语音模型生成模块;
所述播报词预处理模块根据用户提供的播报词表文件生成播报词文件,并发送给播报音生成模块;
所述语言模型生成模块根据分词文件制作语言模型文件,并发送给输出模块或语音固件生成模块;
所述播报音生成模块根据播报词文件,制作播报音文件,并发送给输出模块或语音固件生成模块;
所述固件参数解析模块根据输入模块发送的固件信息,制作固件参数文件,并发送给语音固件生成模块;
所述语音固件生成模块将接收到的文件根据固件参数文件中的固件编译参数,进行编译生成固件文件并发送给输出模块;
所述输出模块用于将收到文件输出到网页界面模块,供用户下载。
2.根据权利要求1所述的多用户语音识别产品开发平台,其特征在于:网页界面模块包括用户登录管理模块、输入界面模块和输出下载模块。
3.一种多用户语音识别产品开发方法,基于权利要求1所述多用户语音识别产品开发平台,其特征在于:包括制作语言固件;语言固件的制作方法为:
用户通过网页界面模块输入固件信息,所述平台制作语言模型文件和播报音文件,发送给语音固件生成模块;
平台内部的固件参数解析模块根据输入模块发送的固件信息,制作固件参数文件,并发送给语音固件生成模块;
语音固件生成模块接收到固件参数文件后,先根据固件参数文件确定声学模型文件和对应内置应用软件包;并将接收到的语音模型文件、播报音文件和根据固件参数文件选择的对应声学模型文件和对应内置应用软件包,根据固件参数文件中的固件编译参数,进行编译生成固件文件,并发送给输出模块。
4.根据权利要求3所述的多用户语音识别产品开发方法,其特征在于:播报音文件的制作方法为:平台内部的播报词预处理模块根据用户提供的播报词表文件,生成播报词文件,并发送给播报音生成模块;播报音生成模块根据播报词文件,制作播报音文件。
5.根据权利要求4所述的多用户语音识别产品开发方法,其特征在于:播报词文件为分词文件,对播报词文件中的播报词按照词语属性分类,播报音生成模块根据该播报词文件,生成对应的播报音,再进行拼接成每一个播报词对应的音频文件作为播报音文件。
6.根据权利要求3所述的多用户语音识别产品开发方法,其特征在于:语言模型文件的制作方法为:
平台内部的命令词预处理模块根据输入模块发送的用户提供的命令词表文件,生成分词文件,并发送给语音模型生成模块;
语音模型生成模块根据分词文件,制作语言模型文件,并发送给输出模块。
7.根据权利要求3所述的多用户语音识别产品开发方法,其特征在于:所述开发方法制作的语言模型文件包括第一优化处理模块,所述第一优化处理模块用于对相似命令词进行如下处理:
S11. 将相似命令词分组,同一组相似命令词中,定义并标记各个命令词的负性词为其他命令词;
S12. 所述输入模块发送给用户并显示在网页界面模块的命令词表文件中,提示用户对相似命令词进行分组;
S13. 用户对相似命令词进行分组后,将生成的命令词表文件输入到命令词预处理模块,命令词预处理模块会根据命令词表文件进行分类,自动将各个命令词和对应的负性词组合,生成分词文件发送到语音模型生成模块;
S14. 语音模型生成模块在生成语音模型时,对各个命令词的负性词执行不识别命令。
8.根据权利要求5所述的多用户语音识别产品开发方法,其特征在于:所述开发方法制作的语言模型文件包括第二优化处理模块,所述第二优化处理模块用于对部分重复命令词进行如下处理:
S21. 语音模型生成模块在获取到分词文件后,对其中的重复字符定义为特殊字符,所述重复字符为:自身作为一个命令词,并作为其他至少一个命令词的部分字符,且不位于命令词末尾;
S22. 语音模型生成模块对含特殊字符的命令词识别方法进行如下定义:
识别到特殊字符时,等待预设的间隔时间,间隔时间内如有其它字符,则将特殊字符和其他字符组合后再进行识别;
如果间隔时间内无其他字符,则间隔时间后开始识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都启英泰伦科技有限公司,未经成都启英泰伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110297986.3/1.html,转载请声明来源钻瓜专利网。