[发明专利]一种基于麦克风的文稿预制方法及系统有效
| 申请号: | 202310744330.0 | 申请日: | 2023-06-25 |
| 公开(公告)号: | CN116524910B | 公开(公告)日: | 2023-09-08 |
| 发明(设计)人: | 虞焰兴;徐勇 | 申请(专利权)人: | 安徽声讯信息技术有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;G10L15/30;G06F16/34 |
| 代理公司: | 北京知联天下知识产权代理事务所(普通合伙) 11594 | 代理人: | 张迎新 |
| 地址: | 230088 安徽省合肥市高新区习友路33*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 麦克风 文稿 预制 方法 系统 | ||
1.一种基于麦克风的文稿预制方法,其特征在于,包括以下步骤:
对n个麦克风分别设置不同标记,记为A1、A2......An;
获取n个麦克风对应的文稿,并将文稿录制为语音;
对录制的n个语音分别进行训练,获取n个文稿对应的目标语音,所述目标语音为无口音、无语病或者无口误的普通话语音或外语语音;
判断标记为Am的麦克风是否发出读取信号,其中n≥m≥1;
若发出读取信号,则标记为Am的麦克风对应的目标语音并进行播放;
对所述目标语音进行播放,包括以下步骤:
获取目标语音的音频;
基于音频判断是否需要对目标语音进行调音,直至目标语音的音频满足预设音频范围;
若未发出读取信号,则等待读取信号发出。
2.根据权利要求1所述的一种基于麦克风的文稿预制方法,其特征在于,所述语音通过词袋模型或词频-逆向文件频率或词嵌入进行训练;
所述词袋模型包括以下公式:
v(D)=[count(
式中,v(D)表示词袋模型,D表示文本,
所述词频-逆向文件频率包括以下公式:
tf-idf(
其中,
所述词嵌入包括以下公式:
v(
其中d表示向量的维度,v1(
3.根据权利要求1所述的一种基于麦克风的文稿预制方法,其特征在于,对所述目标语音进行播放,包括以下步骤:
将目标语音转为文字信息;
将文字信息通过多媒体设备播放。
4.一种基于麦克风的文稿预制系统,其特征在于,用于执行权利要求1-3任一项所述的一种基于麦克风的文稿预制方法。
5.一种基于麦克风的文稿预制系统,其特征在于,包括:
第一输入单元,用于读文稿,还用于发出读取信号;
录制单元,用于将文稿录制为语音;
训练单元,用于对录制的语音进行训练,得到目标语音,所述目标语音为无口音、无语病或者无口误的普通话语音或外语语音;
服务器单元,用于将目标语音转换为文字信息,同时将目标语音和文字信息绑定并存储;
接收机单元,用于从服务器单元获取目标语音并进行调频,同时获取文字信息,还用于判断是否收到读取信号;
音响单元,用于对目标语音进行语音播放;
显示单元,用于对文字信息进行显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽声讯信息技术有限公司,未经安徽声讯信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310744330.0/1.html,转载请声明来源钻瓜专利网。





