[发明专利]一种基于麦克风的文稿预制方法及系统有效

申请号：	202310744330.0	申请日：	2023-06-25
公开（公告）号：	CN116524910B	公开（公告）日：	2023-09-08
发明（设计）人：	虞焰兴;徐勇	申请（专利权）人：	安徽声讯信息技术有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/26;G10L15/30;G06F16/34
代理公司：	北京知联天下知识产权代理事务所(普通合伙) 11594	代理人：	张迎新
地址：	230088 安徽省合肥市高新区习友路33***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于麦克风文稿预制方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于麦克风的文稿预制方法，其特征在于，包括以下步骤：

对n个麦克风分别设置不同标记，记为A1、A2......An；

获取n个麦克风对应的文稿，并将文稿录制为语音；

对录制的n个语音分别进行训练，获取n个文稿对应的目标语音，所述目标语音为无口音、无语病或者无口误的普通话语音或外语语音；

判断标记为Am的麦克风是否发出读取信号，其中n≥m≥1；

若发出读取信号，则标记为Am的麦克风对应的目标语音并进行播放；

对所述目标语音进行播放，包括以下步骤：

获取目标语音的音频；

基于音频判断是否需要对目标语音进行调音，直至目标语音的音频满足预设音频范围；

若未发出读取信号，则等待读取信号发出。

2.根据权利要求1所述的一种基于麦克风的文稿预制方法，其特征在于，所述语音通过词袋模型或词频-逆向文件频率或词嵌入进行训练；

所述词袋模型包括以下公式：

v(D)=[count(w₁,D),count(w₂,D),...,count(w_N,D)]；

式中，v(D)表示词袋模型，D表示文本，w表示词汇，count(w_i,D)表示词汇w_i在文本D中出现的次数，N≥i≥1；

所述词频-逆向文件频率包括以下公式：

tf-idf(w,D,C)=tf(w, D)×idf(w,C)；

其中，w表示词汇，D表示文本，C表示语料库，tf(w,D)表示词汇w在文本D中出现的频率，idf(w,C)表示词汇w在语料库C中的逆文档频率；

所述词嵌入包括以下公式：

v(w) = [v₁(w),v₂(w), ...,v_d(w)]；

其中d表示向量的维度，v₁(w)~v_d(w)表示向量v(w)在第1个~第d个维度上的值，为词汇w在第1个~第d个维度上的特定语义或语法特征。

3.根据权利要求1所述的一种基于麦克风的文稿预制方法，其特征在于，对所述目标语音进行播放，包括以下步骤：

将目标语音转为文字信息；

将文字信息通过多媒体设备播放。

4.一种基于麦克风的文稿预制系统，其特征在于，用于执行权利要求1-3任一项所述的一种基于麦克风的文稿预制方法。

5.一种基于麦克风的文稿预制系统，其特征在于，包括：

第一输入单元，用于读文稿，还用于发出读取信号；

录制单元，用于将文稿录制为语音；

训练单元，用于对录制的语音进行训练，得到目标语音，所述目标语音为无口音、无语病或者无口误的普通话语音或外语语音；

服务器单元，用于将目标语音转换为文字信息，同时将目标语音和文字信息绑定并存储；

接收机单元，用于从服务器单元获取目标语音并进行调频，同时获取文字信息，还用于判断是否收到读取信号；

音响单元，用于对目标语音进行语音播放；

显示单元，用于对文字信息进行显示。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽声讯信息技术有限公司，未经安徽声讯信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202310744330.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载