[发明专利]基于智能语音鼠标的字幕实现方法、装置、系统和存储介质在审

申请号：	201910923592.7	申请日：	2019-09-27
公开（公告）号：	CN110648653A	公开（公告）日：	2020-01-03
发明（设计）人：	冯海洪;毛德平;许成亮;朱国冉	申请（专利权）人：	安徽咪鼠科技有限公司
主分类号：	G10L13/04	分类号：	G10L13/04;G10L15/02;G10L15/06;G10L15/14;G10L15/18;G10L15/22;G10L15/26;G06F3/0354
代理公司：	53113 昆明合众智信知识产权事务所	代理人：	叶春娜
地址：	230088 安徽省合肥市高新区习友路33***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及语音信号处理领域，尤其涉及一种基于智能语音鼠标的字幕实现方法、装置、系统和存储介质，该方法包括：在智能语音鼠标端实现语音采集，然后，将采集的语音文件进行预处理，并且将预处理后的文件进行存储及管理，接下来，将得到的数据通过模型训练得出用户意图，通过多个移动端自由共享数据到局域网内，局域网内多设备实时互连，接收多设备的数据，最后，通过字幕展示用户的语音内容，本发明利用语音识别技术，结合硬件设备，实现在不同设备间完成数据共享，实时录音及语音字幕实时显示，使人们的会议进行的更加的智能化与便捷化，避免因为会议演讲人的发言不清楚，导致参会人员听错，无法正确理解其意思的情况。
搜索关键词：	预处理智能语音多设备局域网字幕鼠标语音识别技术语音信号处理存储介质共享数据会议演讲结合硬件模型训练实时录音实时显示数据共享数据通过用户意图语音采集语音内容语音文件语音字幕设备间移动端智能化互连存储采集自由发言展示会议管理
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于智能语音鼠标的字幕实现方法，其特征在于包括以下步骤：/n步骤S1：在智能语音鼠标端通过指定键开启录音和结束录音，实现语音采集；/n步骤S2：将采集的语音文件进行预处理，完成语音识别和结果的自动修正，同步完成语音翻译和语音合成，并且将预处理后的文件进行存储及管理；/n步骤S3：将步骤S2中得到的数据通过模型训练得出用户意图；/n步骤S4：多个移动端自由共享数据到局域网内；/n步骤S5：局域网内多设备的实时互连，实时接收多设备的数据，并通过字幕展示用户的语音内容。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽咪鼠科技有限公司，未经安徽咪鼠科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910923592.7/，转载请声明来源钻瓜专利网。

上一篇：一种智能互动玩具
下一篇：一种引入语言向量的语音识别增强方法和装置

同类专利

一种文本转语音显示字幕信息的方法-201911042371.5
发明人：陈阳;鲁永春;王周 -专利权人：合肥名阳信息技术有限公司
申请日： 2019-10-30 - 公布日： 2020-02-14 - 主分类号： G10L13/04
摘要：本发明公开了一种文本转语音显示字幕信息的方法，属于字幕显示控制技术领域，包括以下步骤：S1：使用设置在手机端的文本编辑器编辑文本，设置文本中每个单句的停顿标记、延时标记和循环标记，停顿标记和延时标记设置时长，循环标记设置循环位置；S2：文字转语音系统将文字合成语音文件；S3：播放语音文件同时在显示屏幕上显示字幕；使用文字转语音系统播放语音文件，使手机屏幕同步显示字幕，并且可以设置字幕的字体大小、颜色以及字体背景颜色，已达到突出显示的作用。

基于智能语音鼠标的字幕实现方法、装置、系统和存储介质-201910923592.7
发明人：冯海洪;毛德平;许成亮;朱国冉 -专利权人：安徽咪鼠科技有限公司
申请日： 2019-09-27 - 公布日： 2020-01-03 - 主分类号： G10L13/04
摘要：本发明涉及语音信号处理领域，尤其涉及一种基于智能语音鼠标的字幕实现方法、装置、系统和存储介质，该方法包括：在智能语音鼠标端实现语音采集，然后，将采集的语音文件进行预处理，并且将预处理后的文件进行存储及管理，接下来，将得到的数据通过模型训练得出用户意图，通过多个移动端自由共享数据到局域网内，局域网内多设备实时互连，接收多设备的数据，最后，通过字幕展示用户的语音内容，本发明利用语音识别技术，结合硬件设备，实现在不同设备间完成数据共享，实时录音及语音字幕实时显示，使人们的会议进行的更加的智能化与便捷化，避免因为会议演讲人的发言不清楚，导致参会人员听错，无法正确理解其意思的情况。

语音的生成方法和装置-201910849467.6
发明人：鲁雪冬;宣善明 -专利权人：大唐网络有限公司
申请日： 2019-09-09 - 公布日： 2019-12-20 - 主分类号： G10L13/04
摘要：本发明公开了一种语音的生成方法和装置。其中，该方法包括：提取目标对象的特征信息；根据特征信息生成目标对象对应的变量语音信息；将变量语音信息与预设的模板语音信息进行合并，得到目标对象对应的语音信息，其中，外呼系统通过目标对象对应的语音信息完成目标对象对应的任务。本发明解决了现有技术中外呼话术模版单一导致难以针对用户特征进行自动对话的技术问题。

机器人的语音输出方法、装置、机器人和存储介质-201910999706.6
发明人：支涛;王洪贺 -专利权人：北京云迹科技有限公司
申请日： 2019-10-18 - 公布日： 2019-12-20 - 主分类号： G10L13/04
摘要：本申请实施例提供一种机器人的语音输出方法、装置、机器人和存储介质，该方法包括：获取待转换文本；根据所述待转换文本的内容，判断存储空间内是否存在与所述待转换文本对应的目标临时文件，所述存储空间中包括至少一个临时文件，每个临时文件为根据播放过的一条文本的合成音频数据流生成的临时文件；在所述存储空间内存在所述目标临时文件时，读取并播放所述目标临时文件，以对所述待转换文本进行语音播放。以此可以改善现有技术中的机器人语音播放效果差的问题。

用于生成语音合成模型的方法和装置-201810478000.0
发明人：康永国;顾宇 -专利权人：百度在线网络技术(北京)有限公司
申请日： 2018-05-18 - 公布日： 2019-12-10 - 主分类号： G10L13/04
摘要：本申请实施例公开了用于生成语音合成模型的方法和装置。该方法的一具体实施方式包括：获取训练样本集合，训练样本包括样本文本信息、与样本文本信息对应的样本音频数据和样本音频数据的基频；获取初始深度神经网络；利用机器学习方法，将训练样本集合中的训练样本的样本文本信息作为输入，将与输入的样本文本信息对应的样本音频数据和样本音频数据的基频作为输出，对初始深度神经网络进行训练，将训练后初始深度神经网络确定为语音合成模型。该实施方式实现了生成语音合成模型。由此生成的语音合成模型可以基于文本信息得到对应的音频数据，而不需要输入基频。

数据处理方法和装置-201810720403.1
发明人：于丽娜 -专利权人：百度在线网络技术(北京)有限公司
申请日： 2018-07-03 - 公布日： 2019-12-03 - 主分类号： G10L13/04
摘要：本申请实施例提供一种数据处理方法和装置，该方法包括：接收用户输入的播放请求，所述播放请求中包括待播放内容的信息和播放请求的类型；采用与播放请求的类型对应的语音合成模型，将待播放内容进行语音转换，得到语音；语音合成模型是对收集到的儿童的家庭成员的声音数据进行分析训练所建立的音频模型；对语音进行播放。本申请通过获取不同播放请求类型对应的家庭成员的语音合成模型，又因为不同的播放请求对应不同的场景，因此可以将待播放的内容转化成家庭成员的且符合当时场景的声音，可以应用于亲子互动，亲子阅读。

语音服务器-201580001695.8
发明人：井出永;赤羽俊夫;河原正和;冈崎昭广 -专利权人：夏普株式会社
申请日： 2015-02-18 - 公布日： 2019-11-15 - 主分类号： G10L13/04
摘要：语音创建部(21a)基于存储部(22)的DB(22a)和讲话特性表(22d)，创建供家电讲话的语音数据。讲话特性表(22d)是基于家电的用户的用户属性表(22b)和家电的设备属性表(22c)中的至少一者而设定的。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于智能语音鼠标的字幕实现方法、装置、系统和存储介质在审

专利文献下载