[发明专利]多媒体翻译的控制方法及显示器在审

申请号：	201910655068.6	申请日：	2019-07-19
公开（公告）号：	CN110335610A	公开（公告）日：	2019-10-15
发明（设计）人：	杨凯瑞	申请（专利权）人：	北京硬壳科技有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/00;G06F3/14
代理公司：	北京布瑞知识产权代理有限公司 11505	代理人：	秦卫中
地址：	100085 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种多媒体翻译的控制方法及显示器，所述多媒体翻译的控制方法包括：从显示器的接口接收音频流；将所述音频流翻译成翻译文本；以及通过所述显示器输出所述翻译文本的内容，能够实现随时随地对外部设备播放多媒体时所产生的任何声音进行翻译。
搜索关键词：	翻译显示器多媒体音频流外部设备文本接口接收播放输出
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种多媒体翻译的控制方法，其特征在于，包括：从显示器的接口接收音频流；将所述音频流翻译成翻译文本；以及通过所述显示器输出所述翻译文本的内容。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京硬壳科技有限公司，未经北京硬壳科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910655068.6/，转载请声明来源钻瓜专利网。

上一篇：一种基于语音识别的地空通话数据分析方法及系统
下一篇：一种基于质量维度的声纹识别算法评估方法

同类专利

基于智能语音的夜巡数据自动录入系统-201821739468.2
发明人：黄金奎;杨光源;李晓胜;王刚;庞萍;陆妍妍;韦佳;陆大河;龚丽丽;苏振权;黄桂镔;陈浩然 -专利权人：广西电网有限责任公司钦州供电局
申请日： 2018-10-25 - 公布日： 2019-11-08 - 主分类号： G10L15/26
摘要：本实用新型公开了基于智能语音的夜巡数据自动录入系统，属于语音识别领域，包括拾音器、放大器模块、A/D转换模块、语音识别模块、云端声纹库服务器、处理器模块、人机界面和存储模块。拾音器的输出端与放大器模块连接，放大器模块经A/D转换模块与语音识别模块连接，语音识别模块与云端声纹库服务器连接，语音识别模块的输出端与处理器模块连接，处理器模块分别与人机界面和存储模块连接。通过设置了拾音器自动获取夜巡人员自动报读的数据，然后把报读的数据进行语音处理，把报读的语音数据进行自动存储入系统，实现数据的自动语音采集，减少了人工的笔记记录，减少了在记录中出现的错误。

训练方法和装置、转换方法和装置-201910600139.2
发明人：周盼;范汝超;陈伟 -专利权人：北京搜狗科技发展有限公司;搜狗（杭州）智能科技有限公司
申请日： 2019-07-04 - 公布日： 2019-11-05 - 主分类号： G10L15/26
摘要：本发明实施例提供了一种训练方法和装置、转换方法和装置，其中的训练方法具体包括：训练第一模型获得第一训练参数、以及通过训练第二模型获得第二训练参数，并依据第一训练参数和/或第二训练参数，对第三模型进行训练，得到最终训练后的第三模型。由于第三模型中的第一编码器通过延迟控制双向长短期记忆神经网络LC‑BLSTM实现以及第二注意力模块采用局部注意力机制，将训练后的第三模型应用于序列的转换过程，因此，本发明实施例可以提高转换效率，并且可以通过第一编码器可以降低性能损失。

语音备忘信息处理方法及装置-201910647159.5
发明人：钱庄 -专利权人：北京小米移动软件有限公司
申请日： 2019-07-17 - 公布日： 2019-11-05 - 主分类号： G10L15/26
摘要：本公开是关于语音备忘信息处理方法及装置。该方法包括：获取语音备忘信息，语音备忘信息包括一段或多段音频信息；对语音备忘信息中的音频信息进行语音识别，以获取与语音备忘信息对应的语音备忘文本信息；根据语音备忘文本信息确定与语音备忘信息对应的标签。该技术方案可以自动生成与语音备忘信息对应的目标标签，使用户在查找语音备忘信息时，根据该目标标签较为方便的了解该语音备忘信息的内容，从而找到自己所需的语音备忘信息，改善了用户体验。从而改善了用户体验。

庭审笔录数据处理方法、装置、计算机设备和存储介质-201910666050.6
发明人：叶素兰;窦文伟;张紫恒;李弘;严月强;陆多 -专利权人：平安科技（深圳）有限公司
申请日： 2019-07-17 - 公布日： 2019-11-05 - 主分类号： G10L15/26
摘要：本申请涉及声纹识别的一种庭审笔录数据处理方法、装置、计算机设备和存储介质。该方法包括：创建虚拟庭审房间后，接收终端发送的参审请求，根据参审请求中的身份信息对参审人员进行身份验证；验证通过后，获取多个终端上传的音视频数据，提取音视频数据的语音特征信息；通过声纹识别模型对语音特征信息进行声纹识别，得到多个语音片段和对应的声纹标识；根据声纹标识将语音片段转换为对应的文本笔录信息，通过庭审语义分析模型对文本笔录信息进行语义分析，当存在歧义文本时，根据分析结果对歧义文本进行校正，根据校正后的文本笔录信息生成庭审笔录信息，并发送至多个终端并显示。采用本方法能够有效提高庭审音频数据的识别准确率。

用于启用网络的设备上的语音识别输入的方法和系统-201480012543.3
发明人： T·熊;C·迈考伊 -专利权人：索尼公司;索尼网络娱乐国际有限责任公司
申请日： 2014-03-07 - 公布日： 2019-11-05 - 主分类号： G10L15/26
摘要：实现用于使用语音输入来控制启用网络的设备的技术的设备和方法。在一种实现中，此特征允许用户使用语音输入而并非使用笨重的遥控器或单独的注册网站，来方便地注册和管理IPTV设备。因特网向IPTV递送数字内容持续增加，就像IPTV本身的流行度持续增加那样。至于许多数字设备，特别是网络上的那些，IPTV的设备注册会给用户带来许多好处。

一种语音信息转换、信息生成方法及装置-201610801720.7
发明人：吴育強 -专利权人：北京金山软件有限公司;北京金山数字娱乐科技有限公司
申请日： 2016-09-05 - 公布日： 2019-11-01 - 主分类号： G10L15/26
摘要：本申请实施例公开了一种语音信息转换、信息生成方法及装置，涉及计算机技术领域，应用于电子设备，其中，上述语音信息转换方法包括：接收目标语音信息；在满足信息转换条件的情况下，对所述目标语音信息进行语音识别获得文字转换信息，以使得客户端基于所述目标语音信息的展示位置展示所述文字转换信息。应用本申请实施例提供的方案，能够将语音转换为文字。

一种基于管制语音的冲突告警方法-201710098291.6
发明人：陈平;刘岩;严勇杰;鞠瑞林;徐善娥;王虎;肖雪飞;童明;李加庆;张阳 -专利权人：中国电子科技集团公司第二十八研究所
申请日： 2017-02-22 - 公布日： 2019-10-29 - 主分类号： G10L15/26
摘要：本发明公开了一种基于管制语音的冲突告警方法，包括：对管制员与飞行员的无线电语音信息进行采集，通过管制席位声卡转换为数字信号；通过语音识别功能把数字信号转换为文本信息，统一发送给系统服务器；系统服务器对文本信息进行管制指令的提取；基于管制指令判断航空器未来一段时间的运行轨迹；结合空管系统中各航空器当前位置信息、运动参数信息和未来运动轨迹，对可能发生的航空器之间的危险冲突进行判别，给出告警提示。本发明把管制员管制指令与空管系统相结合，把管制指令语音信息和自动化监视手段充分融合，为航空器之间可能发生的危险冲突提供一种有效告警手段。

一种信息处理方法及终端设备-201910640218.6
发明人：庄晓亮 -专利权人：维沃移动通信有限公司
申请日： 2019-07-16 - 公布日： 2019-10-25 - 主分类号： G10L15/26
摘要：本发明涉及通信技术领域，提供一种信息处理方法及终端设备，以解决现有技术中，终端设备展现语音信息对应文字信息的灵活性差的问题。该方法包括：接收用户对目标视频中的目标对象的第一输入；响应于所述第一输入，将所述目标对象的语音信息转换为文字信息；在所述目标视频的视频播放界面，显示所述文字信息。这样，终端设备能够根据用户的操作，在视频播放界面中显示指定对象的语音信息的文字信息，能够提高文字信息显示的灵活性。

对话控制装置、对话系统、对话控制方法以及存储介质-201910207297.1
发明人：市川英里奈;富田高弘 -专利权人：卡西欧计算机株式会社
申请日： 2019-03-19 - 公布日： 2019-10-22 - 主分类号： G10L15/26
摘要：本发明涉及对话控制装置、对话系统、对话控制方法以及存储介质。本发明高精度地掌握使用者的喜好，并进行与使用者的喜好相符合的对话。机器人(100A)包括：反应取得单元(110A)，取得多个反应判定结果，该多个反应判定结果中包含对规定对象针对机器人(100A)的发言的反应进行了判定的结果、以及对规定对象针对与机器人(100A)相独立地设置的机器人(100B)的发言的反应进行了判定的结果；以及发言控制单元(115A)，基于由反应取得单元(110A)取得的多个反应判定结果，对包含机器人(100A)以及机器人(100B)在内的多个发言装置中的至少任一个的发言进行控制。

一种语音识别结果的接受方法及装置-201510392080.4
发明人：刘赵杰 -专利权人：无锡天脉聚源传媒科技有限公司
申请日： 2015-07-06 - 公布日： 2019-10-22 - 主分类号： G10L15/26
摘要：本发明公开了一种语音识别结果的接受方法及装置。方法包括：获取接收到的语音信息的语音识别结果；应用已建立的语言模型获取语音识别结果中的每个词的第一词频，其中，语言模型中对应存储有语音识别结果中的每个词与每个词的第一词频；对语音识别结果进行分词，以统计语音识别结果中每个词的第二词频；将第一词频与第二词频进行比较，以根据比较结果确定是否接受语音识别结果，其中，每个词包括组合词和独词中的一种或多种。通过该技术方案，可以在减少人为参与，降低人工干预的基础上，能够快速定位到语音识别结果中的错误，进而提示用户对语音识别结果中的错误及时进行纠正，以提高语音识别的正确率和语音识别的效率。

一种基于语音识别的游戏教育方法及系统-201910636606.7
发明人：高磊 -专利权人：高磊
申请日： 2019-07-15 - 公布日： 2019-10-18 - 主分类号： G10L15/26
摘要：本发明实施例公开了一种基于语音识别的游戏教育方法，包括以下步骤S1、终端获取服务器内预设的至少一条教学信息；S2、终端获取语音信息，并将获取到的所述语音信息发送到服务器中；S3、服务器对所述语音信息进行语音识别并得到语音识别结果；S4、服务器将所述语音识别结果与服务器内预设的所述教学信息进行比对，并输出比对结果；S5、根据比对结果选择重复步骤S1或S2，通过语音识别来实现答案校对，使学习更加简单方便，同时根据语音识别与教学信息的准确性比对，实现校对发音的准确性，同时可实现多个教学信息同时展示，增加趣味性，使孩子更愿意学习。

一种根据音频输出的实时字幕生成方法-201610863894.6
发明人：卜佳俊;于智;陈静;王灿;王炜;陈纯 -专利权人：浙江大学
申请日： 2016-09-29 - 公布日： 2019-10-18 - 主分类号： G10L15/26
摘要：一种根据音频输出的实时字幕生成方法，步骤如下：对于电子设备需要进行输出的音频信息进行如下操作：采用音频采集模块实时监测电子设备输出的音频信息，并将其收集；将收集到的音频信息传入语音提取模块，将音频信息中的背景音乐等无关内容进行过滤并进行降噪处理，得到准确的语音信息；此后将得到的需要转换成文字的语音信息输入到语音识别模块，得到语音对应的文字信息；最后经显示模块将转换后得到的文字利用字幕的形式实时显示在设备屏幕上。本方法的优点在于：可以帮助听障人士获取视频，音频或其他形式中包含的语音内容，为听障人士获取语音信息提供了有效便捷的方式，同时也为普通用户提供了便利。

基于KTV麦克风的语音实时翻译装置-201821899420.8
发明人：梁琼燕 -专利权人：深圳市锐曼智能技术有限公司
申请日： 2018-11-19 - 公布日： 2019-10-18 - 主分类号： G10L15/26
摘要：本实用新型公开一种基于KTV麦克风的语音实时翻译装置，包括麦克风本体、PC终端以及line‑out数据线，麦克风本体包括麦克风壳体、咪头以及音频处理电路，PC终端设有语音转文本模组，音频处理电路的输入端与咪头相连，音频处理电路的输出端与line‑out数据线的输入端相连，line‑out数据线的输出端与语音转文本模组电连接。通过line‑out数据线将音频数据传递到PC终端，有效避免了信息记录遗漏的问题。在KTV麦克风中加入语音翻译的设计，解决多种场景下实时手动记录文字信息时存在的信息遗漏或记录速度跟不上讲话速度等问题。同时解放了双手，在进行文字创造活动时不需要手动编辑文字，提高了效率。

声纹验证方法、装置、设备及存储介质-201910522762.0
发明人：吴冀平;彭俊清;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2019-06-17 - 公布日： 2019-10-15 - 主分类号： G10L15/26
摘要：本申请涉及生物识别领域，具体使用了预先训练好的音素模型实现语音处理，并公开了一种声纹验证方法、装置、设备及存储介质，所述方法包括：将语音信息进行文本转化，以得到对应的文本信息；根据预设的音素模型，获取所述文本信息对应的音素集合，所述音素集合包括所述文本信息中每个字所对应的声母和韵母；根据声母表和所述音素集合中的各声母，计算所述音素集合的声母覆盖率；根据韵母表和所述音素集合中的各韵母，计算所述音素集合的韵母覆盖率；根据所述声母覆盖率和所述韵母覆盖率，对所述语音信息进行声纹验证，以生成验证结果。进而找出用户语音特征完整度高的语音信息，为声纹身份验证提供了重要的参考。

一种基于语音识别的地空通话数据分析方法及系统-201910563775.2
发明人：武喜萍;杨波 -专利权人：四川大学;四川川大智胜软件股份有限公司
申请日： 2019-06-26 - 公布日： 2019-10-15 - 主分类号： G10L15/26
摘要：本发明公开一种基于语音识别的地空通话数据分析方法及系统，包括：空管记录仪持续采集并储存地空通话话音数据与雷达数据；通过自适应解码转为wav格式文件；通过基于深度学习的端点检测技术，截取完整语句构成语音文件；通过基于深度学习的空管语音识别模型，将语音文件转换成文本信息；通过基于深度学习的空管语义理解模型，确定管制指令意图与参数；基于生成的各个文件进行语音及指令数据统计分析、监视数据与话音同步回放、重点监听等地空通话数据分析。本发明提出的方法全面提升了地空通话数据分析工作的效率和准确性，解决空管安全管理实践中，完全依靠人工收听、记录、查询、统计分析陆空通话进行管制指挥质量评估和事后分析的问题。

多媒体翻译的控制方法及显示器-201910655068.6
发明人：杨凯瑞 -专利权人：北京硬壳科技有限公司
申请日： 2019-07-19 - 公布日： 2019-10-15 - 主分类号： G10L15/26
摘要：本发明提供了一种多媒体翻译的控制方法及显示器，所述多媒体翻译的控制方法包括：从显示器的接口接收音频流；将所述音频流翻译成翻译文本；以及通过所述显示器输出所述翻译文本的内容，能够实现随时随地对外部设备播放多媒体时所产生的任何声音进行翻译。

生成谐音文本的方法和系统-201510547414.0
发明人：孔醍 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2015-08-31 - 公布日： 2019-10-15 - 主分类号： G10L15/26
摘要：本发明提出一种生成谐音文本的方法和系统，该方法包括：获取原始文本的输入信息，所述原始文本是第一语言的文本，所述原始文本的输入信息包括：原始文本的语音信息，和/或，原始文本的文本信息；获取与所述输入信息对应的谐音文本，所述谐音文本是第二语言的文本，所述谐音文本是根据语言模型和语音识别技术获取的；展示所述谐音文本。该方法能够利用语音识别技术自动生成谐音文本，避免人工生成谐音文本方式存在的问题。

车载终端设备以及唤醒其多个语音交互程序的方法-201810265573.5
发明人：刘根华 -专利权人：上海博泰悦臻网络技术服务有限公司
申请日： 2018-03-28 - 公布日： 2019-10-11 - 主分类号： G10L15/26
摘要：本发明提供了一种车载终端设备，包括：第一存储器，存储多个语音交互程序；声音采集设备，适于采集所述车载终端设备周围的声音；唤醒模块，配置为执行如下步骤：从所述声音采集设备获得所采集的声音；识别所述声音中的唤醒词；将所识别的唤醒词与预设的多个唤醒词进行匹配；响应于所识别的唤醒词与所述预设的多个唤醒词之一匹配成功，启动匹配成功的唤醒词所对应的语音交互程序。本发明集成了多个语音交互程序，通过声音采集设备和唤醒模块，使用户能够与不同的语音交互程序进行交互，克服了单个语音交互程序的局限性，并且能够根据用户喜好和当前条件选择不同的语音交互程序，提升了用户体验。

语音翻译装置、语音翻译方法及其存储介质-201910231944.2
发明人：古川博基;西川刚树;坂口敦;林田亘平 -专利权人：松下电器产业株式会社
申请日： 2019-03-26 - 公布日： 2019-10-11 - 主分类号： G10L15/26
摘要：语音翻译装置具有：音源方向推定部，根据由麦克风阵列部取得的音响信号，推定音源方向；以及控制部，使用由存储于存储部的预先选择的一布局信息示出的位置关系，在由翻译开始按键指示了翻译开始后基于推定出的音源方向，确定发言者是使用者及对话对手的中的一者，且决定示出识别音响信号的内容的一个语言和翻译音响信号的内容的另一个语言的翻译方向，按照决定的翻译方向，取得以一个语言对音响信号进行识别所得的文本文，及以另一个语言对该文本文进行翻译所得的翻译文本文，控制部，在与一者的位置对应的显示器的区域显示文本文，在与另一者的位置对应的显示器的区域显示翻译文本文。

一种生成混合语音数据的方法及系统-201910394160.1
发明人：康元勋;方泽煌;冯万健 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2019-05-13 - 公布日： 2019-10-11 - 主分类号： G10L15/26
摘要：本发明公开了一种生成混合语音数据的方法及系统，属于语音识别技术领域。本发明的一种生成混合语音数据的方法，先采集纯净语音和噪声，再将采集的语音数据进行归一化处理，而后对处理后的数据进行随机化处理，再对数据进行GAIN处理，最后经过滤波器处理得到混合语音数据。本发明的一种生成混合语音数据的系统，包括采集单元、计算单元和存储单元，所述采集单元与计算单元电连接，计算单元通过数据传输单元与存储单元连接。本发明的目的在于克服现有技术中，深度学习所需的音频数据匮乏的不足，提供了一种生成混合语音数据的方法及系统，可以自动生成混合语音数据，可以满足深度学习的数据需求。

一种字符转换规则的生成方法及装置-201610895083.4
发明人：王翘楚 -专利权人：北京云知声信息技术有限公司
申请日： 2016-10-13 - 公布日： 2019-10-11 - 主分类号： G10L15/26
摘要：本发明公开了一种字符转换规则的生成方法及装置，用于解决语音识别系统无法将语音播报的病历数据准确识别为病历专用字符的问题。所述方法包括：将原始文本转换为语音数据后通过语音识别转换为转换文本；将转换文本与原始文本进行逐字比对，识别出差异字符串；在转换文本中差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串；从原始文本中获取与转换字符串在转换文本中的位置对应位置处的原始字符串；建立原始字符串与转换字符串的对应关系得到一条字符转换规则。该方法能够根据现有病历资料，生成特殊字符串的转换规则供语音识别系统使用。

语音修正方法及装置-201610696696.5
发明人：黄丽丰 -专利权人：北京云知声信息技术有限公司
申请日： 2016-08-19 - 公布日： 2019-10-11 - 主分类号： G10L15/26
摘要：本发明是关于一种语音修正方法及装置，其中，方法包括：获取用户输入的语音信息；对所述语音信息进行识别，以得到所述语音信息对应的文本内容；当所述文本内容中包含第一预设关键词时，根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本，其中，所述编辑文本用于对所述原始文本进行修改；根据所述编辑文本从所述原始文本中提取出待修改文本；根据所述编辑文本和所述待修改文本修改所述原始文本，以得到修改后的文本。通过该技术方案，可以根据编辑文本对原始文本进行修改。用户只要语音输入修改内容就可以实现对文本内容的修改，方便用户的操作，提升了用户的使用体验。

语音处理方法、系统、客户端、设备和存储介质-201810230885.2
发明人：邵松松;薛彬;都家宇;李威;罗杰 -专利权人：阿里巴巴集团控股有限公司
申请日： 2018-03-20 - 公布日： 2019-10-08 - 主分类号： G10L15/26
摘要：本申请实施例提供了一种语音处理方法、系统、客户端、设备和存储介质，其中的系统具体包括：麦克风阵列和移动设备；其中，所述麦克风阵列与所述移动设备之间耦合；所述移动设备包括：处理器；所述处理器，用于通过所述麦克风阵列接收声源的语音信号，依据所述声源相对于所述麦克风阵列的空间信息，分离所述语音信号对应的语音识别结果。本申请实施例可以便于语音识别结果的区分。

基于语音识别的智慧班牌交互方法-201910577869.5
发明人：陈天;蔡瑞琦;丁国柱 -专利权人：广州云蝶科技有限公司
申请日： 2019-06-28 - 公布日： 2019-10-08 - 主分类号： G10L15/26
摘要：本发明提供了一种基于语音识别的智慧班牌交互方法，包括：接收第一用户的语音信号；对语音信号进行预处理，得到第一数字信号；对第一数字信号进行特征提取，得到特征参数；对特征参数进行解码，得到最优词模型序列；最优词模型序列构成语音信号的文本信息；对连续语音信号的文本信息进行语义分析，得到文本指令和用户意图；根据文本指令，在显示界面显示文本指令对应的输出结果；根据用户意图，确定应答信息；将应答信息进行转换处理，生成连续语音并输出。由此，缩短了用户的操作路径，减轻了用户对智慧班牌的操作负荷，可以同时进行界面展示与语音应答，极大增强了用户体验。

智能控制系统的语音控制方法、装置和存储介质-201910597200.2
发明人：陈继华;陈志国;吕景旭 -专利权人：上海迥灵信息技术有限公司;深圳力维智联技术有限公司
申请日： 2019-07-02 - 公布日： 2019-10-08 - 主分类号： G10L15/26
摘要：本发明公开了一种智能控制系统的语音控制方法。该方法包括：获得用户的音频信息；根据所述音频信息，判断所述音频信息是否为已授权用户的音频信息；若是，则根据所述音频信息对对应的系统控制客户端进行控制。本发明还公开了一种智能控制系统的语音控制装置及计算机可读存储介质。本发明能够实现根据用户的语音信息识别出用户的人物身份，确保只有授权用户才能通过语音信息对系统控制客户端进行控制。

一种基于智能对话的关键内容提取算法-201910524215.6
发明人：王磊 -专利权人：浙江百应科技有限公司
申请日： 2019-06-18 - 公布日： 2019-10-01 - 主分类号： G10L15/26
摘要：本发明公开了一种基于智能对话的关键内容提取算法，具体涉及网络通信领域，包括机器人，所述机器人内部集成有ASR语音识别系统，所述机器人连接nlp服务器，具体步骤如下：S1、语音转化为文字发送到nlp服务器；S2、文本切词并用向量表示；S3、对每一个词跑双向gru，得到另一个向量表示；S4、每个词分配一个lable标签，通过softmax层将分数归一化，转化成概率；S5、利用Viterbi解码得到最优序列，改进维特比算法并采用滚动数组进行优化；S6、将标注好的序列，识别骚扰电话。本发明通过人工智能，从对话中提取关键的信息，让机器人来接听回答，将关键信息记录下来，同时可以避免丢失重要的电话，方便用户进行决策判断是否回拨。

无人机的操控方法及无人机系统-201610156245.2
发明人：黄立;苟淼琼;王效杰;顾兴;刘华斌 -专利权人：普宙飞行器科技（深圳）有限公司
申请日： 2016-03-18 - 公布日： 2019-10-01 - 主分类号： G10L15/26
摘要：本发明公开了一种无人机的操控方法及无人机系统，该无人机的操控方法包括步骤：采集操控者的声音信息，将声音信息转换为控制指令通过无线传输装置发送给无人机。无人机接收所述控制指令，根据控制指令控制无人机的载荷装置执行相应的动作。本发明实现了用户通过声音操控无人机的载荷装置，其操作简单，控制灵活，增加了无人机操控的趣味性和便利性。

一种基于多媒体语音图像识别的物业报事系统-201910541940.4
发明人：张福军;丁立;李祥兵;张力炯;罗豪;管鸿翔 -专利权人：绿漫科技有限公司
申请日： 2019-06-21 - 公布日： 2019-09-27 - 主分类号： G10L15/26
摘要：本发明公开了一种基于多媒体语音图像识别的物业报事系统，通过语音输入及图片输入的形式，对报事内容进行识别、存储。本发明可以实现用户无需输入文字，只需语音录入，图片传入，通过识别系统，自动填充内容，即可完成报事功能，大幅提高用户的报事效率和准确性，减少用户的操作步骤和用户输入过程，提升用户体验和满意度。

用于家用电器的语音控制装置和语音控制方法-201410676971.8
发明人：李信合;麻百忠;房振;雷俊;王强;黄开平;袁宏斌;杨乐;钟石刚;杨立萍 -专利权人：佛山市顺德区美的电热电器制造有限公司;美的集团股份有限公司
申请日： 2014-11-21 - 公布日： 2019-09-27 - 主分类号： G10L15/26
摘要：本发明公开了一种用于家用电器的语音控制装置，包括：喇叭和语音驱动器；语音存储器，语音存储器用于存储语音数据，其中，语音数据为喇叭播放语音时对应的脉冲宽度调制PWM控制信号；控制器，控制器与语音驱动器和语音存储器相连，控制器用于根据用户指令确定待播放语音数据对应的地址信息和语音帧数信息，并根据地址信息和语音帧数信息从语音存储器中获取对应的待播放语音数据并通过语音驱动器和喇叭播放。由此，本发明的语音控制装置在语音的内容或语音量变化时不需要设计新的电路，只需升级语音存储器，减少了开发周期及验证方案的难度，实现了快速可靠开发的目的，并且可移植性强。本发明还公开了一种用于家用电器的语音控制方法。

语音识别方法及装置-201510271782.7
发明人：孙廷玮;林福辉 -专利权人：展讯通信（上海）有限公司
申请日： 2015-05-25 - 公布日： 2019-09-27 - 主分类号： G10L15/26
摘要：一种语音识别方法及装置，所述语音识别方法包括：将获取的声音数据进行分帧处理，以得到至少两个声音帧；从所述至少两个声音数据帧中选取满足选取条件的声音帧；计算所述满足选取条件的声音帧的语音识别分值；当计算得到的语音识别分值大于预设的分值阈值时，对所述获取的声音数据进行语音识别。上述的方案可以节约计算资源，提升语音识别的速度。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]多媒体翻译的控制方法及显示器在审

专利文献下载