专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果1643253个,建议您升级VIP下载更多相关专利
  • [发明专利]一种音色克隆方法、系统、装置及计算机可读存储介质-CN202110408975.8有效
  • 黄一鸣;李一夫;陈哲乾 - 杭州一知智能科技有限公司
  • 2021-04-16 - 2021-08-20 - G10L19/16
  • 本发明公开了一种音色克隆方法、系统、装置及计算机可读存储介质,方法包括以下步骤:制作多说话人数据集并处理;训练对齐模型;制作目标说话人数据集并处理;训练多说话人语音合成模型;训练多说话人声码器模型;获取具有目标说话人音色的目标人语音合成模型;将待合成文本输入至目标人语音合成模型完成语音合成。本发明的有益效果是:目标说话人的风格和音色能够被更好的学习;可以通过指定韵律标签的方式来指定韵律节奏;使用时长预测模型来进行发音序列与频谱序列的对齐,加快语音生成的推理速度;在解码阶段添加音高和能量的预测和编码,目标人语音合成模型添加了音高和能量的预测与编码,有效的提高语音合成的效果。
  • 一种音色克隆方法系统装置计算机可读存储介质
  • [发明专利]模型训练、语音识别方法及装置、电子设备及存储介质-CN202110235852.9有效
  • 徐高鹏;李成飞;杨嵩 - 北京世纪好未来教育科技有限公司
  • 2021-03-03 - 2021-05-07 - G10L15/06
  • 本申请实施例提供了一种模型训练、语音识别方法及装置、电子设备及存储介质,涉及语音识别技术领域,模型训练方法包括:获取第一对象和第二对象分别对应的多个样本语音数据,以及样本语音数据对应的文本信息和身份信息;对样本语音数据进行编码处理,得到声学特征信息;对声学特征信息进行特征提取和预测处理,得到对应的身份特征信息和预测身份信息;对声学特征信息和身份特征信息进行解码处理,得到第一预测文本信息;基于预测身份信息和身份信息确定身份损失值;以及基于第一预测文本信息和文本信息确定文本损失值;根据身份损失值和文本损失值确定目标损失值,并基于目标损失值对语音识别模型进行训练。本申请可以提高语音识别的准确性。
  • 模型训练语音识别方法装置电子设备存储介质
  • [发明专利]语音引导操作方法、装置、电子设备及存储介质-CN202011600793.2有效
  • 熊文龙;邓志伟 - 智道网联科技(北京)有限公司
  • 2020-12-30 - 2021-03-16 - G06F3/16
  • 本发明提供一种语音引导操作方法、装置、电子设备及存储介质,其中方法包括:接收对车载智能终端上的应用程序的语音操作指令;其中,语音操作指令被预先配置为与应用程序的界面上的可执行操作功能具有对应关系,可执行操作功能包括应用程序的当前界面可通过触摸方式执行的随机操作;根据语音操作指令在应用程序中确定可执行操作功能和可通过触摸方式执行的随机操作;根据可执行操作功能和可通过触摸方式执行的随机操作,在应用程序中执行语音操作指令对应的操作指令。本发明应用于现有的智能终端时,无需事先单独为每个应用集成语音操作的工具包,只需在移动终端启动本发明的运行,即可实现在智能终端的后台跨不同应用程序的语音引导操作。
  • 语音引导操作方法装置电子设备存储介质
  • [发明专利]基于双向上下文的非自回归语音识别网络、方法及设备-CN202111066812.2有效
  • 不公告发明人 - 珠海亿智电子科技有限公司
  • 2021-09-13 - 2021-11-16 - G10L15/08
  • 本发明适用于人类语言处理技术领域,提供了一种基于双向上下文的非自回归语音识别网络、方法、设备及存储介质,本发明提供的语音识别网络采用Transformer的编码器‑解码器结构,语音识别网络的编码器用于对输入的语音特征进行初步识别,得到初步识别结果,语音识别网络的解码器用于利用由初步识别结果提供的双向语言信息对初步识别结果进行调整,并输出最终的语音识别结果,其中,解码器通过预设的、应用于解码器的每个多头自注意力层的注意力掩码利用双向语言信息,从而充分了利用了语言信息,提高了语音识别效果,且相较于使用两个单向解码器分别利用单向语言信息的方法,结构更加高效统一。
  • 基于双向上下文回归语音识别网络方法设备
  • [发明专利]基于云边端协同的物体识别系统-CN202110727918.6有效
  • 许振阳;王岩;田会峰;刘禄辰;周宇;赵玉寒;刘泽林 - 张家港江苏科技大学产业技术研究院
  • 2021-06-29 - 2022-02-25 - G06V20/10
  • 本发明公开了基于云边端协同的物体识别系统,属于物体识别技术领域,包括语音交互模块、图片存储模块、实时监控模块和图像识别智能语音手杖,所述语音交互模块、图片存储模块及实时监控模块的输出端与云服务器计算处理模块的输入端相连接,所述云服务器计算处理模块、语音测距报警模块、物体检测与识别模块、GPS位置信息采集模块及摔倒邮件呼救模块的输出端与图像识别智能语音手杖的输入端电性连接;本发明充分利用云服务器开发了各种新功能,包括实时远程监控、一键拍照存云以及智能语音交互,此外,在对各功能模块进行选择调用后,还分别实现了测距语音警报、跌倒自动求救以及GPS实时定位,功能强大。
  • 基于云边端协同物体识别系统
  • [发明专利]语音屏幕鼠标校核下的图标安全操作方法-CN201810713169.X有效
  • 王立松 - 南京铁道职业技术学院
  • 2018-06-29 - 2022-04-01 - G06F3/04817
  • 语音屏幕鼠标校核下的图标安全操作方法,通过操作者发出语音所关联的图标、屏幕上显示用来指定操作的图标和鼠标停止移动时所指向的图标进行校核比对,由系统给出操作的权限和警告,其基本特征是首先建立特定语音与图标的关联,通过语音识别系统的语音输入激活相关联图标,再与鼠标停止移动时所指向的图标进行校核比对。针对触摸屏计算机和移动终端而言,通过操作者发出语音所关联的图标、屏幕上显示用来指定操作的图标进行二元校核,由系统给出操作的权限。此外,还能针对已有系统提供影子系统进行防护。本发明利用现代语音识别工具,将人的行为通过电脑系统进行校核,最大限度确保操作正确,避免事故发生。
  • 语音屏幕鼠标校核图标安全操作方法
  • [发明专利]基于谱特征和ELM的语音情感识别方法-CN201911189489.0有效
  • 张健沛;史芝欣;杨静;王勇 - 哈尔滨工程大学
  • 2019-11-28 - 2022-04-12 - G10L25/63
  • 本发明提供的是一种基于谱特征和ELM的语音情感识别方法。原始语音信号进行基本特征提取包括韵律特征、音质特征;利用Teager能量算子TEO算法提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC,二者加权得到teCMFCC特征,并与基本特征值进行融合,构建特征矩阵;用Fisher准则和相关分析对特征进行选择降维,保留语音信号的个性特征;建立极限学习机ELM决策树模型,完成语音情感识别分类。本发明强调了语音信号的非线性特征,具有很好的鲁棒性,在中国科学院自动化研究所录制的CASIA中文情感语料库上进行实验,验证提出的基于谱特征和ELM的语音情感识别算法对中文语音信号具有很好的分类识别精度。
  • 基于特征elm语音情感识别方法
  • [发明专利]语音端点的确定方法及装置、存储介质、电子装置-CN201910995464.3有效
  • 陈烈 - 浙江大华技术股份有限公司
  • 2019-10-18 - 2022-04-19 - G10L15/04
  • 本发明实施例提供了一种语音端点的确定方法及装置、存储介质、电子装置,所述方法包括:对获取的音频信号进行预处理,得到多个子带,其中,音频信号包括N个音频信号帧,N为大于1的整数,子带是基于频带对音频信号帧进行划分得到的;根据子带的信噪比与谱熵之比,得到音频信号帧的信噪比与谱熵之比;根据音频信号帧的信噪比与谱熵之比,使用双门限检测算法判断音频信号帧是否为语音帧;若是,将音频信号的第一帧语音帧和最后一帧语音帧分别确定为音频信号的语音起始端点和语音终止端点解决了相关技术中语音端点检测只针对某单一特征进行检测导致准确率较低的问题。
  • 语音端点确定方法装置存储介质电子

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top