专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果12个,建议您升级VIP下载更多相关专利
  • [发明专利]一种助听设备及助听方法-CN202010434720.4有效
  • 杜慷;冯大航;陈孝良 - 北京声智科技有限公司
  • 2020-05-21 - 2023-10-13 - G10L15/26
  • 本申请公开了一种助听设备及助听方法,助听设备中的语音采集模块采集当前环境的语音信号,语音信号包括用户语音信号;降噪模块对采集的语音信号进行降噪,得到降噪后的语音信号,降噪后的语音信号包括用户语音信号;语音识别模块采用预设语音识别算法,对降噪后的语音信号进行语音识别,得到降噪后的语音信号中用户语音信号对应的文本信息;语音合成模块采用预设语音合成算法,将文本信息转换成目标语音;最后语音输出模块输出目标语音。该助听设备可以输出清晰的语音,解除了高噪声环境下的听障困扰,提高了用户体验。
  • 一种设备方法
  • [发明专利]一种多语种的语音合成方法及装置-CN202010454894.7有效
  • 杜慷;陈孝良;冯大航 - 北京声智科技有限公司
  • 2020-05-26 - 2023-09-12 - G10L13/08
  • 本申请公开了一种多语种的语音合成方法及装置。该方法采用预设分析算法,对获取的已知语种类别的待合成文本的音素序列进行分析,获取待合成文本的语义特征;根据语音合成需求,从存储的语料信息库中,获取目标语种类别和目标音色特征;采用预设语音合成算法,对目标语种类别、目标音色特征和待合成文本的语义特征进行合成,得到具有目标语种类别和目标音色特征的合成语音。该方法可以实现合成特定音色和特定语言的合成语音,即实现多语种的语音合成,提高了语音合成设备的合成目标的清晰度。
  • 一种语种语音合成方法装置
  • [发明专利]一种语音合成方法、装置、设备及存储介质-CN202010478333.0有效
  • 杜慷;冯大航;陈孝良 - 北京声智科技有限公司
  • 2020-05-29 - 2023-07-18 - G10L13/047
  • 本发明实施例提供一种语音合成方法、装置、设备及存储介质,用以提高语音合成的通用性,满足没有专业的录音设备和录音环境的普通用户的使用需求。所述语音合成方法,包括:接收语音播报指令,语音播报指令中包含语音播报文本和播报语音所使用音色对应的目标对象;获取预先采集的目标对象的预设数量条语音数据,利用预先训练的声纹识别模型提取目标对象的声纹特征信息,预先训练的声纹识别模型是基于预先采集的多个对象的语音数据训练生成的,预设数量小于预设数量阈值;利用预先训练的语音合成模型,基于语音播报文本、预先训练的声纹识别模型和所述目标对象的声纹特征信息,合成音色为目标对象音色的待播放语音;播放合成的待播放语音。
  • 一种语音合成方法装置设备存储介质
  • [发明专利]语音合成方法、装置及电子设备-CN201910879666.1有效
  • 杜慷;冯大航;陈孝良;常乐 - 北京声智科技有限公司
  • 2019-09-18 - 2022-04-22 - G10L13/04
  • 本公开实施例中提供了一种语音合成方法、装置及电子设备,属于数据处理技术领域,该方法包括:获取目标对象针对第一合成语音的反馈数据;利用情绪识别模型对所述反馈数据进行情绪识别,以判断所述目标对象是否存在针对所述第一合成语音的异常情绪;当所述目标对象存在针对所述第一合成语音的异常情绪时,利用纠错模块对所述第一合成语音进行纠错处理,以得到第二合成语音;向所述目标对象播放所述第二合成语音。本公开的方案能够提高语音合成的准确性。
  • 语音合成方法装置电子设备
  • [发明专利]一种端到端语音合成纠错方法、系统及装置-CN201910884128.1在审
  • 杜慷;冯大航;陈孝良;常乐 - 北京声智科技有限公司
  • 2019-09-18 - 2021-03-19 - G10L13/08
  • 本发明公开了一种端到端语音合成纠错方法、系统及装置,方法包括:获取目标语句,其中,目标语句为端到端语音合成系统对合成语音进行语音识别输出的目标文本;判断目标文本的流畅度是否满足预设条件,若是,则:对目标文本进行嵌入向量化后预测出错误字或词;基于错误字或词确定用于替换错误字或词的备选字或词;获取备选字或词的音频,去除目标文本对应的合成语音中错误字或词的音频,并在相应位置插入所述备选字或词的音频。本发明能够准确的定位到错误字或词,有效的解决了端到端语音合成的错字多字问题,进而使得语音交互过程更加准确流畅。
  • 一种端到端语音合成纠错方法系统装置
  • [发明专利]语音转换方法、装置、设备及存储介质-CN202011312054.3有效
  • 陈孝良;冯大航;杜慷;孔德威 - 北京声智科技有限公司
  • 2020-11-20 - 2021-02-23 - G10L13/02
  • 本申请提供了一种语音转换方法、装置、设备及存储介质,属于互联网技术领域。所述方法包括:获取语音转换模型,所述语音转换模型用于根据具有任一音色且属于原始语种的参考语音,将属于所述原始语种的文本转换成具有所述任一音色且属于目标语种的语音,所述原始语种与所述目标语种不同;获取属于所述原始语种的目标文本和参考语音;调用所述语音转换模型,根据所述参考语音,将所述目标文本转换成目标语音,所述目标语音与所述目标文本的语义相同,与所述参考语音的音色相同,且属于所述目标语种。上述方法能够自由控制由文本转换出的语音的音色,智能化程度高。
  • 语音转换方法装置设备存储介质
  • [发明专利]语音转换方法、装置、电子设备及存储介质-CN202010685478.8有效
  • 杜慷;陈孝良;冯大航 - 北京声智科技有限公司
  • 2020-07-16 - 2020-11-24 - G10L13/02
  • 本申请提供了一种语音转换方法、装置、电子设备及存储介质,属于人工智能领域。所述方法包括:获取多个样本信息,每个样本信息包括样本文本信息、样本语音信息和样本用户标识,所述样本用户标识用于指示按照所述样本文本信息发出所述样本语音信息的用户,且所述多个样本信息中包括的样本用户标识不完全相同;根据所述多个样本信息,对语音转换模型进行训练;获取目标文本信息和目标用户标识;调用所述语音转换模型,根据所述目标用户标识对所述目标文本信息进行转换,得到与目标用户的音色匹配的目标语音信息。上述方法可以实现语音转换模型的多音色功能,智能化程度高。
  • 语音转换方法装置电子设备存储介质
  • [发明专利]一种语音合成模型的训练方法及装置-CN202010339689.6在审
  • 杜慷;冯大航;陈孝良;常乐 - 北京声智科技有限公司
  • 2020-04-26 - 2020-08-07 - G10L13/02
  • 本发明提供一种语音合成模型的训练方法及装置,该方法包括:获取第一数据集,其中,所述第一数据集包括M条单人语音数据,M小于或等于第一预设数量;使用所述第一数据集训练第一语音合成模型的结构参数,得到目标语音合成模型,使得所述目标语音合成模型合成所述第一数据集对应用户的音色的语音数据;其中,所述第一语音合成模型是使用第二数据集对初始语音合成模型进行训练得到的,所述第二数据集包括N条单人语音数据,N大于或等于第二预设数量,所述第二预设数量大于所述第一预设数量。本发明实施例能够不仅能够减少获取训练数据时的时间和人力成本,还能有效缩短模型的训练时间,使得语音合成模型的训练成本得以降低。
  • 一种语音合成模型训练方法装置
  • [发明专利]一种文语转换方法及装置-CN202010337691.X在审
  • 杜慷;陈孝良;冯大航 - 北京声智科技有限公司
  • 2020-04-26 - 2020-08-07 - G10L13/02
  • 本申请公开了一种文语转换方法及装置。该方法通过采集当前用户的至少一段语音,并接收待转换文本;采用声纹特征识别算法,对当前用户的至少一段语音进行声纹特征识别,得到当前用户的声纹特征,以及采用预设分析算法,对待转换文本的文本信息进行分析,得到待转换文本对应的文本序列信息;基于声纹特征和文本序列信息得到合成语音。该方法可以将当前说话人的声纹特征去合成待转换文本的语音,实现了语音合成的通用性,提高了用户体验。
  • 一种转换方法装置
  • [发明专利]文本到语音的转换处理方法、装置及电子设备-CN202010106336.1在审
  • 杜慷;陈孝良;冯大航 - 北京声智科技有限公司
  • 2020-02-21 - 2020-06-19 - G10L13/08
  • 本公开实施例提供了一种文本到语音的转换处理方法、装置及电子设备,属于计算机应用技术领域。其中方法包括:获取待转换的目标文本;将目标文本输入端对端从文本到语音系统,获得初始合成音频;利用预设的纠错模型,查找初始合成音频中的错误字段;对初始合成音频中的错误字段进行修复,得到可用合成音频;将可用合成音频作为目标文本转换得到的音频输出。通过本公开的方案,在音频合成模型后新增一个纠错过程,对合成音频进行评估、定位和纠错,将错误句子中的错误字替换为新的备选字,并在语音数据库中找到替换字的波形信息与原句拼接,从而得到新的、完整的无错漏字的语音合成语句,有效提高了文本到语音的转换处理效率和准确度。
  • 文本语音转换处理方法装置电子设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top