“杜慷”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网_中国专利网

首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

专利名称

专利名称
专利号码
专利分类
申请人
公布日期

农业化学；冶金建筑机械工程区域搜索

主分类

B 作业；运输

C 化学；冶金

D 纺织；造纸

E 固定建筑物

F 机械工程、照明、加热

专利下载VIP

公布日期

2023-10-24 公布专利

2023-10-20 公布专利

2023-10-17 公布专利

2023-10-13 公布专利

2023-10-10 公布专利

2023-10-03 公布专利

2023-09-29 公布专利

2023-09-26 公布专利

2023-09-22 公布专利

2023-09-19 公布专利

专利权人

国家电网公司

华为技术有限公司

中兴通讯股份有限公司

三星电子株式会社

中国石油化工股份有限公司

鸿海精密工业股份有限公司

松下电器产业株式会社

上海交通大学

钻瓜专利网为您找到相关结果12个，建议您升级VIP下载更多相关专利

[发明专利]一种助听设备及助听方法-CN202010434720.4有效
发明人：杜慷;冯大航;陈孝良 -专利权人：北京声智科技有限公司
申请日： 2020-05-21 - 公布日： 2023-10-13 - 主分类号： G10L15/26 文献下载
摘要：本申请公开了一种助听设备及助听方法，助听设备中的语音采集模块采集当前环境的语音信号，语音信号包括用户语音信号；降噪模块对采集的语音信号进行降噪，得到降噪后的语音信号，降噪后的语音信号包括用户语音信号；语音识别模块采用预设语音识别算法，对降噪后的语音信号进行语音识别，得到降噪后的语音信号中用户语音信号对应的文本信息；语音合成模块采用预设语音合成算法，将文本信息转换成目标语音；最后语音输出模块输出目标语音。该助听设备可以输出清晰的语音，解除了高噪声环境下的听障困扰，提高了用户体验。
一种设备方法

[发明专利]一种多语种的语音合成方法及装置-CN202010454894.7有效
发明人：杜慷;陈孝良;冯大航 -专利权人：北京声智科技有限公司
申请日： 2020-05-26 - 公布日： 2023-09-12 - 主分类号： G10L13/08 文献下载
摘要：本申请公开了一种多语种的语音合成方法及装置。该方法采用预设分析算法，对获取的已知语种类别的待合成文本的音素序列进行分析，获取待合成文本的语义特征；根据语音合成需求，从存储的语料信息库中，获取目标语种类别和目标音色特征；采用预设语音合成算法，对目标语种类别、目标音色特征和待合成文本的语义特征进行合成，得到具有目标语种类别和目标音色特征的合成语音。该方法可以实现合成特定音色和特定语言的合成语音，即实现多语种的语音合成，提高了语音合成设备的合成目标的清晰度。
一种语种语音合成方法装置

[发明专利]一种语音合成方法、装置、设备及存储介质-CN202010478333.0有效
发明人：杜慷;冯大航;陈孝良 -专利权人：北京声智科技有限公司
申请日： 2020-05-29 - 公布日： 2023-07-18 - 主分类号： G10L13/047 文献下载
摘要：本发明实施例提供一种语音合成方法、装置、设备及存储介质，用以提高语音合成的通用性，满足没有专业的录音设备和录音环境的普通用户的使用需求。所述语音合成方法，包括：接收语音播报指令，语音播报指令中包含语音播报文本和播报语音所使用音色对应的目标对象；获取预先采集的目标对象的预设数量条语音数据，利用预先训练的声纹识别模型提取目标对象的声纹特征信息，预先训练的声纹识别模型是基于预先采集的多个对象的语音数据训练生成的，预设数量小于预设数量阈值；利用预先训练的语音合成模型，基于语音播报文本、预先训练的声纹识别模型和所述目标对象的声纹特征信息，合成音色为目标对象音色的待播放语音；播放合成的待播放语音。
一种语音合成方法装置设备存储介质

[发明专利]语音合成方法、装置及电子设备-CN201910879666.1有效
发明人：杜慷;冯大航;陈孝良;常乐 -专利权人：北京声智科技有限公司
申请日： 2019-09-18 - 公布日： 2022-04-22 - 主分类号： G10L13/04 文献下载
摘要：本公开实施例中提供了一种语音合成方法、装置及电子设备，属于数据处理技术领域，该方法包括：获取目标对象针对第一合成语音的反馈数据；利用情绪识别模型对所述反馈数据进行情绪识别，以判断所述目标对象是否存在针对所述第一合成语音的异常情绪；当所述目标对象存在针对所述第一合成语音的异常情绪时，利用纠错模块对所述第一合成语音进行纠错处理，以得到第二合成语音；向所述目标对象播放所述第二合成语音。本公开的方案能够提高语音合成的准确性。
语音合成方法装置电子设备

[发明专利]一种端到端语音合成纠错方法、系统及装置-CN201910884128.1在审
发明人：杜慷;冯大航;陈孝良;常乐 -专利权人：北京声智科技有限公司
申请日： 2019-09-18 - 公布日： 2021-03-19 - 主分类号： G10L13/08 文献下载
摘要：本发明公开了一种端到端语音合成纠错方法、系统及装置，方法包括：获取目标语句，其中，目标语句为端到端语音合成系统对合成语音进行语音识别输出的目标文本；判断目标文本的流畅度是否满足预设条件，若是，则：对目标文本进行嵌入向量化后预测出错误字或词；基于错误字或词确定用于替换错误字或词的备选字或词；获取备选字或词的音频，去除目标文本对应的合成语音中错误字或词的音频，并在相应位置插入所述备选字或词的音频。本发明能够准确的定位到错误字或词，有效的解决了端到端语音合成的错字多字问题，进而使得语音交互过程更加准确流畅。
一种端到端语音合成纠错方法系统装置

[发明专利]语音转换方法、装置、设备及存储介质-CN202011312054.3有效
发明人：陈孝良;冯大航;杜慷;孔德威 -专利权人：北京声智科技有限公司
申请日： 2020-11-20 - 公布日： 2021-02-23 - 主分类号： G10L13/02 文献下载
摘要：本申请提供了一种语音转换方法、装置、设备及存储介质，属于互联网技术领域。所述方法包括：获取语音转换模型，所述语音转换模型用于根据具有任一音色且属于原始语种的参考语音，将属于所述原始语种的文本转换成具有所述任一音色且属于目标语种的语音，所述原始语种与所述目标语种不同；获取属于所述原始语种的目标文本和参考语音；调用所述语音转换模型，根据所述参考语音，将所述目标文本转换成目标语音，所述目标语音与所述目标文本的语义相同，与所述参考语音的音色相同，且属于所述目标语种。上述方法能够自由控制由文本转换出的语音的音色，智能化程度高。
语音转换方法装置设备存储介质

[外观设计]基准站接收机-CN202030323505.8有效
发明人：赵齐乐;李勇;杜慷 -专利权人：开普勒卫星科技（武汉）有限公司
申请日： 2020-06-22 - 公布日： 2021-01-19 - 主分类号： 14-03 文献下载
摘要：1.本外观设计产品的名称：基准站接收机。2.本外观设计产品的用途：本外观设计产品用于接收GNSS信号，进行卫星定位。3.本外观设计产品的设计要点：在于形状。4.最能表明设计要点的图片或照片：立体图1。
基准接收机

[发明专利]语音转换方法、装置、电子设备及存储介质-CN202010685478.8有效
发明人：杜慷;陈孝良;冯大航 -专利权人：北京声智科技有限公司
申请日： 2020-07-16 - 公布日： 2020-11-24 - 主分类号： G10L13/02 文献下载
摘要：本申请提供了一种语音转换方法、装置、电子设备及存储介质，属于人工智能领域。所述方法包括：获取多个样本信息，每个样本信息包括样本文本信息、样本语音信息和样本用户标识，所述样本用户标识用于指示按照所述样本文本信息发出所述样本语音信息的用户，且所述多个样本信息中包括的样本用户标识不完全相同；根据所述多个样本信息，对语音转换模型进行训练；获取目标文本信息和目标用户标识；调用所述语音转换模型，根据所述目标用户标识对所述目标文本信息进行转换，得到与目标用户的音色匹配的目标语音信息。上述方法可以实现语音转换模型的多音色功能，智能化程度高。
语音转换方法装置电子设备存储介质

[发明专利]一种语音合成模型的训练方法及装置-CN202010339689.6在审
发明人：杜慷;冯大航;陈孝良;常乐 -专利权人：北京声智科技有限公司
申请日： 2020-04-26 - 公布日： 2020-08-07 - 主分类号： G10L13/02 文献下载
摘要：本发明提供一种语音合成模型的训练方法及装置，该方法包括：获取第一数据集，其中，所述第一数据集包括M条单人语音数据，M小于或等于第一预设数量；使用所述第一数据集训练第一语音合成模型的结构参数，得到目标语音合成模型，使得所述目标语音合成模型合成所述第一数据集对应用户的音色的语音数据；其中，所述第一语音合成模型是使用第二数据集对初始语音合成模型进行训练得到的，所述第二数据集包括N条单人语音数据，N大于或等于第二预设数量，所述第二预设数量大于所述第一预设数量。本发明实施例能够不仅能够减少获取训练数据时的时间和人力成本，还能有效缩短模型的训练时间，使得语音合成模型的训练成本得以降低。
一种语音合成模型训练方法装置

[发明专利]一种文语转换方法及装置-CN202010337691.X在审
发明人：杜慷;陈孝良;冯大航 -专利权人：北京声智科技有限公司
申请日： 2020-04-26 - 公布日： 2020-08-07 - 主分类号： G10L13/02 文献下载
摘要：本申请公开了一种文语转换方法及装置。该方法通过采集当前用户的至少一段语音，并接收待转换文本；采用声纹特征识别算法，对当前用户的至少一段语音进行声纹特征识别，得到当前用户的声纹特征，以及采用预设分析算法，对待转换文本的文本信息进行分析，得到待转换文本对应的文本序列信息；基于声纹特征和文本序列信息得到合成语音。该方法可以将当前说话人的声纹特征去合成待转换文本的语音，实现了语音合成的通用性，提高了用户体验。
一种转换方法装置

[发明专利]文本纠错方法、电子设备及计算机可读存储介质-CN202010156189.9在审
发明人：杜慷;冯大航;陈孝良 -专利权人：北京声智科技有限公司
申请日： 2020-03-09 - 公布日： 2020-07-10 - 主分类号： G06F40/169 文献下载
摘要：本发明提供一种文本纠错方法、电子设备及及计算机可读存储介质，所述方法包括：在待处理文本的每两个字之间添加预设符号；将添加所述预设符号后的待处理文本输入预先训练的定位模型，得到文本标注信息，以确定所述待处理文本中的待纠错位置，所述文本标注信息中对应所述待纠错位置的值为预设值；基于所述文本标注信息对所述待处理文本进行纠错处理。本发明实施例能够提高电子设备与用户之间交互的准确性。
文本纠错方法电子设备计算机可读存储介质

[发明专利]文本到语音的转换处理方法、装置及电子设备-CN202010106336.1在审
发明人：杜慷;陈孝良;冯大航 -专利权人：北京声智科技有限公司
申请日： 2020-02-21 - 公布日： 2020-06-19 - 主分类号： G10L13/08 文献下载
摘要：本公开实施例提供了一种文本到语音的转换处理方法、装置及电子设备，属于计算机应用技术领域。其中方法包括：获取待转换的目标文本；将目标文本输入端对端从文本到语音系统，获得初始合成音频；利用预设的纠错模型，查找初始合成音频中的错误字段；对初始合成音频中的错误字段进行修复，得到可用合成音频；将可用合成音频作为目标文本转换得到的音频输出。通过本公开的方案，在音频合成模型后新增一个纠错过程，对合成音频进行评估、定位和纠错，将错误句子中的错误字替换为新的备选字，并在语音数据库中找到替换字的波形信息与原句拼接，从而得到新的、完整的无错漏字的语音合成语句，有效提高了文本到语音的转换处理效率和准确度。
文本语音转换处理方法装置电子设备

1
共 12 条

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：76009968。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

400-8765-105周一至周五 9:00-18:00

版权所有钻瓜科技（天津）有限公司津ICP备15000985号津公网安备 12019202000206号http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top