专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果567898个,建议您升级VIP下载更多相关专利
  • [发明专利]文本合成方法、装置及电子设备-CN202210162223.2在审
  • 许超 - 上海云从企业发展有限公司
  • 2022-02-22 - 2022-05-27 - G06T11/60
  • 本发明涉及文本处理领域,具体提供一种文本合成方法、装置及电子设备,旨在解决现有的手写文本合成方法难以控制合成风格导致的最终合成效果较差的技术问题。为此目的,本发明的文本合成方法包括下述步骤:获取手写风格图像、待迁移文本和提供风格信息的特征向量;基于手写风格图像和文本擦除模型确定候选背景库;基于待迁移文本、特征向量和文本合成模型确定手写体文本库;从候选背景库和手写体文本库中分别获取一张背景图像和手写体合成图像;对背景图像和手写体合成图像进行融合,得到融合图像。
  • 文本合成方法装置电子设备
  • [发明专利]语音合成方法以及电子设备、存储装置-CN202011615062.5在审
  • 王瑾薇;胡亚军;江源 - 科大讯飞股份有限公司
  • 2020-12-30 - 2021-05-11 - G10L13/02
  • 本申请公开了一种语音合成方法以及电子设备、存储装置,其中,语音合成方法包括:获取待合成和待合成的目标情感类型,并获取目标情感类型的参考音频;基于参考音频关于韵律参数的数据分布情况,获取与目标情感类型对应的韵律特征;其中,韵律参数包括以下至少一种:基频、强度、时长;以及,对待合成的音素序列进行特征提取,得到待合成的音素特征;利用韵律特征和音素特征进行解码,得到待合成融入目标情感类型后的合成音频。上述方案,能够准确地在合成音频中融入情感。
  • 语音合成方法以及电子设备存储装置
  • [发明专利]语速调整方法、装置、电子设备及可读存储介质-CN202111199704.2在审
  • 吴梦林 - 北京字跳网络技术有限公司
  • 2021-10-14 - 2023-04-18 - G10L13/02
  • 本公开涉及一种语速调整方法、装置、电子设备及可读存储介质,其中,该方法包括:获取待合成,将待合成输入至语音合成模型,语音合成模型包括编码网络、注意力网络和解码网络,编码网络将输入的待合成转换为声学特征序列;注意力网络用于输出注意力向量,解码网络用于根据注意力向量、声学特征序列以及状态转移控制因子,输出待合成对应的目标频谱;通过待合成对应的目标频谱,获得具有目标语速的目标音频。通过在语音合成模型中引入状态转移控制因子,利用状态转移控制因子动态地控制待合成对应的目标频谱的数量,在语音合成过程中实现灵活的语速调整。且通过本方法合成的音频的声音自然度较高,有利于提升用户体验。
  • 语速调整方法装置电子设备可读存储介质
  • [发明专利]语音合成方法、装置、设备及存储介质-CN202211397831.8在审
  • 汪强兵;刘权;刘聪 - 科大讯飞股份有限公司
  • 2022-11-09 - 2023-03-07 - G10L13/027
  • 本申请公开了一种语音合成方法、装置、设备及存储介质,本申请预先配置有声学信息生成模块,该声学信息生成模块能够基于从待合成中提取的音素,以生成能够用于预测待合成所属的情感类型的声学信息为方向,生成与所述音素匹配的声学信息,进而基于生成的声学信息,得到合成语音。由此可见,本申请规定了声学信息的生成方向,使得生成的声学信息能够作为依据预测待合成所属的情感类型,从而保证了生成的声学信息中包含了待合成所表达的情感信息,进一步基于该包含待合成所表达的情感信息的声学信息进行语音合成时,能够使得合成语音符合待合成所要表达的情感,提升了合成语音的情感表达能力。
  • 语音合成方法装置设备存储介质
  • [发明专利]分词方法和装置-CN201510303053.5有效
  • 李秀林 - 百度在线网络技术(北京)有限公司
  • 2015-06-04 - 2018-05-04 - G06F17/27
  • 本发明提出一种分词方法和装置,上述分词方法可以包括将待合成发送给搜索引擎,以及对所述待合成进行文本预处理;获得搜索引擎根据所述待合成搜索获得的搜索结果,并获得所述搜索结果对应的词典或模型;根据所述搜索结果对应的词典或模型对进行文本预处理后的文本进行分词本发明首先利用待合成进行搜索,获取更加匹配的分词词典或者模型,从而可以改善分词效果,进而可以改善合成语音的质量。
  • 分词方法装置
  • [发明专利]文本图像合成方法、装置、设备及存储介质-CN202110541630.X在审
  • 范湉湉;黄灿;王长虎 - 北京有竹居网络技术有限公司
  • 2021-05-18 - 2021-07-30 - G06K9/32
  • 本申请实施例提供一种文本图像合成方法、装置、设备及存储介质,该方法包括:获取目标文本图像和目标文本样式图像;将所述目标文本图像和所述目标文本样式图像输入文本合成网络中,得到所述文本合成网络输出的合成图像;其中,所述合成图像中的文本为所述目标文本图像中的目标文本,所述合成图像中的文本样式为所述目标文本样式图像中的文本样式,所述文本合成网络是经过文本识别模块辅助训练过的,所述文本识别模块用于识别图像中的文本信息本申请通过文本识别模块作为监督模块,辅助文本合成网络训练,以提高文本合成网络的训练准确性,进而提高训练好的文本合成网络在文本合成时的合成效果。
  • 文本图像合成方法装置设备存储介质
  • [发明专利]语音合成处理方法、装置、设备和存储介质-CN201910503356.X有效
  • 康骥臻;吴玉芳;瞿琴 - 百度在线网络技术(北京)有限公司
  • 2019-06-11 - 2021-03-16 - G10L13/027
  • 本申请提供一种语音合成处理方法、装置、设备和存储介质,其中,方法包括:根据目标文本文本标签,确定与目标文本匹配的发音人设;根据预设的与发音人设匹配的语音规则,对目标文本进行改写处理,得到合成;根据与发音人设匹配的初始语料,对合成进行语音合成处理,得到合成语音。实现了根据待播报的文本内容,确定与文本内容相适应的发音人设,根据与发音人设匹配的语音规则,对待播报的文本内容进行改写处理,改写处理得到的合成内容与发音人设对应的语音规则相匹配。对合成进行语音合成处理得到的合成语音,其播报风格与文本内容匹配度高,播报效果自然,表达方式多样化,可以有效提升语音合成效率,有利于提升用户体验。
  • 语音合成处理方法装置设备存储介质
  • [发明专利]一种语音合成方法、装置及系统-CN201910944037.2在审
  • 陈孝良;张国超;邢越峰;苏少炜 - 北京声智科技有限公司
  • 2019-09-30 - 2021-03-30 - G10L13/02
  • 本发明提供了一种语音合成方法、装置及系统,服务端接收客户端发送的携带有文本信息的请求信息,依据文本信息获取待合成;根据预设处理规则,将待合成切分为至少一个子文本;按照子文本的顺序,对子文本进行TTS语音合成,得到合成结果;将携带有合成结果的响应信息以分块传输编码的方式发送到客户端,使客户端将合成结果流式输出。本发明客户端与服务端建立一次TCP连接就可以完成一次TTS语音合成,且服务端对待合成进行切分,对切分后得到的子文本异步合成和发送,不需要等到待合成全部合成再进行发送,提高了TTS语音合成服务的响应效率
  • 一种语音合成方法装置系统
  • [发明专利]电子装置、语音合成方法和计算机可读存储介质-CN201710874876.2有效
  • 梁浩;程宁;王健宗;肖京 - 平安科技(深圳)有限公司
  • 2017-09-25 - 2018-09-11 - G10L13/08
  • 本发明公开一种电子装置、语音合成方法和存储介质,该方法包括:在收到待合成后,将该待合成中的语句及词组拆分成单字,根据预先确定的单字、发音时长、发音基频三者之间的映射关系,确定各个单字对应的发音时长和发音基频,根据预先确定的发音字典将各个单字拆分成预设类型语音特征;根据各个单字的语音特征和发音时长,提取出该待合成对应的预设类型声学特征向量;将该待合成对应的预设类型声学特征向量输入到训练好的预设类型识别模型中,识别出该待合成对应的声纹特征;根据该识别出的声纹特征和各个单字的发音基频,生成该待合成对应的语音。本发明技术方案使语音合成结果的精度高,自然度和清晰度较佳。
  • 电子装置语音合成方法计算机可读存储介质
  • [发明专利]语音合成方法、装置、存储介质和电子设备-CN202010153425.1有效
  • 殷翔 - 北京字节跳动网络技术有限公司
  • 2020-03-06 - 2021-08-27 - G10L13/02
  • 本公开涉及一种语音合成方法、装置、存储介质和电子设备,所述方法包括:将待合成输入信息提取模型,获得与所述待合成对应的语音特征信息;将所述语音特征信息输入语音合成模型,获得与所述待合成对应的声学特征,其中,所述语音合成模型包括时长子模型和声学子模型,所述时长子模型和所述声学子模型进行联合训练获得所述语音合成模型;根据所述声学特征,获得与所述待合成对应的音频信息。因此,通过语音合成模型可以直接根据待合成对应的语音特征信息获得声学特征,无需经过多个模型进行协作,从而可以提高语音合成的效率,并可以有效降低误差累积,提高语音合成方法的准确度。
  • 语音合成方法装置存储介质电子设备
  • [发明专利]图像处理方法、装置、计算机设备及存储介质-CN202111041464.3有效
  • 任旭华;孙子荀 - 腾讯科技(深圳)有限公司
  • 2021-09-07 - 2022-02-11 - G06V10/22
  • 本申请实施例提供了一种图像处理方法、装置、计算机设备及存储介质,可以应用于云技术、人工智能、区块链、智慧交通、车载、游戏等各种领域或场景,其中方法包括:获取待合成和待合成图像;根据所述待合成图像生成背景图像,其中,当所述待合成图像包括字符信息时,所述背景图像是根据去除掉所述字符信息的待合成图像生成的;获取所述背景图像的辅助图像特征,并根据所述辅助图像特征确定所述待合成的显示特征;根据所述显示特征将所述待合成和所述背景图像进行合成,得到合成图像。通过本申请实施例可以有效提高文本图像的合成效率以及有效提高合成图像的合成效果。
  • 图像处理方法装置计算机设备存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top