“合成文本”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果567898个，建议您升级VIP下载更多相关专利

[发明专利]文本合成方法、装置及电子设备-CN202210162223.2在审
发明人：许超 -专利权人：上海云从企业发展有限公司
申请日： 2022-02-22 - 公布日： 2022-05-27 - 主分类号： G06T11/60 文献下载
摘要：本发明涉及文本处理领域，具体提供一种文本合成方法、装置及电子设备，旨在解决现有的手写文本合成方法难以控制合成文本风格导致的最终合成文本效果较差的技术问题。为此目的，本发明的文本合成方法包括下述步骤：获取手写风格图像、待迁移文本和提供风格信息的特征向量；基于手写风格图像和文本擦除模型确定候选背景库；基于待迁移文本、特征向量和文本合成模型确定手写体文本库；从候选背景库和手写体文本库中分别获取一张背景图像和手写体合成文本图像；对背景图像和手写体合成文本图像进行融合，得到融合图像。
文本合成方法装置电子设备

[发明专利]语音合成方法以及电子设备、存储装置-CN202011615062.5在审
发明人：王瑾薇;胡亚军;江源 -专利权人：科大讯飞股份有限公司
申请日： 2020-12-30 - 公布日： 2021-05-11 - 主分类号： G10L13/02 文献下载
摘要：本申请公开了一种语音合成方法以及电子设备、存储装置，其中，语音合成方法包括：获取待合成文本和待合成文本的目标情感类型，并获取目标情感类型的参考音频；基于参考音频关于韵律参数的数据分布情况，获取与目标情感类型对应的韵律特征；其中，韵律参数包括以下至少一种：基频、强度、时长；以及，对待合成文本的音素序列进行特征提取，得到待合成文本的音素特征；利用韵律特征和音素特征进行解码，得到待合成文本融入目标情感类型后的合成音频。上述方案，能够准确地在合成音频中融入情感。
语音合成方法以及电子设备存储装置

[发明专利]语速调整方法、装置、电子设备及可读存储介质-CN202111199704.2在审
发明人：吴梦林 -专利权人：北京字跳网络技术有限公司
申请日： 2021-10-14 - 公布日： 2023-04-18 - 主分类号： G10L13/02 文献下载
摘要：本公开涉及一种语速调整方法、装置、电子设备及可读存储介质，其中，该方法包括：获取待合成文本，将待合成文本输入至语音合成模型，语音合成模型包括编码网络、注意力网络和解码网络，编码网络将输入的待合成文本转换为声学特征序列；注意力网络用于输出注意力向量，解码网络用于根据注意力向量、声学特征序列以及状态转移控制因子，输出待合成文本对应的目标频谱；通过待合成文本对应的目标频谱，获得具有目标语速的目标音频。通过在语音合成模型中引入状态转移控制因子，利用状态转移控制因子动态地控制待合成文本对应的目标频谱的数量，在语音合成过程中实现灵活的语速调整。且通过本方法合成的音频的声音自然度较高，有利于提升用户体验。
语速调整方法装置电子设备可读存储介质

[发明专利]语音合成方法、装置、设备及存储介质-CN202211397831.8在审
发明人：汪强兵;刘权;刘聪 -专利权人：科大讯飞股份有限公司
申请日： 2022-11-09 - 公布日： 2023-03-07 - 主分类号： G10L13/027 文献下载
摘要：本申请公开了一种语音合成方法、装置、设备及存储介质，本申请预先配置有声学信息生成模块，该声学信息生成模块能够基于从待合成文本中提取的音素，以生成能够用于预测待合成文本所属的情感类型的声学信息为方向，生成与所述音素匹配的声学信息，进而基于生成的声学信息，得到合成语音。由此可见，本申请规定了声学信息的生成方向，使得生成的声学信息能够作为依据预测待合成文本所属的情感类型，从而保证了生成的声学信息中包含了待合成文本所表达的情感信息，进一步基于该包含待合成文本所表达的情感信息的声学信息进行语音合成时，能够使得合成语音符合待合成文本所要表达的情感，提升了合成语音的情感表达能力。
语音合成方法装置设备存储介质

[发明专利]文本图像合成方法、装置、存储介质及电子设备-CN202111197890.6在审
发明人：肖杨;马文伟;王亚领;刘设伟 -专利权人：泰康保险集团股份有限公司;泰康在线财产保险股份有限公司
申请日： 2021-10-14 - 公布日： 2022-01-14 - 主分类号： G06V10/774 文献下载
摘要：本公开涉及图像处理技术领域，具体涉及一种文本图像合成方法、装置、存储介质及电子设备。该文本图像合成方法包括：读取文本图像，并对所述文本图像进行文本检测得到文本字体范围和文本高度范围，以及对所述文本图像进行内容检测得到禁止贴片区域；获取待合成文本，并根据所述待合成文本、所述文本字体范围和所述文本高度范围生成所述待合成文本对应的文本贴片；基于预设的贴片方式和所述禁止贴片区域判断所述文本贴片是否满足预设的合成条件；在所述文本贴片满足合成条件时，将所述文本贴片放置在所述文本图像中以得到合成文本图像。本公开提供的文本图像合成方法能够解决文本图像合成中合成内容与真实样本相似度低的问题。
文本图像合成方法装置存储介质电子设备

[发明专利]语音合成方法、装置、设备及计算机可读存储介质-CN202011138907.6在审
发明人：曾振;王健宗;程宁 -专利权人：平安科技（深圳）有限公司
申请日： 2020-10-22 - 公布日： 2020-12-15 - 主分类号： G10L13/02 文献下载
摘要：本发明涉及一种人工智能，揭露一种语音合成方法，包括：对获取的待合成文本进行语义提取处理，得到语义特征序列；通过韵律预测模型对语义特征序列进行韵律预测处理，得到待合成文本的韵律情感特征；将韵律情感特征与预先获取的待合成文本的音节序列同时输入语音特征预测模型，进行语音预测处理，得到待合成文本的语音特征谱；将语音特征谱与待合成文本合成带有韵律情感的语音。本发明够实时切换合成语音的语气情感以及韵律特点。
语音合成方法装置设备计算机可读存储介质

[发明专利]分词方法和装置-CN201510303053.5有效
发明人：李秀林 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2015-06-04 - 公布日： 2018-05-04 - 主分类号： G06F17/27 文献下载
摘要：本发明提出一种分词方法和装置，上述分词方法可以包括将待合成文本发送给搜索引擎，以及对所述待合成文本进行文本预处理；获得搜索引擎根据所述待合成文本搜索获得的搜索结果，并获得所述搜索结果对应的词典或模型；根据所述搜索结果对应的词典或模型对进行文本预处理后的文本进行分词本发明首先利用待合成文本进行搜索，获取更加匹配的分词词典或者模型，从而可以改善分词效果，进而可以改善合成语音的质量。
分词方法装置

[发明专利]文本图像合成方法、装置、设备及存储介质-CN202110541630.X在审
发明人：范湉湉;黄灿;王长虎 -专利权人：北京有竹居网络技术有限公司
申请日： 2021-05-18 - 公布日： 2021-07-30 - 主分类号： G06K9/32 文献下载
摘要：本申请实施例提供一种文本图像合成方法、装置、设备及存储介质，该方法包括：获取目标文本图像和目标文本样式图像；将所述目标文本图像和所述目标文本样式图像输入文本合成网络中，得到所述文本合成网络输出的合成文本图像；其中，所述合成文本图像中的文本为所述目标文本图像中的目标文本，所述合成文本图像中的文本样式为所述目标文本样式图像中的文本样式，所述文本合成网络是经过文本识别模块辅助训练过的，所述文本识别模块用于识别图像中的文本信息本申请通过文本识别模块作为监督模块，辅助文本合成网络训练，以提高文本合成网络的训练准确性，进而提高训练好的文本合成网络在文本合成时的合成效果。
文本图像合成方法装置设备存储介质

[发明专利]语音合成处理方法、装置、设备和存储介质-CN201910503356.X有效
发明人：康骥臻;吴玉芳;瞿琴 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2019-06-11 - 公布日： 2021-03-16 - 主分类号： G10L13/027 文献下载
摘要：本申请提供一种语音合成处理方法、装置、设备和存储介质，其中，方法包括：根据目标文本的文本标签，确定与目标文本匹配的发音人设；根据预设的与发音人设匹配的语音规则，对目标文本进行改写处理，得到合成文本；根据与发音人设匹配的初始语料，对合成文本进行语音合成处理，得到合成语音。实现了根据待播报的文本内容，确定与文本内容相适应的发音人设，根据与发音人设匹配的语音规则，对待播报的文本内容进行改写处理，改写处理得到的合成文本内容与发音人设对应的语音规则相匹配。对合成文本进行语音合成处理得到的合成语音，其播报风格与文本内容匹配度高，播报效果自然，表达方式多样化，可以有效提升语音合成效率，有利于提升用户体验。
语音合成处理方法装置设备存储介质

[发明专利]一种语音合成方法、装置及系统-CN201910944037.2在审
发明人：陈孝良;张国超;邢越峰;苏少炜 -专利权人：北京声智科技有限公司
申请日： 2019-09-30 - 公布日： 2021-03-30 - 主分类号： G10L13/02 文献下载
摘要：本发明提供了一种语音合成方法、装置及系统，服务端接收客户端发送的携带有文本信息的请求信息，依据文本信息获取待合成文本；根据预设处理规则，将待合成文本切分为至少一个子文本；按照子文本的顺序，对子文本进行TTS语音合成，得到合成结果；将携带有合成结果的响应信息以分块传输编码的方式发送到客户端，使客户端将合成结果流式输出。本发明客户端与服务端建立一次TCP连接就可以完成一次TTS语音合成，且服务端对待合成文本进行切分，对切分后得到的子文本异步合成和发送，不需要等到待合成文本全部合成再进行发送，提高了TTS语音合成服务的响应效率
一种语音合成方法装置系统

[发明专利]语音合成方法、网络训练方法、装置、设备及存储介质-CN202310124566.4在审
发明人：黄良杰;原湉;陈泽裕;李晓辉 -专利权人：北京百度网讯科技有限公司
申请日： 2023-02-16 - 公布日： 2023-05-16 - 主分类号： G10L13/02 文献下载
摘要：本公开提供了语音合成方法、网络训练方法、装置、设备及存储介质，涉及语音处理技术领域，尤其涉及人工智能、语音合成技术领域。具体实现方案为：响应于接收到待合成文本，采用前端网络获取待合成文本的韵律特征以及待合成文本对应的音素序列；采用声学模型网络根据韵律特征以及音素序列获取待合成文本对应的声学特征；采用声码器网络根据声学特征获取待合成文本对应的合成语音的音频波形；其中，前端网络、声学模型网络、声码器网络串行组成语音合成网络；前端网络、声学模型网络、声码器网络是通过对语音合成网络预先进行端到端训练获取的。
语音合成方法网络训练装置设备存储介质

[发明专利]在语音合系统中将背景音与文本语音混合输出的方法-CN200410044998.1有效
发明人：严峻;于继栋;李海方 -专利权人：安徽中科大讯飞信息科技有限公司
申请日： 2004-06-01 - 公布日： 2005-02-23 - 主分类号： G10L13/02 文献下载
摘要：本发明公开了一种在语音合成系统中将背景音与文本语音混合输出的方法，包括用户向合成系统提供合成文本信息，合成系统经过文本分析和韵律分析，再调用音库中的发音单元，组合成连续的合成文本语音数据。本发明特征是建立背景音库，在合成文本文件中加入背景音的CSSML标记，或者在语音合成系统用户开发接口提供背景音合成参数；然后从背景音库中提取出CSSML标记或合成参数设置的背景音，把背景音与合成文本语音按照一定能量比例进行混音处理后输出
语音系统中将背景文本混合输出方法

[发明专利]电子装置、语音合成方法和计算机可读存储介质-CN201710874876.2有效
发明人：梁浩;程宁;王健宗;肖京 -专利权人：平安科技（深圳）有限公司
申请日： 2017-09-25 - 公布日： 2018-09-11 - 主分类号： G10L13/08 文献下载
摘要：本发明公开一种电子装置、语音合成方法和存储介质，该方法包括：在收到待合成文本后，将该待合成文本中的语句及词组拆分成单字，根据预先确定的单字、发音时长、发音基频三者之间的映射关系，确定各个单字对应的发音时长和发音基频，根据预先确定的发音字典将各个单字拆分成预设类型语音特征；根据各个单字的语音特征和发音时长，提取出该待合成文本对应的预设类型声学特征向量；将该待合成文本对应的预设类型声学特征向量输入到训练好的预设类型识别模型中，识别出该待合成文本对应的声纹特征；根据该识别出的声纹特征和各个单字的发音基频，生成该待合成文本对应的语音。本发明技术方案使语音合成结果的精度高，自然度和清晰度较佳。
电子装置语音合成方法计算机可读存储介质

[发明专利]语音合成方法、装置、存储介质和电子设备-CN202010153425.1有效
发明人：殷翔 -专利权人：北京字节跳动网络技术有限公司
申请日： 2020-03-06 - 公布日： 2021-08-27 - 主分类号： G10L13/02 文献下载
摘要：本公开涉及一种语音合成方法、装置、存储介质和电子设备，所述方法包括：将待合成文本输入信息提取模型，获得与所述待合成文本对应的语音特征信息；将所述语音特征信息输入语音合成模型，获得与所述待合成文本对应的声学特征，其中，所述语音合成模型包括时长子模型和声学子模型，所述时长子模型和所述声学子模型进行联合训练获得所述语音合成模型；根据所述声学特征，获得与所述待合成文本对应的音频信息。因此，通过语音合成模型可以直接根据待合成文本对应的语音特征信息获得声学特征，无需经过多个模型进行协作，从而可以提高语音合成的效率，并可以有效降低误差累积，提高语音合成方法的准确度。
语音合成方法装置存储介质电子设备

[发明专利]图像处理方法、装置、计算机设备及存储介质-CN202111041464.3有效
发明人：任旭华;孙子荀 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-09-07 - 公布日： 2022-02-11 - 主分类号： G06V10/22 文献下载
摘要：本申请实施例提供了一种图像处理方法、装置、计算机设备及存储介质，可以应用于云技术、人工智能、区块链、智慧交通、车载、游戏等各种领域或场景，其中方法包括：获取待合成文本和待合成图像；根据所述待合成图像生成背景图像，其中，当所述待合成图像包括字符信息时，所述背景图像是根据去除掉所述字符信息的待合成图像生成的；获取所述背景图像的辅助图像特征，并根据所述辅助图像特征确定所述待合成文本的显示特征；根据所述显示特征将所述待合成文本和所述背景图像进行合成，得到合成文本图像。通过本申请实施例可以有效提高文本图像的合成效率以及有效提高合成文本图像的合成效果。
图像处理方法装置计算机设备存储介质