“音素信息”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果1992255个，建议您升级VIP下载更多相关专利

[发明专利]音视频素材的生成方法及装置-CN202210648636.1在审
发明人：吴可嘉;李怡欧;陈启铭;叶伊雯;马伯男;王礼根;朱思振;李经纬;袁未发;马经纬;贺卯苏 -专利权人：上海幻电信息科技有限公司
申请日： 2022-06-09 - 公布日： 2022-08-12 - 主分类号： G10L13/027 文献下载
摘要：本申请提供音视频素材的生成方法及装置，其中所述音视频素材的生成方法包括：接收针对音素序列的音视频素材生成请求，其中，所述音视频素材生成请求中包含角色标识；基于所述角色标识确定目标音素信息集合，其中，所述目标音素信息集合中包括音素信息和音素信息对应的视频素材；根据所述音素序列在所述目标音素信息集合中获取音素信息序列；确定所述音素信息序列中每个音素信息对应的视频素材，生成所述音素序列对应的目标音视频素材。
视频素材生成方法装置

[发明专利]语音数据处理方法和装置及电子装置-CN201911425436.4有效
发明人：刘洋;梁志婷 -专利权人：秒针信息技术有限公司
申请日： 2019-12-31 - 公布日： 2022-11-29 - 主分类号： G10L15/02 文献下载
摘要：其中，该方法包括：通过提取目标对象的语音信息中的无声调特征的音素和有声调特征的音素，音素对应语音中待识别文字的音素，声调对应语音中待识别文字的声调；通过音素获取对应音素的目标音素库，目标音素库中包括对应音素的N种声调音素，N为大于1的自然数；根据有声调特征与目标音素库中的音素进行匹配，确定出语音信息对应的文本音素，并根据文本音素识别出语音信息对应的文本，达到了分别根据音素和声调信息进行语音信息的识别的目的，从而实现了根据音素特征确定目标音素库，根据声调特征确定文本音素的技术效果，进而解决了现有技术中，语音信息识别精确度低的技术问题。
语音数据处理方法装置电子

[发明专利]发音检错方法及装置、语音评分方法及装置-CN202111678431.X在审
发明人：杨琴;吴奎;盛志超;金海;李芳足;张志勇 -专利权人：科大讯飞股份有限公司
申请日： 2021-12-31 - 公布日： 2022-05-13 - 主分类号： G10L25/60 文献下载
摘要：该发音检错方法包括：确定待检错朗读语音的状态序列；确定待检错朗读语音对应的朗读文本包含的音素各自对应的N音素时间边界信息；基于状态序列和朗读文本包含的音素各自对应的N音素时间边界信息，生成音素聚合数据；基于音素聚合数据，确定朗读文本包含的音素各自对应的检错信息。由于音素聚合数据是基于朗读文本包含的音素各自对应的N音素时间边界信息对状态序列进行多尺度聚合操作后生成的，因此，音素聚合数据能够包含不同尺度的音素局部信息和音素全局信息。由此可见，本公开能够借助音素聚合数据提高检错精准度和检错稳定性。
发音检错方法装置语音评分

[发明专利]语音合成信息编辑设备-CN201110396819.0有效
发明人：入山达也 -专利权人：雅马哈株式会社
申请日： 2011-12-02 - 公布日： 2012-06-06 - 主分类号： G10L13/02 文献下载
摘要：本发明提供了语音合成信息编辑设备。在语音合成信息编辑设备中，音素存储单元存储音素信息，所述音素信息指示要合成的语音的每个音素的持续时间。特征存储单元存储特征信息，所述特征信息指示语音的特征的时间变化。编辑处理单元根据扩展/压缩度改变由所述音素信息指示的每个音素的持续时间，所述扩展/压缩度取决于与音素对应的特征信息所指示的特征。
语音合成信息编辑设备

[发明专利]关键点信息获取方法、动画生成方法及装置-CN202210119237.6在审
发明人：毕成;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2022-02-08 - 公布日： 2023-08-18 - 主分类号： G06V40/16 文献下载
摘要：本公开涉及一种关键点信息获取方法、动画生成方法及装置。关键点信息获取方法包括：获取对已获得用户授权使用的样本人脸录制的第一视频，确定所述样本视频的每一视频帧中的人脸关键点信息，以得到关键点信息序列；获取对已获得用户授权使用的样本人脸录制的第一音频，确定所述样本音频的每一音频帧对应的音素以及音素时长，以得到音素序列信息、音素时长序列信息和音素位置信息；根据所述音素时长序列信息，对每一音素进行扩展，得到音素扩展序列；根据所述关键点信息序列、音素扩展序列和音素位置信息对神经网络模型进行训练得到人脸关键点获取模型；利用所述人脸关键点获取模型获取人脸关键点信息。
关键信息获取方法动画生成装置

[发明专利]一种发音检测方法、装置、电子设备及存储介质-CN202310682722.9在审
发明人：庄晓滨 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2023-06-09 - 公布日： 2023-08-08 - 主分类号： G10L25/51 文献下载
摘要：本申请提供一种发音检测方法、装置、电子设备及存储介质，涉及语音测评领域，方法包括：获取待测音频的梅尔频谱和待测音频对应的目标发音的音素向量序列；音素向量序列包含目标发音中的各音素对应的音素向量；分别对梅尔频谱和音素向量序列进行编码处理得到声学表征特征和各音素对应的音素表征信息；对声学表征信息和音素表征信息进行注意力处理得到各音素的上下文信息；对音素向量序列进行卷积处理得到各音素的卷积特征；对上下文信息及卷积特征进行拼接得到各音素的拼接特征，并对拼接特征进行检测处理，生成各音素在待测音频中对应的发音检测结果；可结合音素的卷积特征和上下文信息检测其对应的发音错误情况，以提升检测准确度。
一种发音检测方法装置电子设备存储介质

[发明专利]韵律修改装置和方法及存储有韵律修改程序的记录介质-CN200810086741.0有效
发明人：村濑健太郎;片江伸之 -专利权人：富士通株式会社
申请日： 2008-03-20 - 公布日： 2008-09-24 - 主分类号： G10L13/08 文献下载
摘要：该韵律修改装置包括：真实话音韵律输入部，用于接收从人类发声中提取的真实话音韵律信息；规则韵律生成部，用于针对真实话音韵律信息中的至少包括要修改的音素或音素串的部分，利用表示人类发声中的规则的或统计出的音素长度的数据来生成规则韵律信息(其具有确定音素之间的边界的规则音素边界和音素的规则音素长度)；以及真实话音韵律修改部，其利用生成的规则韵律信息，重置真实话音音素边界，以使真实话音韵律信息中的要修改的音素或音素串的真实话音音素边界和真实话音音素长度接近于人类发声的实际音素边界和实际音素长度，由此修改真实话音韵律信息。
韵律修改装置方法存储程序记录介质

[发明专利]一种语音合成方法、装置、设备及介质-CN202111138183.X在审
发明人：张旭龙;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2021-09-27 - 公布日： 2021-12-31 - 主分类号： G10L13/08 文献下载
摘要：方法包括：通过训练后的语音合成模型对目标文本信息进行文本解析，得到目标文本信息的音素序列；对目标文本信息的音素序列中各个第一音素进行音素映射编码，得到各个第一音素的编码信息；根据各个第一音素的音素时长，对各个第一音素的编码信息进行序列扩展，得到各个第一音素的扩展编码信息；根据各个第一音素的扩展编码信息和上一帧的声学特征，预测当前帧的声学特征；根据获取到的目标文本信息对应的待合成语音中所有帧的声学特征，合成目标文本信息对应的预测语音信息，可对音素序列和声学特征进行时间对齐，提高对齐准确度，进而提高语音合成的可靠性。
一种语音合成方法装置设备介质

[发明专利]歌声生成方法、计算机设备和存储介质-CN202310479257.9在审
发明人：陈梦;张超鹏;宗旋 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2023-04-26 - 公布日： 2023-07-25 - 主分类号： G10H1/00 文献下载
摘要：所述方法包括：获取目标曲谱的音节信息、音符信息和连音符信息；根据音节信息、音符信息和连音符信息，确定目标曲谱的曲谱音素编码特征、曲谱音素时长和音素级别基频；根据曲谱音素编码特征、曲谱音素时长和音素级别基频，生成目标曲谱的曲谱音频；获取曲谱音频对应的帧级别基频和目标曲谱对应的曲谱音素信息，根据帧级别基频和曲谱音素信息，生成目标歌声音频。采用本方法能够通过解析曲谱确定曲谱信息，根据曲谱信息确定曲谱特征，根据曲谱特征生成目标曲谱的曲谱音频，基于曲谱音频和目标曲谱的音素信息，生成以预设音色演唱目标曲谱的歌声，提高合成歌声的自然度。
歌声生成方法计算机设备存储介质

[发明专利]动画生成方法、装置、设备及可读存储介质-CN202310827934.1在审
发明人：彭泽宇;李宏龙;王苏君;彭话易 -专利权人：咪咕文化科技有限公司;中国移动通信集团有限公司
申请日： 2023-07-07 - 公布日： 2023-10-13 - 主分类号： G06T13/40 文献下载
摘要：本申请提供一种动画生成方法、装置、设备及可读存储介质，其方法包括：获取目标语料内容对应的至少一个目标音素的信息，每个目标音素的信息包括音素类别、音素时长以及音素状态中的至少一项，音素状态与发音振幅相关；在动态口型模板中选取与数字对象相匹配的目标动态口型模板；根据目标音素的音素时长和/或音素状态，对目标口型动画信息进行调整，得到目标音素对应的面部口型动画片段，目标口型动画信息为目标动态口型模板中与音素类别对应的动态口型动画信息；基于至少一个目标音素对应的面部口型动画片段，得到数字对象在说出所述目标语料内容时的面部口型动画。
动画生成方法装置设备可读存储介质

[发明专利]歌词音素发音时长的预测方法、设备和计算机程序产品-CN202210723111.X在审
发明人：庄晓滨 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-06-24 - 公布日： 2022-10-11 - 主分类号： G10L15/02 文献下载
摘要：本申请涉及一种歌词音素发音时长的预测方法、设备和计算机程序产品。本申请能够在原唱歌词的时长约束下，预测新歌词中的每个字中的音素时长，提高翻唱歌词时长预测准确度。该方法包括：确定原唱歌词，并获取目标歌词的字数；根据原唱歌词中每个字的时间戳以及目标歌词的字数，确定目标歌词中每个字的音节实际发音时长；其中，目标歌词中每个字对应的音节包括至少一个音素；分别对目标歌词中每个字的音素、音素的音素类型和音节实际发音时长进行编码，得到音素编码信息、音素类型编码信息和音节实际发音时长编码信息；将音素编码信息、音素类型编码信息和音节实际发音时长编码信息输入音素发音时长预测模型，得到每个音素的发音时长预测结果
歌词音素发音预测方法设备计算机程序产品

[发明专利]设备唤醒方法、装置及计算机可读存储介质-CN202210174193.7在审
发明人：赵惟肖;史润宇 -专利权人：北京小米移动软件有限公司
申请日： 2022-02-24 - 公布日： 2023-09-05 - 主分类号： G10L15/22 文献下载
摘要：本公开涉及一种设备唤醒方法、装置及计算机可读存储介质，涉及设备控制领域，该方法包括：根据接收到的语音信息获取多个音素帧，每个音素帧的时长为预设时长，再将该多个音素帧输入预设的声学模型，以得到第一音素序列，该第一音素序列包括该多个音素帧对应的多个音素，以及每个音素的判定概率，而后在确定第一音素序列中的无效音素和/或缺失音素符合预设条件的情况下，根据该第一音素序列，以及该第一音素序列中的多个音素的判定概率确定语音信息的唤醒结果能够在不设置复杂解码器的情况下，实现对语音信息中的音素的识别，能够实现对音素级别语音唤醒技术的简化。
设备唤醒方法装置计算机可读存储介质

[发明专利]一种融合词汇及音素发音特征的情感语音合成方法及系统-CN202110600732.4有效
发明人：郑书凯;李太豪;裴冠雄 -专利权人：之江实验室
申请日： 2021-05-31 - 公布日： 2021-11-02 - 主分类号： G10L13/10 文献下载
摘要：本发明属于人工智能领域，具体涉及一种融合词汇及音素发音特征的情感语音合成方法及系统，该方法为：通过录音采集设备，采集文本及情感标签，对所述文本进行预处理，获取音素及音素对齐信息，生成分词及分词语义信息，分别计算并得到分词发音时长信息、分词发音语速信息、分词发音能量信息、音素基频信息，分别训练分词语速预测网络、分词能量预测网络、音素基频预测网络，获取并拼接音素隐含信息、分词语速隐含信息、分词能量隐含信息、音素基频隐含信息，合成情感语音。本发明通过将与情感发音有关的词汇及音素发音特征融合到端到端语音合成模型中去，能够使得合成的情感语音更加自然。
一种融合词汇音素发音特征情感语音合成方法系统

[发明专利]一种语音数据分析方法及系统-CN202010374991.5在审
发明人：王丹;庞永强 -专利权人：北京一起教育信息咨询有限责任公司
申请日： 2020-04-30 - 公布日： 2020-08-25 - 主分类号： G10L15/02 文献下载
摘要：本申请提供了一种语音数据分析方法及系统，所述方法包括：获取用户的语音学习信息及语音信息；根据语音学习信息提取语音信息中的重点词，并提取重点词中的音素数据；根据预设声学模型对音素数据进行一一评分，得到重点词中每个音素数据的音素得分，根据重点词中每个音素数据的音素得分得到重点词的重点词发音得分；或者判断重点词发音得分是否小于预设单词发音值，若是，则判断重点词中每个音素数据的音素是否小于预设音素发音值，将小于预设音素发音值的音素数据作为错音音素数据，并将错音音素数据和错音音素数据对应的重点词进行不同标签显示。
一种语音数据分析方法系统

[发明专利]语音合成方法、装置、存储介质和电子设备-CN202010340818.3有效
发明人：杨惠;梁光;舒景辰;谭星;张岱 -专利权人：北京大米科技有限公司
申请日： 2020-04-26 - 公布日： 2023-09-05 - 主分类号： G10L13/08 文献下载
摘要：本申请提供的语音合成方法、装置、存储介质和电子设备，确定输入文本的音素序列，所述音素序列包括多个子音素序列；确定所述多个子音素序列中每一个子音素序列的时长信息；根据所述子音素序列的时长信息，确定所述子音素序列中每一个音素的时长信息；根据所述音素序列和所述每一个音素的时长信息，合成所述输入文本对应的语音。
语音合成方法装置存储介质电子设备

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
下一页»
尾页
共 100000 条