专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果1992255个,建议您升级VIP下载更多相关专利
  • [发明专利]语音数据处理方法和装置及电子装置-CN201911425436.4有效
  • 刘洋;梁志婷 - 秒针信息技术有限公司
  • 2019-12-31 - 2022-11-29 - G10L15/02
  • 其中,该方法包括:通过提取目标对象的语音信息中的无声调特征的音素和有声调特征的音素音素对应语音中待识别文字的音素,声调对应语音中待识别文字的声调;通过音素获取对应音素的目标音素库,目标音素库中包括对应音素的N种声调音素,N为大于1的自然数;根据有声调特征与目标音素库中的音素进行匹配,确定出语音信息对应的文本音素,并根据文本音素识别出语音信息对应的文本,达到了分别根据音素和声调信息进行语音信息的识别的目的,从而实现了根据音素特征确定目标音素库,根据声调特征确定文本音素的技术效果,进而解决了现有技术中,语音信息识别精确度低的技术问题。
  • 语音数据处理方法装置电子
  • [发明专利]发音检错方法及装置、语音评分方法及装置-CN202111678431.X在审
  • 杨琴;吴奎;盛志超;金海;李芳足;张志勇 - 科大讯飞股份有限公司
  • 2021-12-31 - 2022-05-13 - G10L25/60
  • 该发音检错方法包括:确定待检错朗读语音的状态序列;确定待检错朗读语音对应的朗读文本包含的音素各自对应的N音素时间边界信息;基于状态序列和朗读文本包含的音素各自对应的N音素时间边界信息,生成音素聚合数据;基于音素聚合数据,确定朗读文本包含的音素各自对应的检错信息。由于音素聚合数据是基于朗读文本包含的音素各自对应的N音素时间边界信息对状态序列进行多尺度聚合操作后生成的,因此,音素聚合数据能够包含不同尺度的音素局部信息音素全局信息。由此可见,本公开能够借助音素聚合数据提高检错精准度和检错稳定性。
  • 发音检错方法装置语音评分
  • [发明专利]语音合成信息编辑设备-CN201110396819.0有效
  • 入山达也 - 雅马哈株式会社
  • 2011-12-02 - 2012-06-06 - G10L13/02
  • 本发明提供了语音合成信息编辑设备。在语音合成信息编辑设备中,音素存储单元存储音素信息,所述音素信息指示要合成的语音的每个音素的持续时间。特征存储单元存储特征信息,所述特征信息指示语音的特征的时间变化。编辑处理单元根据扩展/压缩度改变由所述音素信息指示的每个音素的持续时间,所述扩展/压缩度取决于与音素对应的特征信息所指示的特征。
  • 语音合成信息编辑设备
  • [发明专利]关键点信息获取方法、动画生成方法及装置-CN202210119237.6在审
  • 毕成;马泽君 - 北京有竹居网络技术有限公司
  • 2022-02-08 - 2023-08-18 - G06V40/16
  • 本公开涉及一种关键点信息获取方法、动画生成方法及装置。关键点信息获取方法包括:获取对已获得用户授权使用的样本人脸录制的第一视频,确定所述样本视频的每一视频帧中的人脸关键点信息,以得到关键点信息序列;获取对已获得用户授权使用的样本人脸录制的第一音频,确定所述样本音频的每一音频帧对应的音素以及音素时长,以得到音素序列信息音素时长序列信息音素位置信息;根据所述音素时长序列信息,对每一音素进行扩展,得到音素扩展序列;根据所述关键点信息序列、音素扩展序列和音素位置信息对神经网络模型进行训练得到人脸关键点获取模型;利用所述人脸关键点获取模型获取人脸关键点信息
  • 关键信息获取方法动画生成装置
  • [发明专利]一种发音检测方法、装置、电子设备及存储介质-CN202310682722.9在审
  • 庄晓滨 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2023-06-09 - 2023-08-08 - G10L25/51
  • 本申请提供一种发音检测方法、装置、电子设备及存储介质,涉及语音测评领域,方法包括:获取待测音频的梅尔频谱和待测音频对应的目标发音的音素向量序列;音素向量序列包含目标发音中的各音素对应的音素向量;分别对梅尔频谱和音素向量序列进行编码处理得到声学表征特征和各音素对应的音素表征信息;对声学表征信息音素表征信息进行注意力处理得到各音素的上下文信息;对音素向量序列进行卷积处理得到各音素的卷积特征;对上下文信息及卷积特征进行拼接得到各音素的拼接特征,并对拼接特征进行检测处理,生成各音素在待测音频中对应的发音检测结果;可结合音素的卷积特征和上下文信息检测其对应的发音错误情况,以提升检测准确度。
  • 一种发音检测方法装置电子设备存储介质
  • [发明专利]韵律修改装置和方法及存储有韵律修改程序的记录介质-CN200810086741.0有效
  • 村濑健太郎;片江伸之 - 富士通株式会社
  • 2008-03-20 - 2008-09-24 - G10L13/08
  • 该韵律修改装置包括:真实话音韵律输入部,用于接收从人类发声中提取的真实话音韵律信息;规则韵律生成部,用于针对真实话音韵律信息中的至少包括要修改的音素音素串的部分,利用表示人类发声中的规则的或统计出的音素长度的数据来生成规则韵律信息(其具有确定音素之间的边界的规则音素边界和音素的规则音素长度);以及真实话音韵律修改部,其利用生成的规则韵律信息,重置真实话音音素边界,以使真实话音韵律信息中的要修改的音素音素串的真实话音音素边界和真实话音音素长度接近于人类发声的实际音素边界和实际音素长度,由此修改真实话音韵律信息
  • 韵律修改装置方法存储程序记录介质
  • [发明专利]一种语音合成方法、装置、设备及介质-CN202111138183.X在审
  • 张旭龙;王健宗 - 平安科技(深圳)有限公司
  • 2021-09-27 - 2021-12-31 - G10L13/08
  • 方法包括:通过训练后的语音合成模型对目标文本信息进行文本解析,得到目标文本信息音素序列;对目标文本信息音素序列中各个第一音素进行音素映射编码,得到各个第一音素的编码信息;根据各个第一音素音素时长,对各个第一音素的编码信息进行序列扩展,得到各个第一音素的扩展编码信息;根据各个第一音素的扩展编码信息和上一帧的声学特征,预测当前帧的声学特征;根据获取到的目标文本信息对应的待合成语音中所有帧的声学特征,合成目标文本信息对应的预测语音信息,可对音素序列和声学特征进行时间对齐,提高对齐准确度,进而提高语音合成的可靠性。
  • 一种语音合成方法装置设备介质
  • [发明专利]歌声生成方法、计算机设备和存储介质-CN202310479257.9在审
  • 陈梦;张超鹏;宗旋 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2023-04-26 - 2023-07-25 - G10H1/00
  • 所述方法包括:获取目标曲谱的音节信息、音符信息和连音符信息;根据音节信息、音符信息和连音符信息,确定目标曲谱的曲谱音素编码特征、曲谱音素时长和音素级别基频;根据曲谱音素编码特征、曲谱音素时长和音素级别基频,生成目标曲谱的曲谱音频;获取曲谱音频对应的帧级别基频和目标曲谱对应的曲谱音素信息,根据帧级别基频和曲谱音素信息,生成目标歌声音频。采用本方法能够通过解析曲谱确定曲谱信息,根据曲谱信息确定曲谱特征,根据曲谱特征生成目标曲谱的曲谱音频,基于曲谱音频和目标曲谱的音素信息,生成以预设音色演唱目标曲谱的歌声,提高合成歌声的自然度。
  • 歌声生成方法计算机设备存储介质
  • [发明专利]歌词音素发音时长的预测方法、设备和计算机程序产品-CN202210723111.X在审
  • 庄晓滨 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2022-06-24 - 2022-10-11 - G10L15/02
  • 本申请涉及一种歌词音素发音时长的预测方法、设备和计算机程序产品。本申请能够在原唱歌词的时长约束下,预测新歌词中的每个字中的音素时长,提高翻唱歌词时长预测准确度。该方法包括:确定原唱歌词,并获取目标歌词的字数;根据原唱歌词中每个字的时间戳以及目标歌词的字数,确定目标歌词中每个字的音节实际发音时长;其中,目标歌词中每个字对应的音节包括至少一个音素;分别对目标歌词中每个字的音素音素音素类型和音节实际发音时长进行编码,得到音素编码信息音素类型编码信息和音节实际发音时长编码信息;将音素编码信息音素类型编码信息和音节实际发音时长编码信息输入音素发音时长预测模型,得到每个音素的发音时长预测结果
  • 歌词音素发音预测方法设备计算机程序产品
  • [发明专利]设备唤醒方法、装置及计算机可读存储介质-CN202210174193.7在审
  • 赵惟肖;史润宇 - 北京小米移动软件有限公司
  • 2022-02-24 - 2023-09-05 - G10L15/22
  • 本公开涉及一种设备唤醒方法、装置及计算机可读存储介质,涉及设备控制领域,该方法包括:根据接收到的语音信息获取多个音素帧,每个音素帧的时长为预设时长,再将该多个音素帧输入预设的声学模型,以得到第一音素序列,该第一音素序列包括该多个音素帧对应的多个音素,以及每个音素的判定概率,而后在确定第一音素序列中的无效音素和/或缺失音素符合预设条件的情况下,根据该第一音素序列,以及该第一音素序列中的多个音素的判定概率确定语音信息的唤醒结果能够在不设置复杂解码器的情况下,实现对语音信息中的音素的识别,能够实现对音素级别语音唤醒技术的简化。
  • 设备唤醒方法装置计算机可读存储介质
  • [发明专利]一种融合词汇及音素发音特征的情感语音合成方法及系统-CN202110600732.4有效
  • 郑书凯;李太豪;裴冠雄 - 之江实验室
  • 2021-05-31 - 2021-11-02 - G10L13/10
  • 本发明属于人工智能领域,具体涉及一种融合词汇及音素发音特征的情感语音合成方法及系统,该方法为:通过录音采集设备,采集文本及情感标签,对所述文本进行预处理,获取音素音素对齐信息,生成分词及分词语义信息,分别计算并得到分词发音时长信息、分词发音语速信息、分词发音能量信息音素基频信息,分别训练分词语速预测网络、分词能量预测网络、音素基频预测网络,获取并拼接音素隐含信息、分词语速隐含信息、分词能量隐含信息音素基频隐含信息,合成情感语音。本发明通过将与情感发音有关的词汇及音素发音特征融合到端到端语音合成模型中去,能够使得合成的情感语音更加自然。
  • 一种融合词汇音素发音特征情感语音合成方法系统
  • [发明专利]一种语音数据分析方法及系统-CN202010374991.5在审
  • 王丹;庞永强 - 北京一起教育信息咨询有限责任公司
  • 2020-04-30 - 2020-08-25 - G10L15/02
  • 本申请提供了一种语音数据分析方法及系统,所述方法包括:获取用户的语音学习信息及语音信息;根据语音学习信息提取语音信息中的重点词,并提取重点词中的音素数据;根据预设声学模型对音素数据进行一一评分,得到重点词中每个音素数据的音素得分,根据重点词中每个音素数据的音素得分得到重点词的重点词发音得分;或者判断重点词发音得分是否小于预设单词发音值,若是,则判断重点词中每个音素数据的音素是否小于预设音素发音值,将小于预设音素发音值的音素数据作为错音音素数据,并将错音音素数据和错音音素数据对应的重点词进行不同标签显示。
  • 一种语音数据分析方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top