[发明专利]一种自动生成配音文字的方法、装置以及电子设备有效
申请号: | 201611196447.6 | 申请日: | 2016-12-22 |
公开(公告)号: | CN108228658B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 阳鹤翔 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G11B27/10 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 生成 配音 文字 方法 装置 以及 电子设备 | ||
1.一种自动生成配音文字的方法,其特征在于,包括:
对音频信息进行识别,获取识别出的各个音频基本语义单位的起止时间信息,其中,所述音频基本语义单位为单字和/或单词;
获取与所述音频信息对应的文本信息,并识别所述文本信息,从而获取文本基本语义单位;
将各个所述音频基本语义单位的起止时间信息,记录到相应的所述文本基本语义单位中;
对记录了所述起止时间信息的所述文本基本语义单位进行处理,生成对应所述音频信息的配音文字;
其中,针对所述文本信息中每一单句,若组成所述单句的文本基本语义单位中记录了至少两组起止时间信息,则按照起止时间信息的组数,分别形成组成所述单句的文本基本语义单位组,对每一所述文本基本语义单位组中,各个文本基本语义单位的所有起止时间信息进行筛选,确定组成所述单句的文本基本语义单位组,将所述单句进行整合,形成所述配音文字。
2.根据权利要求1所述的自动生成配音文字的方法,其特征在于,所述对记录了所述起止时间信息的所述文本基本语义单位进行处理,生成对应所述音频信息的配音文字,包括:
针对所述文本信息中每一单句,获取组成所述单句的文本基本语义单位;
根据已获取的所述文本基本语义单位中记录的起止时间信息,确定所述单句的起止时间信息;
将确定了起止时间信息的所述单句进行整合,形成对应所述音频信息,且具有每一单句的起止时间信息的配音文字。
3.根据权利要求1所述的自动生成配音文字的方法,其特征在于,在所述按照起止时间信息的组数,分别形成组成所述单句的文本基本语义单位组的步骤之后,包括:根据预定的计算方法,对每一所述文本基本语义单位组中,各个文本基本语义单位的所有起止时间信息进行筛选,确定组成所述单句的文本基本语义单位组,所述预定的计算方法,包括:
计算各个所述文本基本语义单位组内,每一文本基本语义单位中的起始时间与所述文本基本语义单位的上一个文本基本语义单位的终止时间之间的时间间距,获取各个所述文本基本语义单位组中所述起始时间与所述终止时间的时间间距的和,将所述时间间距的和作为所述文本基本语义单位组的误差值。
4.根据权利要求3所述的自动生成配音文字的方法,其特征在于,所述对每一所述文本基本语义单位组中,各个文本基本语义单位的所有起止时间信息进行筛选,确定组成所述单句的文本基本语义单位组,包括:
对各个所述文本基本语义单位组进行过滤,保留误差值低于预设的阈值的文本基本语义单位组。
5.根据权利要求4所述的自动生成配音文字的方法,其特征在于,在所述保留误差值低于预设的阈值的文本基本语义单位组的步骤之后,包括:
计算保留的所述文本基本语义单位组内,每一文本基本语义单位中的起始时间大于所述文本基本语义单位的上一个文本基本语义单位的终止时间的次数,获取该次数最大的文本基本语义单位组。
6.根据权利要求1-5任意一项所述的自动生成配音文字的方法,其特征在于,所述识别所述文本信息获取文本基本语义单位,包括:
从所述文本信息中,按照每句内的每个字的顺序进行识别获取所述文本信息中的文本基本语义单位。
7.根据权利要求6所述的自动生成配音文字的方法,其特征在于,在将各个所述音频基本语义单位的起止时间信息,记录到相应的所述文本基本语义单位中时,若所述音频基本语义单位的起止时间信息为空值,则使与所述音频基本语义单位相应的所述文本基本语义单位的取值为空值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611196447.6/1.html,转载请声明来源钻瓜专利网。