[发明专利]一种自动生成配音文字的方法、装置以及电子设备有效
申请号: | 201611196447.6 | 申请日: | 2016-12-22 |
公开(公告)号: | CN108228658B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 阳鹤翔 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G11B27/10 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 生成 配音 文字 方法 装置 以及 电子设备 | ||
本申请公开了一种自动生成配音文字的方法、装置以及电子设备。其中,所述生成配音文字的方法,包括:对音频信息进行识别,获取识别出的各个音频基本语义单位的起止时间信息;获取与所述音频信息对应的文本信息,并识别所述文本信息,从而获取文本基本语义单位;将各个所述音频基本语义单位的起止时间信息,记录到相应的所述文本基本语义单位中;对记录了所述起止时间信息的所述文本基本语义单位进行处理,生成对应所述音频信息的配音文字。采用上述方法,能够使动态歌词文件不再采用人工的方式进行制作,提高了制作的效率降低了制作成本,简化了制作的流程。
技术领域
本申请涉及计算机技术领域,具体涉及一种自动生成配音文字的方法;本申请同时涉及一种自动生成配音文字的装置以及一种电子设备。
背景技术
随着音频处理技术的发展,用户对试听体验有了更高的要求,不仅要求音频播放应用能够播放音频文件,还希望音频播放应用能够同步显示与音频文件相应的歌词文件。音频播放同步显示歌词功能使得人们在听到优美旋律的同时能够看到该音频文件的歌词,该功能已经成为了音频播放应用以及播放器的必备功能之一。
为了满足用户的需求,目前用于音频播放同步显示的歌词主要采用人工方式来进行的,人工边听音频边给歌词标注时间,为音频文件数据库中的每个音频文件生成相应的歌词文件,并将所生成的歌词文件导入到音频播放应用中,从而在播放音频文件时,同步显示相应地歌词文件。
由此可见,在现有的用于音频播放同步显示的歌词的制作方案下,采用人工方式生成歌词文件制作过程比较繁琐,不仅效率低且成本高。随着音频曲库规模的不断扩大,人工方式所存在的弊端显得日益严重。
发明内容
本申请提供一种自动生成配音文字的方法,以解决现有技术中的上述问题。本申请同时涉及一种自动生成配音文字的装置以及一种电子设备。
本申请实施例提供了一种自动生成配音文字的方法,所述自动生成配音文字的方法,包括:
对音频信息进行识别,获取识别出的各个音频基本语义单位的起止时间信息;
获取与所述音频信息对应的文本信息,并识别所述文本信息,从而获取文本基本语义单位;
将各个所述音频基本语义单位的起止时间信息,记录到相应的所述文本基本语义单位中;
对记录了所述起止时间信息的所述文本基本语义单位进行处理,生成对应所述音频信息的配音文字。
可选的,所述对记录了所述起止时间信息的所述文本基本语义单位进行处理,生成对应所述音频信息的配音文字,包括:
针对所述文本信息中每一单句,获取组成所述单句的文本基本语义单位;
根据已获取的所述文本基本语义单位中记录的起止时间信息,确定所述单句的起止时间信息;
将确定了起止时间信息的所述单句进行整合,形成对应所述音频信息,且具有每一单句的起止时间信息的配音文字。
可选的,所述针对所述文本信息中每一单句,获取组成所述单句的文本基本语义单位时,若所述文本基本语义单位中记录了至少两组起止时间信息,则按照起止时间信息的组数,分别形成组成所述单句的文本基本语义单位组。
可选的,在所述按照起止时间信息的组数,分别形成组成所述单句的文本基本语义单位组的步骤之后,包括:
根据预定的计算方法,对每一所述文本基本语义单位组中,各个文本基本语义单位的所有起止时间信息进行筛选,确定组成所述单句的文本基本语义单位组。
可选的,所述预定的计算方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611196447.6/2.html,转载请声明来源钻瓜专利网。