[发明专利]一种自动生成配音文字的方法、装置以及电子设备有效

申请号：	201611196447.6	申请日：	2016-12-22
公开（公告）号：	CN108228658B	公开（公告）日：	2022-06-03
发明（设计）人：	阳鹤翔	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06F16/683	分类号：	G06F16/683;G11B27/10
代理公司：	北京清源汇知识产权代理事务所(特殊普通合伙) 11644	代理人：	冯德魁
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种自动生成配音文字方法装置以及电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种自动生成配音文字的方法、装置以及电子设备。其中，所述生成配音文字的方法，包括：对音频信息进行识别，获取识别出的各个音频基本语义单位的起止时间信息；获取与所述音频信息对应的文本信息，并识别所述文本信息，从而获取文本基本语义单位；将各个所述音频基本语义单位的起止时间信息，记录到相应的所述文本基本语义单位中；对记录了所述起止时间信息的所述文本基本语义单位进行处理，生成对应所述音频信息的配音文字。采用上述方法，能够使动态歌词文件不再采用人工的方式进行制作，提高了制作的效率降低了制作成本，简化了制作的流程。

技术领域

本申请涉及计算机技术领域，具体涉及一种自动生成配音文字的方法；本申请同时涉及一种自动生成配音文字的装置以及一种电子设备。

背景技术

随着音频处理技术的发展，用户对试听体验有了更高的要求，不仅要求音频播放应用能够播放音频文件，还希望音频播放应用能够同步显示与音频文件相应的歌词文件。音频播放同步显示歌词功能使得人们在听到优美旋律的同时能够看到该音频文件的歌词，该功能已经成为了音频播放应用以及播放器的必备功能之一。

为了满足用户的需求，目前用于音频播放同步显示的歌词主要采用人工方式来进行的，人工边听音频边给歌词标注时间，为音频文件数据库中的每个音频文件生成相应的歌词文件，并将所生成的歌词文件导入到音频播放应用中，从而在播放音频文件时，同步显示相应地歌词文件。

由此可见，在现有的用于音频播放同步显示的歌词的制作方案下，采用人工方式生成歌词文件制作过程比较繁琐，不仅效率低且成本高。随着音频曲库规模的不断扩大，人工方式所存在的弊端显得日益严重。

发明内容

本申请提供一种自动生成配音文字的方法，以解决现有技术中的上述问题。本申请同时涉及一种自动生成配音文字的装置以及一种电子设备。

本申请实施例提供了一种自动生成配音文字的方法，所述自动生成配音文字的方法，包括：

对音频信息进行识别，获取识别出的各个音频基本语义单位的起止时间信息；

获取与所述音频信息对应的文本信息，并识别所述文本信息，从而获取文本基本语义单位；

将各个所述音频基本语义单位的起止时间信息，记录到相应的所述文本基本语义单位中；