[发明专利]音频摘要生成方法、装置、电子设备及可读存储介质在审
申请号: | 202210463130.3 | 申请日: | 2022-04-28 |
公开(公告)号: | CN114842850A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 奚雪蕾;鲁俊;刘徐顺;刘洋 | 申请(专利权)人: | 上海喜马拉雅科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/20;G10L15/06;G10L25/51;G06F16/33;G06F16/35;G06F16/65;G06F16/68;G06F16/683;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 戴尧罡 |
地址: | 201100 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 摘要 生成 方法 装置 电子设备 可读 存储 介质 | ||
本发明的实施例提供了一种音频摘要生成方法、装置、电子设备及可读存储介质,涉及计算机技术领域。通过从目标音频对应的语音识别文本中获取多个目标关键句,该目标关键句表征目标关键句的内容与目标音频的内容相匹配的书面完整语句。然后从多个目标关键句选取出至少一个作为摘要侯选句,该摘要侯选句表征目标音频对应的表述通顺的总结性内容。如此可以根据目标音频对应的语音识别文本自动生成对应的摘要侯选句,免除了现有技术为目标音频人工书写摘要的人力成本和时间成本。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种音频摘要生成方法、装置、电子设备及可读存储介质。
背景技术
如今互联网资讯类内容的消费正蓬勃发展,每天都有海量新内容生成。在音频场景下,向用户推荐音频是基于音频标题与音频简介的内容与用户标签的匹配度进行的,用户利用关键词进行音频搜索也是通过关键词与音频标题与音频简介的内容的匹配度得到的搜索结果。这两种均没有涉及到音频摘要,但是,音频摘要可以体现音频内容的精彩关键部分,能够向用户展示音频的精华部分或是根据用户需求定位至摘要部分的关键内容。
但是,现有技术并未存在自动生成音频摘要的相关技术,而人工听取音频书写摘要耗费的人力成本和时间成本都很高。
发明内容
本发明的目的在于提供一种音频摘要生成方法、装置、电子设备及可读存储介质,以改善现有技术存在的问题。
本发明的实施例可以这样实现:
第一方面,本发明提供一种音频摘要生成方法,包括:
从目标音频对应的语音识别文本中获取多个目标关键句;所述目标关键句表征所述目标关键句的内容与所述目标音频的内容相匹配的书面完整语句;
从多个所述目标关键句选取出至少一个作为摘要侯选句,所述摘要侯选句表征所述目标音频对应的表述通顺的总结性内容。
在可选的实施方式中,所述从目标音频对应的语音识别文本中获取多个目标关键句的步骤,包括:
从所述语音识别文本中提取多个第一关键句;所述第一关键句表征所述第一关键句的内容与所述目标音频的内容相匹配的完整语句;
利用序列标注模型,分别对每个所述第一关键句存在的标点错误信息进行识别,并对每个标点错误信息进行修正,获得全部修正后的第一关键句;
分别将每个所述修正后的第一关键句输入端到端改写模型,得到全部所述目标关键句;所述端到端改写模型用于将输入文本序列中的口语化表述部分转化为书面表述,以得到所述目标关键句。
在可选的实施方式中,所述从所述语音识别文本中提取多个第一关键句的步骤,包括:
利用分类模型从所述语音识别文本中筛选出至少一个备选句子;所述备选句子表征表述完整且语法正确的句子;
基于多个评估维度,分别获取每个备选句子的综合评分;所述多个评估维度包含所述备选句子的重要程度、与所述目标音频所属领域的匹配程度、与所述目标音频的相关程度、词汇丰富程度中的至少一个或组合;
根据全部所述综合评分,从至少一个所述备选句子中确定出所述第一关键句。
在可选的实施方式中,所述从多个所述目标关键句选取出至少一个作为摘要侯选句的步骤,包括:
若识别出任意一个所述目标关键句包含专有名词错误,则结合专有名词信息,对每个所述专有名词错误进行修正;所述专有名词信息是所述目标音频的标题信息和/或简介信息中包含的;
利用GPT2模型计算每个修正后的目标关键句的通顺度评分;
获取所述每个修正后的目标关键句与标题信息的相似度信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海喜马拉雅科技有限公司,未经上海喜马拉雅科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210463130.3/2.html,转载请声明来源钻瓜专利网。