[发明专利]音频问答库构建方法、音频问答方法及相关装置在审

申请号：	202310234315.1	申请日：	2023-03-09
公开（公告）号：	CN116226437A	公开（公告）日：	2023-06-06
发明（设计）人：	鲁俊	申请（专利权）人：	上海喜马拉雅科技有限公司
主分类号：	G06F16/632	分类号：	G06F16/632;G06F16/683;G06F18/22
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	张欣欣
地址：	201100 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频问答构建方法相关装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及计算机技术领域，提供一种音频问答库构建方法、音频问答方法及相关装置。通过从多个音频对应的音频文本中选取多个关键段落；一个关键段落对应一个音频片段；并利用预先训练的生成模型生成每个关键段落对应的全部初始问句；对于每个关键段落，利用预设模型计算关键段落与其每个初始问句的第一相似度并获取第一相似度大于第一预设阈值的标准问句，得到每个关键段落对应的标准问句；基于每个标准问句对应的全部关键段落，获得每个标准问句对应的全部音频片段的信息得到音频问答库。通过生成模型和预设模型获得标准问句，并基于关键段落建立标准问句与音频片段的对应关系，以构建高质量的音频问答库，提高了音频问答的准确性。

技术领域

本发明涉及计算机技术领域，具体而言，涉及一种音频问答库构建方法、音频问答方法及相关装置。

背景技术

在音频内容平台中具有海量的音频资源，用户可以通过提问的方式获取感兴趣的音频，通过构建音频问答库可以快速地向用户进行反馈，而音频问答库的构建会影响反馈音频的准确性，所以如何构建音频问答库是十分重要的。

发明内容

有鉴于此，本发明的目的在于提供一种音频问答库构建方法、音频问答方法及相关装置。

为了实现上述目的，本发明采用的技术方案如下：

第一方面，本发明提供一种音频问答库构建方法，所述方法包括：

从多个音频对应的音频文本中选取多个关键段落；一个所述关键段落对应一个音频片段；

利用预先训练的生成模型生成每个所述关键段落对应的全部初始问句；

对于每个所述关键段落，利用预设模型计算所述关键段落与其每个初始问句的第一相似度，并获取所述第一相似度大于第一预设阈值的标准问句，得到每个所述关键段落对应的标准问句；

基于每个所述标准问句对应的全部关键段落，获得每个所述标准问句对应的全部音频片段的信息，得到音频问答库。