[发明专利]基于音频浓缩摘要的海量音频检索方法在审
申请号: | 201910019614.7 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109740015A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 胡健;王大勇;夏同飞;邵善阳;汤才宝;马福运 | 申请(专利权)人: | 安徽睿极智能科技有限公司 |
主分类号: | G06F16/63 | 分类号: | G06F16/63;G06F16/61 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 230000 安徽省合肥市高新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 浓缩 音频索引文件 文件夹 音频检索 音频数据 摘要信息 多线程 安防监控领域 读取 解码 并行方式 播放功能 工作效率 检索结果 快速检索 输入文本 文字信息 语音识别 音频帧 算法 判定 检索 语音 播放 | ||
本发明公开了一种基于音频浓缩摘要的海量音频检索方法,涉及安防监控领域。本发明包括如下步骤:选择文件夹,生成多线程执行浓缩任务,打开待浓缩的文件,读取音频帧并解码,得到裸的PCM数据,使用VAD算法对PCM裸数据进行判定,并进行语音识别生成摘要信息和音频索引文件,提供音频的检索和播放功能。本发明通过使用多线程并行方式对海量音频数据所在的文件夹进行浓缩,提取出有价值的语音和文字信息,并生成包含摘要信息的音频索引文件,用户可输入文本关键字进行快速检索,并可播放检索结果中的音频数据,大大提高了工作效率。
技术领域
本发明属于安防监控领域,特别是涉及一种基于音频浓缩摘要的海量音频检索方法。
背景技术
在安防监控领域,随着监控设备数量的爆炸性增长,其存储的录像数据也呈几何级增长。在公安、刑侦等应用场景下,如果采用人工的方式对这些海量录像数据进行分析,效率将是极其低下的,以至于错过最佳破案时机。因此,如何从这些海量录像数据中挖掘出有价值的信息,以供快速检索和查证,已成为用户非常迫切的需求。
在目前已授权的专利中,如专利申请号为【CN201210520403.X】的一种用于具有静止画面视频的视频浓缩方法、专利申请号为【CN201210142026.0】的一种快速视频浓缩摘要方法,大多采用的视频浓缩摘要技术,提取出其中的背景和运动目标,并重建成新的视频图像序列。但录像数据中除了视频,还有音频。音频数据是视频数据的重要补充,能够帮助办案人员更好地理解事实真相。在某些情况下,如视频信号丢失、视频画面模糊等,音频数据可能是唯一的线索和证据。音频数据的特点是:大部分时间内可能都是静音和噪音数据,只有少数时间内包含真正有用的语音信息。为了提高办案人员的工作效率,快速检索海量的音频数据,对音频进行浓缩摘要,是很有必要的。
发明内容
本发明的目的在于提供一种基于音频浓缩摘要的海量音频检索方法,通过使用多线程并行方式对海量音频数据所在的文件夹进行浓缩,提取出有价值的语音和文字信息,并生成包含摘要信息的音频索引文件,用户能够通过输入关键字进行快速检索,解决了现有的音频数据分析效率低、分析难度大的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种基于音频浓缩摘要的海量音频检索方法,包括如下步骤:
步骤S01:获取待浓缩文件夹内所有的录像文件和音频文件,并生成若干个线程并行进行浓缩任务;
步骤S02:在每一个浓缩任务中,打开一个待浓缩的文件;
步骤S03:读取一个音频帧并进行解码,获取裸的PCM音频数据;
步骤S04:使用VAD算法对一帧PCM裸数据进行判定,若判定为有效数据,则将本帧的序号作为摘要的起始序号;
步骤S05:继续对下一帧PCM裸数据进行判定,直到找到判定为无效数据的那一帧为止,将前一帧的序号作为摘要的结束序号;
步骤S06:对起始序列号和结束序列号之间的PCM裸数据进行语音识别,将识别的结果作为摘要的文字描述;
步骤S07:判断待浓缩文件内音频是否全部读完;
若是,则将所有生成的音频摘要信息保存到对应的音频索引文件中,将所有的音频数据保存到对应的浓缩文件中;
若否,则返回执行步骤S03;
步骤S08:每浓缩完成一个文件,将列出该文件以及对应的摘要信息;
步骤S09:输入文字作为关键字进行检索。
优选地,所述步骤S01中,每个线程浓缩若干个文件,当一个文件浓缩完成,则开始浓缩下一个文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽睿极智能科技有限公司,未经安徽睿极智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910019614.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:截图的管理方法、终端设备和存储介质
- 下一篇:推荐信息的即时反馈方法及装置