[发明专利]基于音频浓缩摘要的海量音频检索方法在审
申请号: | 201910019614.7 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109740015A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 胡健;王大勇;夏同飞;邵善阳;汤才宝;马福运 | 申请(专利权)人: | 安徽睿极智能科技有限公司 |
主分类号: | G06F16/63 | 分类号: | G06F16/63;G06F16/61 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 230000 安徽省合肥市高新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于音频浓缩摘要的海量音频检索方法,涉及安防监控领域。本发明包括如下步骤:选择文件夹,生成多线程执行浓缩任务,打开待浓缩的文件,读取音频帧并解码,得到裸的PCM数据,使用VAD算法对PCM裸数据进行判定,并进行语音识别生成摘要信息和音频索引文件,提供音频的检索和播放功能。本发明通过使用多线程并行方式对海量音频数据所在的文件夹进行浓缩,提取出有价值的语音和文字信息,并生成包含摘要信息的音频索引文件,用户可输入文本关键字进行快速检索,并可播放检索结果中的音频数据,大大提高了工作效率。 | ||
搜索关键词: | 浓缩 音频索引文件 文件夹 音频检索 音频数据 摘要信息 多线程 安防监控领域 读取 解码 并行方式 播放功能 工作效率 检索结果 快速检索 输入文本 文字信息 语音识别 音频帧 算法 判定 检索 语音 播放 | ||
【主权项】:
1.一种基于音频浓缩摘要的海量音频检索方法,其特征在于,包括如下步骤:步骤S01:获取待浓缩文件夹内所有的录像文件和音频文件,并生成若干个线程并行进行浓缩任务;步骤S02:在每一个浓缩任务中,打开一个待浓缩的文件;步骤S03:读取一个音频帧并进行解码,获取裸的PCM音频数据;步骤S04:使用VAD算法对一帧PCM裸数据进行判定,若判定为有效数据,则将本帧的序号作为摘要的起始序号;步骤S05:继续对下一帧PCM裸数据进行判定,直到找到判定为无效数据的那一帧为止,将前一帧的序号作为摘要的结束序号;步骤S06:对起始序列号和结束序列号之间的PCM裸数据进行语音识别,将识别的结果作为摘要的文字描述;步骤S07:判断待浓缩文件内音频是否全部读完;若是,则将所有生成的音频摘要信息保存到对应的音频索引文件中,将所有的音频数据保存到对应的浓缩文件中;若否,则返回执行步骤S03;步骤S08:每浓缩完成一个文件,将列出该文件以及对应的摘要信息;步骤S09:输入文字作为关键字进行检索。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽睿极智能科技有限公司,未经安徽睿极智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910019614.7/,转载请声明来源钻瓜专利网。
- 上一篇:截图的管理方法、终端设备和存储介质
- 下一篇:推荐信息的即时反馈方法及装置