[发明专利]一种基于人类语音内容索引的音频和视频文件管理方法在审

专利信息
申请号: 201610212603.7 申请日: 2016-04-05
公开(公告)号: CN105912615A 公开(公告)日: 2016-08-31
发明(设计)人: 谭玉娟;晏志超 申请(专利权)人: 重庆大学
主分类号: G06F17/30 分类号: G06F17/30;G10L21/10
代理公司: 暂无信息 代理人: 暂无信息
地址: 400044 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种基于人类语音内容索引的视频和音频文件管理方法,该方法利用语音识别技术识别音频和视频文件中的人类语音,将其中的人类语音内容(例如:对话声音)转化为文本信息,利用不同环境下对话内容的唯一性特点,将该文本信息作为标识该视频或音频文件实质内容的一项重要数据。在视频或音频文件库中采用该文本信息做文件索引标记信息,便可以高效地检测出实质内容相同的音频或视频文件,快速地辨别出实质内容不同的视频或音频文件。
搜索关键词: 一种 基于 人类 语音 内容 索引 音频 视频文件 管理 方法
【主权项】:
一种基于人类语音内容索引的视频和音频文件管理方法,具体步骤为:(1)采用语音识别技术将视频和音频文件中的人类语音内容转换为文本文字信息;(2)使用(1)得到的文本文字信息来标识视频或音频文件的实质内容,若两个视频或两个音频文件的文本文字信息相同,则标记这两个视频或两个音频文件的实质内容相同,否则,则标记这两个视频或音频文件的实质内容不同。具体步骤为:(2.1)在视频或音频文件库中,采用(1)中得到的文本文字信息作为视频或音频数据库的文件索引标记信息;(2.2)对于某个视频或音频文件,使用(1)中得到的文本文字信息在视频或音频文件库中进行检索;(2.3)若存在具有相同文件索引标记信息(即(1)中得到的文本文字信息)的文件,则将(2.2)的文件和文件库中检索到的文件标记为具有相同实质内容的文件;否则,则标记(2.2)的文件为具有唯一实质内容的文件;(2.4)将(2.2)所指的文件及其文件索引标记信息更新至视频或音频文件库索引中。(3)对于(2.3)标记出的具有相同实质内容的视频或音频文件,采用一定的数据分布策略在多个区域之间或同一个区域内分布存储和管理(包括文件读,文件写,文件删除等多种文件操作)这些实质内容相同的视频或音频文件。其中区域可为服务器,机架,数据中心等硬实体或软实体。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610212603.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top