[发明专利]一种音频、视频内容的采集方法和检索方法无效

申请号：	200610091162.6	申请日：	2006-07-04
公开（公告）号：	CN101102240A	公开（公告）日：	2008-01-09
发明（设计）人：	王建波	申请（专利权）人：	王建波
主分类号：	H04L12/28	分类号：	H04L12/28
代理公司：	暂无信息	代理人：	暂无信息
地址：	511400广东省广州市番禺区***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频视频内容采集方法检索
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种音频、视频内容的采集方法，以及一种音频、视频内容的检索方法。

背景技术

早在二十世纪末，科学家就预言二十一世纪将是信息的时代，特别是随着计算机技术和网络技术的发展，极大的扩展了信息的传播途径和速度。早期在图书馆中查阅大量的纸质文献的方法费时费力，将逐步被电子检索所替代，一台大型的存储服务器就可以超过一个规模庞大的图书馆的文献量。同时，随着技术的发展，信息不再仅仅包括了文字资料，更多将会是更为直观的音频文件、视频文件；其中视频文件也是音频文件与图像文件的结合。但是，现有技术无法将音频或视频文件中的声音转变为文字。

现有的检索方法在检索文字资料非常快捷方便，但是对于大量的音频文件和视频文件中的音频或视频文件却无能为力。例如，用户需要在一个长达数小时的音频或视频文件中检索其中的声音片断(例如其中的一句话或几句话)，现有方法将无能为力，用户只能浪费大量时间通篇浏览整个音频或视频文件。如果用户无法得知自己所需的声音片断位于哪一个音频文件或视频文件中，面对大量的音频和视频文件，更是无从下手进行检索。

发明内容

针对现有技术中存在的缺点和不足，本发明的目的是提出一种音频、视频内容的采集方法，能够将音频、视频文件中的声音转化为文字；同时本发明还提出一种音频、视频内容的检索方法，能够使用户能够在音频或视频文件检索到自己所需的声音片断，以及该声音片断在该音频、视频文件中的准确位置。

为了达到上述目的，本发明提出一种音频、视频内容的采集方法，包括：

(1)将音频文件或视频文件中的声音文件分割成声音片断；

(2)将步骤(1)所得的每一声音片断进行识别，得到与声音对应的文字。

其中，所述步骤(1)具体为：通过静音技术，将音频或视频文件中的每一句话分割为一个声音片断。

其中，所述步骤(1)还包括：记录每一声音片断在该声音文件中对应的起始时间和结束时间。

其中，所述步骤(2)可以为：通过语音识别软件，将每一声音片断进行语音识别，得到与声音片断对应的文字。

其中，所述步骤(2)还可以为：通过速记方法，将每一声音片断进行语音识别，得到与声音片断对应的文字。

同时，本发明还提出了一种音频、视频内容的检索方法，包括：

(A)将声音文件分割成声音片断，并记录所述的每一声音片断在该声音文件中对应的起始时间和结束时间；

(B)将步骤(A)所得的每一声音片断进行识别，得到与声音对应的文字；

(C)生成声音与文字的对应关系表，该对应关系表中包含声音片断对应的文字，以及每一声音片断在该声音文件中对应的起始时间和结束时间；

(D)用户使用所需声音片断对用的文字，在步骤(C)所得的生成声音与文字的对应关系表进行检索。

其中，所述步骤(A)具体为：通过静音技术，将音频或视频文件中的每一句话分割为一个声音片断，并记录每一声音片断在该声音文件中对应的起始时间和结束时间。

其中，所述步骤(B)具体为：通过语音识别软件或通过速记方法，将每一声音片断进行语音识别，得到与声音片断对应的文字。

其中，所述步骤(C)具体为：生成声音与文字的对应关系表，所述的对应关系表中包括该声音文件的所有声音片断，以及每一声音片断对应的文字，以及每一声音片断在该声音文件中的起始时间和结束时间。

本发明提出的音频、视频内容的采集方法能够将声音转化为文字；本发明还提出一种音频、视频内容的检索方法，使用户能够在音频、视频文件中进行检索，解决了现有技术中无法检索的难题。

具体实施方式

下面对本发明做进一步说明。

本发明提出了一种音频、视频内容的采集方法，包括：

(1)将音频或视频文件分割成声音片断；

(2)将步骤(1)所得的每一声音片断进行语音识别，得到与声音对应的文字。

其中，所述步骤(1)可以为：通过静音技术，将音频或视频文件中的每一句话分割为一个声音片断，并记录所述的每一声音片断在该音频或视频文件中对应的起始时间和结束时间。静音技术是现有对音频或视频文件进行分段的一种常用方法。静音技术能够检测到声音的停顿，如果停顿超过预先设定一间隔时间，则认为声音中的一句话结束。以此可以将音频或视频文件中的每一句话分割为一个声音片断。现有技术中分割声音片断的方法不限于静音技术，除此之外还有很多种，在此不一一赘述。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于王建波，未经王建波许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200610091162.6/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L12-00 数据交换网络
H04L12-02 .零部件
H04L12-28 .以通路配置为特征的，例如LAN[局域网]或WAN[广域网]
H04L12-50 .电路交换系统，即系统在通信期间通路具有完全永久性
H04L12-54 .存储转发交换系统
H04L12-64 .混合交换系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种音频、视频内容的采集方法和检索方法无效

专利文献下载