[发明专利]一种基于内容的语音文件检索方法和系统在审
申请号: | 201510588899.8 | 申请日: | 2015-09-16 |
公开(公告)号: | CN106021249A | 公开(公告)日: | 2016-10-12 |
发明(设计)人: | 张树坤 | 申请(专利权)人: | 展视网(北京)科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了信息检索技术领域中的一种基于内容的语音文件检索方法及系统。其中方法包括以下步骤:预置素材文件的XML对象数据库;获取各语音数据的语音特征量和时码,将各文本字符与对应语音的特征量和时码关联,形成语音库;把语音库中的语音文件转化为声学模型序列化码、音素码、次文字单元、和语音识别结果并进行分割,作为元素形成第一语音检索单元;把输入的查询词转化为声学模型序列化码、音素码、次文字单元、和语音识别结果并进行分割,作为元素形成第二语音检索单元;在第一语音检索单元和第二语音检索单元之间进行匹配,根据该匹配程度来确定匹配结果。上述系统包括:预置装置,转化装置、分割装置、语音检索单元形成装置、匹配装置。 | ||
搜索关键词: | 一种 基于 内容 语音 文件 检索 方法 系统 | ||
【主权项】:
一种基于内容的语音文件检索方法,其特征在于,包括以下步骤:预置素材文件或节目文件的XML对象数据库,所述XML对象中包括描述视音频数据及对应文本属性的XML元数据;获取各语音数据的语音特征量和时码,将各文本字符分别与对应语音的特征量和时码进行关联,形成语音库;把语音库中的语音文件转化为声学模型序列化码、音素码、次文字单元、和语音识别结果;对第一转化步骤所转化的声学模型序列化码、音素码、次文字单元、语音识别结果进行分割;把在第一分割步骤中所分割的声学模型序列化码、音素码、次文字单元、语音识别结果作为元素形成第一语音检索单元;把输入的查询词转化为声学模型序列化码、音素码、次文字单元、和语音识别结果;对在第二转化步骤中所转化的声学模型序列化码、音素码、次文字单元、语音识别结果进行分割;把在第二分割步骤中所分割的声学模型序列化码、音素码、次文字单元、语音识别结果作为元素形成第二语音检索单元;在第一语音检索单元和第二语音检索单元之间进行匹配,以确定查询词与语音文件的匹配程度,根据该匹配程度来确定匹配结果;在搜索结果界面上展示所述视音频信息及文本信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于展视网(北京)科技有限公司,未经展视网(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510588899.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于电视终端的室内空气数据采集方法及装置
- 下一篇:智能调光玻璃
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法