[发明专利]言语内容分析系统和言语内容分析方法有效
申请号: | 201480060938.0 | 申请日: | 2014-09-18 |
公开(公告)号: | CN105723449B | 公开(公告)日: | 2019-12-06 |
发明(设计)人: | 池昌真 | 申请(专利权)人: | 系统翻译国际有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08 |
代理公司: | 11018 北京德琦知识产权代理有限公司 | 代理人: | 郭艳芳;王琦<国际申请>=PCT/KR2 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 录取 语音 数据 核心 提取 言语 内容 分析 系统 利用 索引 方法 | ||
1.一种言语内容分析系统,其特征在于,包括:
索引部,用于输入语音数据并按照帧单位执行音素基准的语音识别来形成音素格,对由多个帧构成的限制时间的帧生成被分割的索引信息,其中被分割的索引信息包括按不同的限制时间的帧形成的音素格;
索引数据库,用于分别存储由所述索引部生成的被分割的索引信息,从而能够按不同的被分割的索引信息进行索引;
检索部,用于将用户输入的核心语作为检索语,对索引数据库中存储的被分割的索引信息通过音素基准的比较而检索与所述检索语相一致的音素串;以及
分析部,用于通过所述检索部检索的检索结果分析主题语并输出给用户,从而能够对所述语音数据的言语内容进行分析,
其特征在于,所述索引部包括:
特征向量提取部,用于从帧单位的语音数据提取特征向量;
音素识别部,用于使用所述特征向量提取部提取的特征向量,执行基于帧同步的音素识别并生成对应的音素串;
候补群形成部,用于输入所述音素识别部生成的音素串,并随着帧单位的时间推移而生成音素识别的候补群;
音素格形成部,用于从所述候补群形成部生成的音素串候补群中执行逆时间计算来选择一个音素串候补群,并形成对应的音素格;以及
索引控制部,用于控制所述特征向量提取部、所述音素识别部、所述候补群形成部以及所述音素格形成部,从而对整个语音数据执行控制以按不同的所述限制时间并且在所述限制时间内按不同的帧单位形成音素单位的网格,为使这样形成的音素格能够各按不同的限制时间被索引,执行控制以使其以按不同的限制时间被分割的索引信息存储于所述索引数据库。
2.根据权利要求1所述的言语内容分析系统,其特征在于,所述索引控制部包括:
语音检测器,用于示出是否从语音数据中检测出语音;
计时器,用于对语音数据的执行音素识别的音素的时间位置进行计时;
限时器,当所述语音检测器检测出语音区段时,用于从所述计时器检测出相应语音区段开始计时时间,从而对所述限制时间进行计时;以及
动作控制器,用于在所述限时器计时的限制时间内,执行控制以对所述语音检测器检测出的有效的语音区段按照帧单位执行音素识别并形成音素格,从而作为被分割的索引信息存储于所述索引数据库。
3.根据权利要求2所述的言语内容分析系统,其特征在于,当对所述语音检测器检测出的有效的语音区段,到达所述限时器计时的所述限制时间时,所述动作控制器执行控制以叠加之前语音区段中的特定时间或特定帧的语音区段,从而从相应帧开始作为与新的限制时间对应的语音区段执行音素识别。
4.根据权利要求3所述的言语内容分析系统,其特征在于,所述检索部包括:
检索结果历史数据库,用于存储所述检索部检索的检索结果,当对用户输入的检索语存在有已处理的检索结果时,将其传送给所述分析部;
发音串生成器,用于生成与用户输入的检索语对应的音素单位的发音串;
检索语数据库,用于存储所述检索语和与所述检索语对应的多个文脉关键字;
动态整合处理器,用于使用所述发音串生成器生成的发音串,对所述索引数据库中存储的被分割的索引信息检索相一致的音素串,从而选定第一次候补的语音区段;以及
验证器,用于对所述动态整合处理器选定的第一次候补的语音区段,通过声学模型判断一致与否并决定一个语音区段,将被决定的语音区段和与该语音区段相关的信息存储于所述检索结果历史数据库的同时输出给所述分析部。
5.根据权利要求4所述的言语内容分析系统,其特征在于,所述动态整合处理器通过动态整合算法判断所述被分割的索引信息的音素串和所述发音串的一致与否,当通过所述动态整合算法进行判断时,如果其整合度为阈值以上则判断为相一致。
6.根据权利要求4所述的言语内容分析系统,其特征在于,对于成为候补的语音区段,所述验证器对检索语的音素串以三音子模型为基准,按照基于音素串的帧单位将语音区段分配为音素模型的状态信息,求出关于对三音子模型的观测概率值和对单音子模型的观测概率值的比率的累积值,然后进行标准化而计算出可靠度值,然后基于标准化的可靠度值判断是否对所述语音区段输出为最终检索的结果物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于系统翻译国际有限公司,未经系统翻译国际有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480060938.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:设有安全无效组件的输送装置
- 下一篇:无滴漏油瓶
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置