[发明专利]语音区间检测器无效
| 申请号: | 200710147109.8 | 申请日: | 2007-08-30 |
| 公开(公告)号: | CN101154378A | 公开(公告)日: | 2008-04-02 |
| 发明(设计)人: | 山本幸一;河村聪典 | 申请(专利权)人: | 株式会社东芝 |
| 主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L15/04 |
| 代理公司: | 永新专利商标代理有限公司 | 代理人: | 王英 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 区间 检测器 | ||
技术领域
本发明涉及一种语音区间(speech-duration)检测器,其根据输入的声音信号来检测语音的始端和尾端。
背景技术
一种典型的语音区间检测方法(一种语音区间检测器)基于针对每个20至40毫秒的帧提取的短时功率(short-time power)(以下称为“功率”)的包络的上升/下降来检测语音区间的始端和尾端。这样的对语音区间的始端和尾端的检测是通过使用日本专利No.3105465中公开的有限状态机(FSA)来进行的。
然而,根据日本专利No.3105465中公开的有限状态机(FSA),使用单个时间控制参数来检测每个始端和尾端。当在语音区间的适当的尾端(正确尾端)之后突然出现噪音时,由于该突发噪音的影响,不利的是,要检测的尾端迟于正确尾端而被检测到。
要注意的是,对于该问题可以考虑的对策是,将尾端检测时间降低到短于从正确尾端到突发噪音的时长。然而,当仅降低尾端检测时间时,一个包括双辅音的单词,例如“Sapporo”,会被检测为分开的区间,也就是,存在的问题是,无法将一个单词之中的无声与发声结束之后的无声区分开来。
发明内容
根据本发明的一个方面,一种语音区间检测器包括:特征提取单元,用于提取输入的声音信号的特征;始端检测单元,用于当一个其中该特征超出阈值的区间持续了第一时长时,将该区间的始端检测为一个语音区间的始端;尾端候选检测单元,用于当在检测到该语音区间的始端之后一个其中该特征低于该阈值的区间持续了第二时长时,将该区间的始端检测为语音尾端候选点;以及尾端候选确定单元,用于当其中该特征超过阈值的区间并未持续第一时长、而同时从在该语音尾端候选点处进行的测量开始经过了第三时长时,将该语音尾端候选点确定为该语音区间的尾端。
根据本发明的另一个方面,一种语音区间检测器包括:特征提取单元,用于提取输入的声音信号的特征;始端候选检测单元,用于当一个其中该特征超出阈值的区间持续了第四时长时,将该区间的始端检测为语音始端候选点;始端确定候选单元,用于当从该语音始端候选点开始测量、并且一个其中该特征超出阈值的区间持续了第五时长时,将该语音始端候选点确定为一个语音区间的始端;以及尾端检测单元,用于当在确定了该语音区间的始端之后一个其中该特征低于阈值的区间持续了第六时长时,将该区间的始端检测为该语音区间的尾端。
附图说明
图1是示出根据本发明的第一实施例的语音区间检测器的硬件构造的方框图;
图2是示出该语音区间检测器的功能构造的方框图;
图3是一个有限状态机的构造的状态转变图;
图4是观测到的功率包络和该有限状态机的状态转变的例子的图表;
图5是根据本发明的第二实施例的语音区间检测器的功能构造的方框图;
图6是一个有限状态机的构造的状态转变图;以及
图7是观测到的功率包络和该有限状态机的状态转变的例子的图表。
具体实施方式
下面将参照图1至4来说明根据本发明的第一实施例。图1是根据第一实施例的语音区间检测器的硬件构造的方框图。根据本实施例的语音区间检测器通常使用有限状态机(FSA)来检测一个语音区间的始端和尾端。
如图1所示,该语音区间检测器1例如是一台个人计算机,并且包括作为该计算机的主单元并集中控制每个单元的中央处理单元(CPU)2。通过总线5连接到CPU 2的有:只读存储器(ROM)3,其作为只读存储器,在其中存储有例如BIOS;以及随机存取存储器(RAM)4,其可重写地存储有各种数据。
连接到总线5的有:硬盘驱动器(HDD)6,其存储有各种程序;CD-ROM驱动器8,作为一种读取作为分发的程序的计算机软件的机构,其读取光盘(CD)-ROM 7中的信息;通信控制器10,其控制语音区间检测器1和网络9之间的通信;输入设备11,其例如是键盘或鼠标,命令各种操作;显示单元12,其显示各种信息,其例如是通过I/O(未示出)的阴极射线管(CRT)或液晶显示器(LCD)。
由于RAM 4具有可重写地存储各种数据的特性,因此其用作CPU 2的工作区,例如,作为缓冲器。
图1中示出的CD-ROM 7实现了本发明中的存储介质,并且存储有操作系统(OS)或各种程序。CPU 2通过使用CD-ROM驱动器8读出存储在CD-ROM 7中的程序,并将其安装在HDD 6中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710147109.8/2.html,转载请声明来源钻瓜专利网。





