[发明专利]兴趣区间抽取装置、兴趣区间抽取方法有效

申请号：	201180012516.2	申请日：	2011-10-28
公开（公告）号：	CN102782750A	公开（公告）日：	2012-11-14
发明（设计）人：	小沼知浩;川西亮一;上野山努	申请（专利权）人：	松下电器产业株式会社
主分类号：	G10L11/00	分类号：	G10L11/00;G10L15/04;G10L15/14
代理公司：	永新专利商标代理有限公司 72002	代理人：	徐殿军
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种兴趣区间抽取装置（104），根据动态图像文件中所包含的音频信号来抽取包括指定时刻（T0）的用户的兴趣区间，该兴趣区间抽取装置（104）具有：接口装置（109），取得指定时刻（T0）；似然度向量生成部（202），对于音频信号的每个第1单位区间计算表现多种音素各自的特征的各个锚模型（Ar）的似然度，并生成以计算出的各个似然度为分量的似然度向量（F）；以及兴趣区间抽取部（209），根据似然度向量（F）计算成为兴趣区间的候选的第1特征区间，并抽取包括指定时刻（T0）的第1特征区间的一部分区间作为兴趣区间。
搜索关键词：	兴趣区间抽取装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种兴趣区间抽取装置，根据动态图像文件中所包含的音频信号来抽取包括指定时刻的用户的兴趣区间，其特征在于，该兴趣区间抽取装置具有：锚模型存储单元，预先存储有用于表现作为基准的多种音素各自的特征的锚模型；指定时刻取得单元，取得所述指定时刻；似然度向量生成单元，对于音频信号的每个单位区间，使用所述锚模型求出相对于表现所述音频信号的特征量的特征量向量的似然度，并生成以各个似然度为分量的似然度向量；以及兴趣区间抽取单元，根据所述似然度向量计算成为兴趣区间的候选的候选区间，并抽取包括所述指定时刻的所述候选区间的全部或者一部分候选区间作为兴趣区间。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社，未经松下电器产业株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201180012516.2/，转载请声明来源钻瓜专利网。

同类专利

用于辨识环境声音的系统和方法-201280007505.X
发明人：黄奎雄;金泰殊;延奇宣 -专利权人：高通股份有限公司
申请日： 2012-01-24 - 公布日： 2013-10-23 - 主分类号： G10L11/00
摘要：本发明揭示一种用于在与服务器协作的客户端装置中辨识环境声音的方法。所述客户端装置包含客户端数据库，所述客户端数据库具有环境声音的多个声音模型和多个标记，所述多个标记中的每一者识别至少一个声音模型。所述客户端装置接收输入环境声音且基于所述输入环境声音而产生输入声音模型。在所述客户端装置处，确定所述输入声音模型与所述声音模型中的每一者之间的相似度值，以从所述客户端数据库识别类似于所述输入声音模型的一个或一个以上声音模型。从与所述所识别的声音模型相关联的标记中选择一标记，且基于所述选定标记的置信度水平而使所述选定标记与所述输入环境声音相关联。

声音信号检测系统-201210300815.2
发明人：高圣伟;钟宝华;李强;李欣;章永生 -专利权人：天津工业大学
申请日： 2012-08-23 - 公布日： 2012-12-19 - 主分类号： G10L11/00
摘要：一般都认为数字系统输出的信号质量是有所保证的，但是实际上由于系统内其他部分的干扰，声音信号高频杂波含量非常高，当其输出做为信号源时，如果没有经过滤波处理，检测系统无法将被测信号中有效信号检出或者根本检测不到信号，该发明的一种声音信号检测系统，前端加入了输入滤波电路，使其适应能力更强，可以对具有高频杂波的信号进行有效检测；本发明在输出部分还加入了隔直电容，由单片机产生的PWM波能够通过电容对后端系统产生有效的控制，同时该隔直电容防止单片机输出端的漏电流进入后端其他工作电路产生干扰信号，因此本发明的一种声音信号检测系统具有高效，稳定，适用范围广，输出噪声少的特性。

一种语音检测方法和系统-201110138406.2
发明人：缑晓彬;曹宁;许为 -专利权人：腾讯科技（深圳）有限公司
申请日： 2011-05-26 - 公布日： 2012-11-28 - 主分类号： G10L11/00
摘要：本发明提出一种语音检测方法和系统，其中方法包括：语音发送设备将语音数据封装成普通语音数据包及用于语音检测的检测语音数据包，所述检测语音数据包包含语音数据段和检测标识；语音发送设备将普通语音数据包和检测语音数据包发送至服务器；服务器将接收到的检测语音数据包发送至语音发送设备；语音发送设备对来自服务器的检测语音数据包进行解封装，形成语音数据，播放所述语音数据。本发明能够使发送方检测出本端语音传输到接收方之后的语音效果。

声音信号处理装置以及声音信号处理方法-200980159921.X
发明人：大谷猛;外川太郎;铃木政直;大田恭士 -专利权人：富士通株式会社
申请日： 2009-06-19 - 公布日： 2012-11-28 - 主分类号： G10L11/00
摘要：一种声音信号处理装置，具有：对声音信号以帧为单位进行时间频率变换，由此来计算声音信号的频谱的时间频率变换部；根据第1帧的频谱、与第1帧之前的第2帧的频谱，来计算第1帧的频谱与第2帧间的频谱的变化量的谱变化量计算部；和根据该谱变化量，来判定第1帧的声音信号中包含的噪声的种类的判定部。

兴趣区间抽取装置、兴趣区间抽取方法-201180012516.2
发明人：小沼知浩;川西亮一;上野山努 -专利权人：松下电器产业株式会社
申请日： 2011-10-28 - 公布日： 2012-11-14 - 主分类号： G10L11/00
摘要：一种兴趣区间抽取装置（104），根据动态图像文件中所包含的音频信号来抽取包括指定时刻（T0）的用户的兴趣区间，该兴趣区间抽取装置（104）具有：接口装置（109），取得指定时刻（T0）；似然度向量生成部（202），对于音频信号的每个第1单位区间计算表现多种音素各自的特征的各个锚模型（Ar）的似然度，并生成以计算出的各个似然度为分量的似然度向量（F）；以及兴趣区间抽取部（209），根据似然度向量（F）计算成为兴趣区间的候选的第1特征区间，并抽取包括指定时刻（T0）的第1特征区间的一部分区间作为兴趣区间。

一种婴儿哭声识别装置-201220130468.9
发明人：叶静萍;蔡江 -专利权人：武汉大学
申请日： 2012-03-31 - 公布日： 2012-10-31 - 主分类号： G10L11/00
摘要：本实用新型提供一种婴儿哭声识别装置，包括天线、机体；机体内部有控制电路板，控制电路板包括两两相连的数据处理模块、信号传输模块、电源模块；机体外部设置有屏幕、开关、电源接口；天线、屏幕均与数据处理模块相连，开关、电源接口均与电源模块相连。使用时，需要电脑的配合，本实用新型采集、处理婴儿的哭声后传给电脑，电脑上会显示相应的婴儿信息，护士可以在第一时间内根据婴儿的具体情况作出相应的措施，其提高了医护人员的工作效率，实用性强。

用于机动车辆的语音操纵装置以及用于选择话筒以运行语音操纵装置的方法-201210053612.8
发明人： K·罗德玛 -专利权人：帕拉贡股份公司
申请日： 2012-02-24 - 公布日： 2012-10-24 - 主分类号： G10L11/00
摘要：一种语音操纵装置具有：话筒(1，2，3)，其布置在机动车辆中；以及分析单元(4)，其可用来根据机动车辆中的声学条件来选择话筒(1，2，3)之一以作为运行语音操纵装置的基础。为了尽可能快速地选择最优地适于运行语音操纵装置的话筒：在分析单元(4)中，从两个话筒的信号中合成相关对(1，2；2，3)；为每个相关对(1，2；2，3)计算相关系数；为每个话筒检测能量值；为每个话筒检测语音信号在语音信号源(6)与该话筒之间的传播时间；以及根据当前相关系数、当前能量值、以及当前传播时间来选择如下的话筒：该话筒的信号当前最优地作为运行语音操纵装置的基础。

音乐搜索设备及方法、程序以及记录介质-201210107281.1
发明人：澁谷崇;安部素嗣 -专利权人：索尼公司
申请日： 2012-04-12 - 公布日： 2012-10-24 - 主分类号： G10L11/00
摘要：本发明提供了音乐搜索设备及方法、程序以及记录介质。指数计算单元基于变换到时频域的所述输入信号的每个区域的信号分量的强度和通过对所述信号分量的强度进行近似而获得的函数，计算所述信号分量的音调指数。相似度计算单元计算基于所述指数而获得的所述输入信号的每个区域中的特征量与基于对变换到所述时频域的所述参考信号计算出的指数而获得的所述参考信号的每个区域中的特征量之间的相似度。音乐识别单元基于所述相似度来识别所述输入信号中的音乐。本技术可应用于从输入信号中识别音乐的音乐搜索设备。

音乐片段检测设备和方法以及音乐信号检测设备-201210107008.9
发明人：东山惠祐;安部素嗣 -专利权人：索尼公司
申请日： 2012-04-12 - 公布日： 2012-10-24 - 主分类号： G10L11/00
摘要：本公开涉及音乐片段检测设备和方法以及音乐信号检测设备。基于被变换到时间频率域中的输入信号的每个区域的信号分量的强度(例如功率频谱)和通过逼近所述信号分量的强度而获得的函数(二次函数)，指标计算单元计算所述信号分量的音调指标。音乐确定单元基于音调指标确定输入信号的每个区域是否包括音乐。本技术可以应用于音乐片段检测设备，该音乐片段检测设备从其中音乐与噪声相混合的输入信号中检测音乐部分。

一种基于LPC及RBF神经网络的声音转换的方法-201210229540.8
发明人：张钦宇;潘振鹏;林威;王喆;付东松;张勇勇;黄立伟 -专利权人：哈尔滨工业大学深圳研究生院
申请日： 2012-07-04 - 公布日： 2012-10-17 - 主分类号： G10L11/00
摘要：本发明涉及语音信号处理领域，尤其涉及一种基于LPC及RBF神经网络的声音转换的方法，包括以下步骤A、对语音进行预处理；B、对浊音帧进行基频检测；C、对基频检测后的浊音帧进行转换；D、对转换后的基频进行浊音帧参量的提取；E、对提取到的浊音帧参量进行计算，求得一帧浊音帧，然后对该一帧浊音帧进行合成，得到转换后的浊音帧。本发明的有益效果是设计出一种高质量、计算量适中语音转换技术方案，可用于保密通信中进行语音个性化的伪装，应用在多媒体娱乐中，用于语音增强系统，尤其对于声带等发音器官存在病变或者损伤。

一种无线局域网的语音质量测定方法-201210172045.8
发明人：王万良;张科娜;姚信威;顾熙仁;徐新黎;赵燕伟 -专利权人：浙江工业大学
申请日： 2012-05-25 - 公布日： 2012-10-03 - 主分类号： G10L11/00
摘要：一种无线局域网的语音质量测定方法，包括以下步骤：步骤1，建立如（1）式碰撞概率表达式；将基于IEEE802.11e无线局域网的节点输入输入所述碰撞概率表达式；步骤2，根据Markov链的性质，得到如（2）式的发送概率、碰撞概率、退避状态转移概率之间的关系式；步骤3，根据退避计数器减一的条件得到如（3）式的退避状态转移概率的表达式；步骤4，基于步骤1~3得到的三个表达式组成的方程组，解得碰撞概率p的值；步骤5，转化碰撞概率p，E-Model的最终结果R值，主观语音质量评价MOS值三者之间的关系，即得到语音质量。本发明提供一种有效提高准确度的基于IEEE802.11e无线局域网的语音质量测定方法。

一种音频信号检测方法和装置-201210151383.3
发明人：王喆 -专利权人：华为技术有限公司
申请日： 2009-10-15 - 公布日： 2012-09-26 - 主分类号： G10L11/00
摘要：本发明实施例公开了一种音频信号检测方法和装置，对输入的音频信号进行前景/背景检测，对检测到的背景信号帧进一步根据音乐特征值结合判定法则进行检测，从而能够检测出背景音乐，提高语音/音乐分类器的分类性能。

重叠语音检测方法和系统-201110053946.0
发明人：尹悦燕;鲁耀杰;王磊;史达飞;郑继川 -专利权人：株式会社理光
申请日： 2011-03-07 - 公布日： 2012-09-19 - 主分类号： G10L11/00
摘要：本发明提供了一种重叠语音的自动检测方法和系统，该方法采用贝叶斯信息准则确定重叠语音的多个语音片段中仅仅包含单独说话人语音的语音片段，并为属于同一说话人的语音片段赋予同一个标识。从各个属于同一类语音片段中随机选择各类语音片段的采样数据进行合并获得能够体现所有语音重叠的可能的各种合并结果。然后基于所获得单人说话的语音片段和通过合并获得的多人说话的重叠语音片段建立单人语音片段模型和重叠语音片段模型，最后采用单人语音片段模型和重叠语音片段模型来检测各个语音片段，并基于检测结果来标注所述语音片段。

个性化的声音处理系统和设备-201110058997.2
发明人：谢津 -专利权人：谢津
申请日： 2011-03-12 - 公布日： 2012-09-19 - 主分类号： G10L11/00
摘要：本发明公开了一种面向个人听觉的声音处理系统；本系统通过测试个人的听力，结合多年的人耳听觉以及心理学的研究数据，分析出个人听觉特征，建立个人听力模型，从而评估用户的听力健康状况；根据所评估的听力健康状况，本系统可以完成对各类音乐、歌曲的个性化处理，以达到有利于用户听力健康的，提高听觉体验的效果；本系统还可以对各类音乐、歌曲进行声学特征分析，基于用户听觉与心理特征，为用户搜索歌曲，向用户推荐音乐，达到个性化营销的目的；本系统不仅可以通过互动式语音应答或在网络上实现，还可以在终端设备上进行集成；本系统广泛适用于互联网行业和电子产品行业。

三维音频编码中双耳线索感知特性的自适应测量方法-201210074321.7
发明人：胡瑞敏;王恒;涂卫平;刘进峰;王晓晨;杨玉红;高戈 -专利权人：武汉大学
申请日： 2012-03-20 - 公布日： 2012-08-15 - 主分类号： G10L11/00
摘要：为了解决三维音频中声道数过多、数据量过大的问题，通过将各声道下混并提取表达空间信息的双耳线索，可以有效降低三维音频的编码码率。本发明公开了一种三维音频编码中双耳线索感知特性的自适应测试方法，采取迂回逼近的方法，根据测试结果自适应调整双耳线索变化步长，来定位双耳线索的恰可感知差异，指导空间音频的量化编码。

辅音区间检测装置及辅音区间检测方法-201210022303.4
发明人：明智明子;山边孝朗 -专利权人： JVC建伍株式会社
申请日： 2012-02-01 - 公布日： 2012-08-08 - 主分类号： G10L11/00
摘要：本发明提供一种辅音区间检测装置及辅音区间检测方法，在较高的噪声电平环境下也可高精度地检测辅音区间，辅音区间检测装置(110)具有：帧化部(120)，以预先确定的帧单位截取输入信号，生成帧化输入信号；频谱生成部(122)，将帧化输入信号从时间区域变换为频率区域，生成集中了每个频率的频谱的频谱图；平均导出部(126)，导出频谱图中的、连续的预先确定的每个带宽的平均能量即各频带平均能量；辅音判断部(128)，将导出的各频带平均能量之间进行比较，越高频带的各频带平均能量成为越高的能量时，判断帧化输入信号中含有辅音。

声音信号处理设备、声音信号处理方法和程序-201210006581.0
发明人：广江厚夫 -专利权人：索尼公司
申请日： 2012-01-11 - 公布日： 2012-07-25 - 主分类号： G10L11/00
摘要：本发明公开了声音信号处理设备、声音信号处理方法和程序。该声音信号处理设备包括方向估计单元和方向跟踪单元，该方向估计单元针对以预定时间单位划分的每个块检测指示声音信号的声源方向的一个或多个方向点，该方向跟踪单元将多个块之间彼此连接方向点并且检测其中声音活动的片段。方向估计单元包括：生成死角形成滤波器和指向性束形成滤波器的空间滤波器生成单元、生成作为方向和增益之间的对应关系数据的死角形成模式的死角形成模式生成单元、生成作为方向和增益之间的对应关系数据的指向性束形成模式的指向性束形成模式生成单元、以及检测指示声音方向并包含死角形成模式中的局部最小部和指向性束形成模式中的局部最大部的方向点的方向点检测单元。

数字录音完整性检测方法-201210006398.0
发明人：沈一峰;贾珈;蔡莲红 -专利权人：清华大学
申请日： 2012-01-10 - 公布日： 2012-07-18 - 主分类号： G10L11/00
摘要：本发明公开了数字录音完整性检测方法，包括：步骤1，对待检测的携带有电网频率的数字录音进行向下采样；步骤2，对采样数据进行带通滤波；步骤3，对滤波后的音频序列进行分帧处理，逐帧提取电网频率并计算相应的电网频率相位，得到一个电网频率相位序列；步骤4，根据电网频率相位的特征值检测数字录音的完整性。本发明可以对携带有电网频率的数字录音提取电网频率相位特征，判断数字录音是否存在插入、删除、替换等篡改，并定位篡改位置，实现数字录音的完整性检测。本发明可用于法庭取证中数字录音证据的完整性认证。

G.729A压缩语音流信息隐藏检测装置及检测方法-201110435163.9
发明人：李松斌;黄永峰 -专利权人：清华大学
申请日： 2011-12-22 - 公布日： 2012-07-11 - 主分类号： G10L11/00
摘要：本发明公开一种G.729A压缩语音流信息隐藏检测装置，至少包括压缩语音流映射音素序列模块、音素序列特征提取模块组、分类器装置以及结果集成模块，其中；压缩语音流映射音素序列模块接收外部输送来的压缩语音流，映射成音素序列并输出；音素序列特征提取模块组分别提取音素序列的音素向量空间特征向量和音素状态转移一阶马尔科夫特征向量并输出；分类器装置基于训练集对不同特征向量分别训练分类器，然后对于未知类别的样本使用训练获得分类器进行分类并输出分类结果；结果集成模块对多个分类器的输出结果进行集成并输出作为最终的隐写检测结果。应用于检测在基于G.729A标准的语音编码过程中使用经CNV算法优化划分的分组矢量码本进行QIM信息隐藏的检测。

基于说话人分割与聚类的多说话人语速估计方法-201110403577.3
发明人：李艳雄;徐鑫;贺前华 -专利权人：华南理工大学
申请日： 2011-12-07 - 公布日： 2012-07-04 - 主分类号： G10L11/00
摘要：基于说话人分割与聚类的多说话人语速估计方法，它涉及一种估计多说话人语速的方法。本发明的估计多说话人语速的方法：首先读入语音流；接着检测上述语音流中的说话人改变点，根据这些改变点将语音流分割成多个语音段；再对上述语音段进行说话人聚类，把相同说话人的语音段按顺序拼接在一起，得到说话人个数以及各个说话人的语音；最后分别估算各个说话人语音的时长及其所包含的字数，估计出各个说话人的语速。与目前基于语音识别的单说话人语速估计方法相比，本方法不但可以估计多说话人的语速，而且速度更快。

基于激光多普勒干涉的语音检测系统-201110459324.8
发明人：曾华林;周燕;何军;李丽艳 -专利权人：中国科学院半导体研究所
申请日： 2011-12-31 - 公布日： 2012-07-04 - 主分类号： G10L11/00
摘要：本发明公开了一种语音检测系统。该语音检测系统中，激光通过两个声光调制器产生的差值来实现光学频率调制，从而将待测干涉信号与低频环境扰动信号相分离，并且降低了电路的处理速度以及采集卡的采集速度，同时，因为频率降低的比较多，数据量也要少很多，因此进而减少了系统工作的数据量，提高了系统工作效率。

基于激光多普勒干涉的语音检测系统-201110458258.2
发明人：曾华林;周燕;何军;李丽艳;张勤 -专利权人：中国科学院半导体研究所
申请日： 2011-12-31 - 公布日： 2012-07-04 - 主分类号： G10L11/00
摘要：本发明公开了一种语音检测系统。本发明通过在迈克尔逊干涉仪的参考臂上加入压电陶瓷(PZT)进行光学调制，周期性地改变参考光和信号光的光程差，从而实现相位调制。光电探测器将干涉信号转化为电信号并送入数据采集卡，采样数据通过数字PGC(相位生成载波)算法进行解调并输出。本发明保留迈克尔逊干涉仪结构简单紧凑优点的基础上，以较低的代价获得了良好的抗干扰性能，能够在常规工作条件下获得较好的语音信噪比和分辨率。

语音监听的设备和方法-201110371791.5
发明人：曾华林;周燕;何军;李丽艳;张勤 -专利权人：中国科学院半导体研究所
申请日： 2011-11-21 - 公布日： 2012-06-13 - 主分类号： G10L11/00
摘要：本发明公开了一种语音监听的设备和方法。该语音监听设备包括：机械振动传感模块，用于感知由于原始语音而引起的墙体、地面或两者的固体附着物的机械振动信号，并将该机械振动信号转换为电信号；信号处理模块，与机械振动传感模块相连接，用于从电信号中还原出原始语音。本发明中，获取语音信号不再需要在室内预先安装传感器，减少暴露的可能性，同时该方法主动性强，可以随时改变探测的位置。

音频事件检测方法和装置-201010590438.1
发明人：刘昆;吴伟国;卢鲤;赵庆卫 -专利权人：索尼公司;中国科学院声学研究所
申请日： 2010-12-06 - 公布日： 2012-06-06 - 主分类号： G10L11/00
摘要：基于长时特性的音频事件检测装置和方法。所述方法包括如下步骤：将输入音频流分成一系列的小段；对每个段提取短时和长时特征；并且根据所提取的短时和长时特征，得到关于音频流的分类结果。

声音判断装置及声音判断方法-201110375314.6
发明人：山边孝朗 -专利权人： JVC建伍株式会社
申请日： 2011-11-23 - 公布日： 2012-05-30 - 主分类号： G10L11/00
摘要：本发明提供声音判断装置及声音判断方法，无论噪声等级大小均测出输入信号的声音区间。声音判断装置(100)具有：帧化部(120)，以帧单位截取输入信号，生成帧化输入信号；频谱生成部(122)，变换帧化输入信号，生成集中了每个频率的频谱的频谱图；峰值检测部(132)，判断频谱图的各频谱与分割频带中含有频谱的分割频带中的各频带能量的能量比是否超过第1阈值；声音判断部134，根据判断结果，判断帧化输入信号是否是声音；频率平均部126，导出频谱图的各分割频带中的频谱的频率方向的平均能量；时间平均部130，按照每个分割频带，导出各频带能量，即平均能量的时间方向的平均。

听力检测方法及系统-201010543686.0
发明人：郭韵璇 -专利权人：财团法人雅文儿童听语文教基金会
申请日： 2010-11-08 - 公布日： 2012-05-23 - 主分类号： G10L11/00
摘要：本发明提供一种听力筛检及监测的方法，包括：对受测者分次进行多个音频测试，从而建立一听力检测数据表。其中各音频测试包括：在预定距离处，向受测者发出一音频，并判断该受测者对于该音频的反应；若该音频未通过测试，则将该预定距离递减一特定值，再对该受测者发出该未通过测试的音频；在该听力检测数据表中记录该受测者对该音频所具有反应的距离；以及依据该听力检测数据表，检查和调整助听辅助设备(如助听器音量或人工电子耳频率)，对受测者的听力范围或听能距离取得概括性的了解、或建议是否进一步接受详细听力检查、耳科检查等。长期重复建立听力检测数据表，可对受测者听力状况和助听器效能进行持续监控，并提供警示，特别是对还不善表达的学龄前听力受损儿童。

声音分类装置、方法、程序及集成电路-201180002867.5
发明人：小沼知浩;石田明 -专利权人：松下电器产业株式会社
申请日： 2011-03-15 - 公布日： 2012-05-23 - 主分类号： G10L11/00
摘要：使用音频信号对运动图像进行分类。取得音频信号，针对取得的音频信号所包含的规定时间长度的多个区间的各个区间，提取作为与声音的频率分布有关的特征的区间特征，对提取的区间特征和各个基准区间特征进行比较，计算表示区间特征和基准区间特征之间的相关程度的区间类似度。针对取得的音频信号，提取基于在多个区间的各个区间中计算出的多个区间类似度的、与多个区间有关的特征即综合特征，比较提取的综合特征和基准综合特征，基于其结果对该音频信号进行分类。然后，将该分类结果用于运动图像的分类。

基准模型适应装置、集成电路、AV设备、在线自适应方法以及其程序-201180002465.5
发明人：贾磊;张丙奇;沈海峰;马龙;小沼知浩 -专利权人：松下电器产业株式会社
申请日： 2011-04-19 - 公布日： 2012-05-23 - 主分类号： G10L11/00
摘要：本发明提供一种在利用AV流中的音频流来执行AV流的分类等的装置中，对执行该分类时所使用的声音空间基准模型进行在线自适应调节的装置以及其方法。该装置将所输入的音频流分割成具有相同声音特征的片段数据，并对所分割得到的片段数据的单一概率模型进行估计。其后，针对所估计的单一概率模型与到此为止所存储的其他的声音特征的单一概率模型执行聚类，来生成新的声音空间的基准模型。

声音识别装置以及声音识别方法-201180002629.4
发明人：吉冈元贵;芳泽伸一 -专利权人：松下电器产业株式会社
申请日： 2011-01-07 - 公布日： 2012-05-23 - 主分类号： G10L11/00
摘要：噪音去除装置(1500)具有：麦克风(2400)，接受输入的声音信号；DFT分析部(2402)，分析所述声音信号的频率信号；相位曲线计算部(1602(j))，计算相位曲线，该相位曲线与所述频率信号的相位的时间变化进行近似；相位距离判断部(1601(j))，对所述相位曲线与所述频率信号的相位之间的误差进行计算；以及声音提取部(1503(j))，基于所述误差对所述声音信号是否是周期声音的信号进行识别。

音频处理装置和方法以及程序-201110317773.9
发明人：内野学;高桥秀介;井上晃 -专利权人：索尼公司
申请日： 2011-10-11 - 公布日： 2012-05-16 - 主分类号： G10L11/00
摘要：本公开涉及音频处理装置和方法以及程序。该音频处理装置包括：音频信号获取单元，其获取乐曲的音频信号；特征值提取单元，其以时间序列从音频信号获取单元获取的音频信号中提取预定类型的特征值；变化点检测单元，其检测其中特征值提取单元以时间序列提取的特征值的变化量变为大于预定阈值的变化点；符尾分析单元，其基于特征值提取单元以边界为变化点检测单元检测到的变化点的块为单位提取的特征值，分析音频信号的符尾地点；以及符尾信息输出单元，其输出符尾分析单元分析的符尾地点作为符尾信息。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L11-00 不限定于G10L 15/00至G10L 21/00单独一组中的语音或音频特征的测定或检测
G10L11-02 .检测有无语音信号
G10L11-04 .语音信号的音调测定
G10L11-06 .语音信号的浊音和清音之间的鉴别

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]兴趣区间抽取装置、兴趣区间抽取方法有效

专利文献下载