[发明专利]用于远程访问自动语音/说话人识别的服务器的便携式声接口有效

申请号：	98107970.9	申请日：	1998-05-08
公开（公告）号：	CN1229229A	公开（公告）日：	1999-09-22
发明（设计）人：	D·肯尼维斯基;S·H·米斯;C·普罗彻罗;P·S·普恩	申请（专利权）人：	国际商业机器公司
主分类号：	G10L9/00	分类号：	G10L9/00
代理公司：	中国专利代理(香港)有限公司	代理人：	王勇,王忠忠
地址：	美国***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	便携式语音信号预处理(SSP)装置具有,用于接收语音和背景噪声的麦克风,一个用于将接收到的噪声处理为特征向量的数字信号处理器(DSP),一个与通讯装置相连用于在通讯信道上传输的耦合器。一个自动语音/说话人识别(ASSR)服务器在通讯信道上接收预处理过的语音数据,并识别语音或说话人。一个带有便携式SSP装置和ASSR服务器的系统可被用于对远程的智能卡,磁卡或电子钱卡进行激活,重新设置,或改变PIN码。
搜索关键词：	用于远程访问自动语音说话识别服务器便携式接口
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一个便携式语音识别装置，包括：一个麦克风，用于把包括语音，无声，和背景噪声信号的声音转换为模拟信号；一个模数转换器，用于把该模拟信号转换为数字信号；一个数字信号处理器，用于从该数字信号产生表示所述语音的特征向量数据；一个声学耦合器，用于把该特征向量数据转换为声音信号，还用于与声音通讯装置相连接从而在通讯信道上传送该语音，便于在远处识别该语音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国际商业机器公司，未经国际商业机器公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/98107970.9/，转载请声明来源钻瓜专利网。

上一篇：在数字射频通信系统中接收信号的方法和装置
下一篇：动态随机存取存储器电容器及其下电极的制造方法

同类专利

用于远程访问自动语音/说话人识别的服务器的便携式声接口-98107970.9
发明人： D·肯尼维斯基;S·H·米斯;C·普罗彻罗;P·S·普恩 -专利权人：国际商业机器公司
申请日： 1998-05-08 - 公布日： 1999-09-22 - 主分类号：
摘要：便携式语音信号预处理(SSP)装置具有,用于接收语音和背景噪声的麦克风,一个用于将接收到的噪声处理为特征向量的数字信号处理器(DSP),一个与通讯装置相连用于在通讯信道上传输的耦合器。一个自动语音/说话人识别(ASSR)服务器在通讯信道上接收预处理过的语音数据,并识别语音或说话人。一个带有便携式SSP装置和ASSR服务器的系统可被用于对远程的智能卡,磁卡或电子钱卡进行激活,重新设置,或改变PIN码。

码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、-97197717.8
发明人：安德鲁·P·德雅科;毕宁 -专利权人：夸尔柯姆股份有限公司
申请日： 1997-07-31 - 公布日： 1999-09-22 - 主分类号：
摘要：用于在代数代码簿中选择代码矢量的方法和装置,其中用于编码器的分析窗口超过目标语音帧的长度。由感知加权滤波器(76)滤波输入信号。然后,设定滤波器以对于等于感知加权滤波器(76)的长度的采样数发出振铃,同时施加零输入矢量作为输入。通过扩展分析窗口,可以将两维冲激响应矩阵作为一维自相关矩阵存储在存储器(60,80)中,这大大简化了计算复杂性和节省了搜索所需的存储量。

用于传输语音信号的传输系统-98800461.5
发明人： R·陶里;A·J·格里茨 -专利权人：皇家菲利浦电子有限公司
申请日： 1998-01-27 - 公布日： 1999-07-14 - 主分类号：
摘要：在语音译码器(40)中,语音信号由每帧更新一次的多个预测参数表示。每帧包括多个子帧,其中由固定码本(52)和自适应码本(48)产生的激励信号被更新。为了提高语音质量,LPC系数内插器(46)对预测系数进行内插,以得到每个子帧的内插预测系数。根据本发明,预测系数的内插不是基于用于传输的预测系数(例如反射系数或对数面积比),而是基于线谱频率。

静态和非静态信号的鉴别-97101022.6
发明人： K·T·韦格伦 -专利权人：艾利森电话股份有限公司
申请日： 1994-05-11 - 公布日： 1999-06-09 - 主分类号：
摘要：鉴别器(24)鉴别静态和非静态信号。输入信号的能量E(Ti)在一系列窗Ti中计算出来。这些能量值存入缓冲器(52)中,根据这些存储值计算测试变量VT(54)。此测试变量包括缓冲器中最大能量值与最小能量值的比值。最后将该测试变量与静止状况极限γ加以比较。若测试变量超过该极限,就将输入信号视为非静态的。这种鉴别方法对鉴别移动无线电通信系统中的静态和非静态背景音特别有用。

个人计算机外设交互式玩具娃娃-97193462.2
发明人：丹·吉金尼斯 -专利权人：莱克斯特朗系统公司
申请日： 1997-02-27 - 公布日： 1999-06-02 - 主分类号：
摘要：一种对儿童寓教于乐的交互式系统,该系统利用象玩具娃娃(13)那样的交互式实体,该玩具娃娃上装有话筒(39)、扬声器(37)、用于驱动扬声器和话筒的控制电路,以及连接个人计算机(PC)的双向通信链路(15)。储存在计算机中的文稿数据控制玩具娃娃的活动和口语的发音,并且利用儿童通过玩具娃娃传递给个人计算机的响应控制对玩具娃娃的输出。在另一些实施方案中,交互式玩具娃娃还有伺服机构(17a,17b,19,20,21,23,25,27,29)为玩具娃娃提供动作,例如眼睛、嘴和肢体的动作,借助计算机检出并传送给玩具娃娃的命令可以使这些动作与不同文稿中的语言表达协调一致。在优选的实施方案中,环境和应用程序在CD－ROM盘上提供,该CD－ROM盘还为交互式玩具娃娃系统提供操作应用程序。系统可以适用范围广泛的功能性,例如使孩子熟悉外语、讲故事、成人与孩子以玩具娃娃为媒介间接地交谈等等。

说话者验证系统-96194550.8
发明人： R·J·曼蒙;凯文·法雷尔;马尼什·夏尔马;奈克·德旺;张晓宇;哈立德·阿萨雷;刘汉生 -专利权人：拉脱格斯大学
申请日： 1996-06-06 - 公布日： 1998-10-28 - 主分类号：
摘要：本发明涉及一种模式识别系统(图1),它使用数据组合,从而把来自多个提取特征(60、61、62)的数据与多个分类器(70、71、72)组合起来。利用以判别式为基础和以失真为基础的分类器,可准确地验证说话者的模式。可使用一种利用一组“留下一个”的训练数据的新方案,从而以减少的数据组对系统进行训练(图7A、7B、7C)。可使用减小信道效应的极点滤波方法(图11B)以及改善训练和测试数据之间相关性的仿射变换(图14)来改善提取的特征。

根据旋律转换歌声信号的装置-97122193.6
发明人：松本秀一 -专利权人：雅马哈株式会社
申请日： 1997-11-28 - 公布日： 1998-06-17 - 主分类号：
摘要：一种音频处理装置,包括多个输入装置,分别收集多个歌声,产生携载收集的歌声的一单个旋律的声音信号;多个输出端子,分别将这些声音信号传送给不同的音频处理;一转换电路,提供多个可相互转换的电路径以将这些声音信号分配给多个输出端子;及一控制路装置,检测这些单个旋律相对于一基准旋律的匹配程度以识别出这些声音信号,并据此控制该转换电路以开关这些电路径,从而将来自多个输入装置的识别出的声音信号传送给多个输出端子。

语音编码的方法和装置-96121977.7
发明人：饭岛和幸;西口正之;松本淳;大森士郎 -专利权人：索尼公司
申请日： 1996-10-26 - 公布日： 1997-08-13 - 主分类号：
摘要：一种编码装置，其中的输入语音信号划分成基本的(数据)块并且以编码结果的块作为单位。编码装置包括具有噪音代码簿121和执行CELP编码的编码单元120，矢量量化代码簿是由限幅高斯噪音产生的代码矢量和使用由限幅高斯噪音作为初始值产生的代码簿矢量通过查明获得的代码簿矢量构成的。该编码装置能对各种语音构成作最佳编码。

采用神经网络的语音识别系统和方法-95193473.2
发明人：沙-平·托马斯·王 -专利权人：摩托罗拉公司
申请日： 1995-04-25 - 公布日： 1997-05-28 - 主分类号：
摘要：用于识别孤立语词的语音识别系统包括用于进行模数转换和倒频谱分析的预处理电路(3)，和计算基于多项式展开的判别函数的一组神经网络(12)-(14)。该系统可使用硬件、软件或两者的结合的方式加以实现。所讲出的语词的语音波形得到分析并转换成数据帧序列。帧序列被划分为数据块，这些数据块广播给多个神经网络。神经网络使用这些数据块计算多项式的展开。神经网络的输出用于确定所说出的语词的标识。神经网络使用一种训练算法，这种算法不需要进行重复训练并对每一给定的训练样例集产生一个全局最小值。

优化隐藏的马尔科夫模型语音识别的方法、装置和无线电设备-96190239.6
发明人：威廉姆·M·库西诺;埃德沃德·斯莱格;马修·A·哈特曼 -专利权人：摩托罗拉公司
申请日： 1996-01-29 - 公布日： 1997-05-21 - 主分类号：
摘要：在基于统计的语音识别系统中，关键问题之一是选择与一个给定的特征观测值序列最佳匹配的隐藏马尔科夫模型。该问题一般是通过利用维特比或其他解码器进行最大似然(ML)、状态序列的计算来寻址的。噪声或不适当的训练可产生与隐藏马尔科夫模型而不是正确的模型相关联的ML序列。本发明的方法通过将标准ML状态序列得分(416)与从作为时间函数的ML得分的动态特性中获得的一个附加路径得分(418)相组合提供了改进的耐久性。当组合时，所述的两个得分形成了一个混合量度(420)，当由该解码器使用时，该量度优化正确隐藏马尔科夫模型的选择。

低延迟中位速率语音编码器、解码器及其方法-95106956.X
发明人：王政义;谢朝凯 -专利权人：财团法人工业技术研究院
申请日： 1995-05-29 - 公布日： 1996-08-28 - 主分类号：
摘要：语音信号先经听觉加权滤波器处理。滤波器的输入除原始语音信号外，尚包含重建的语音信号、重建的剩余信号和线性预测参数。处理所产生的信号称为剩余信号，减去短期预估装置产生的预测信号。其误差通过压缩/解压缩装置产生误差信号重建值。加上预测信号，合成重建剩余信号。信号经线性预测分析器，获得线性预测参数。参数输出至短期预测电路，与重建剩余信号作用产生预测信号，另外输出至听觉加权滤波器与听觉反向加权滤波器。

通信系统中降低传输噪声的方法-94191041.5
发明人：伍德森·戴尔·怀恩 -专利权人：美国电报电话公司
申请日： 1994-11-15 - 公布日： 1996-08-21 - 主分类号：
摘要：通过使用线性预测编码语音模型的交互评估以滤除噪声的信号处理过程，电信网络的服务可克服传输噪声带来的恼人的后果。语音模型滤波器使用了根据由话音活动检测器判定否为仅噪声帧的输入信号帧的取样值，对当前噪声功率谱密度的精确修改评估。使用线性预测编码语音模型以计算输入信号的独特的方法基于选定数目的最近过去帧和至多两个将来帧对当前帧进行帧内迭代。当无法从噪声源推知噪声信号时这种处理方法是有效的。

分组编码信号的方法和装置-94191789.4
发明人：肯尼斯·斯图尔特;迈克尔·科津 -专利权人：摩托罗拉公司
申请日： 1994-12-22 - 公布日： 1996-04-24 - 主分类号：
摘要：依靠对个别的语音编码器同其它语音编码器协调一致地作出编码率选择决策，使一个码分多址(CDMA)通信系统减小自干扰和增大系统容量。系统中利用感觉加权误码量度(401)作为一个编码率控制器(404)的输入，由该控制器向诸编码器(105)返送选定的编码率(402)。系统可给出最佳话音质量和系统容量，在容许其它编码器保持其码率下，可使特定的编码器能减小编码率、提高容量。当系统容量需暂时增大时，它可防止话音质量受到不必要的损失。

话音命令控制和校验系统-94191329.5
发明人：迈克尔·D·拉宾 -专利权人：美国电报电话公司
申请日： 1994-12-28 - 公布日： 1996-03-13 - 主分类号：
摘要：一个话音命令控制和校验系统及方法为每个授权用户存储一个或一系列由授权用户发出的话音命令或短语的语音模型。每个语音模型具有一个相关的动作分量，根据相应的话音命令的言词来规定授权用户所想要的特定动作。每个用户具有认定他或她所声明的身份的装置。当认定身份后，说出话音命令，系统将该话音命令的模型与与存储模型相对照并校验。在成功校验时，执行该命令。

利用置信度测度的自动语音识别(ASR)处理-94117734.3
发明人：道格拉斯·J·博瑞姆斯;迈克斯·S·斯道福勒 -专利权人：美国电报电话公司
申请日： 1994-10-26 - 公布日： 1996-01-31 - 主分类号：
摘要：自动语音识别(ASR)系统中的用户接口，是根据ASR过程结果的置信度级而动态控制的。系统利用ASR系统输出的置信度程度来区分易出误差的ASR译释和可能正确的译释，而该置信度确定为由ASR系统选定的第一和第二选择的置信度之差的函数。用户接口由于不确定信息的结果而由系统采取的显式校验步骤与当置信度较高时采取的行动不同。根据误译释的“结果”以及特定用户的系统历史性能给出不同的处理。

基于汉语发音特点的HMM语音识别技术-94105340.7
发明人：肖熙;王作英;战普明;姜进 -专利权人：北京超凡电子科技有限公司
申请日： 1994-05-20 - 公布日： 1995-11-22 - 主分类号：
摘要：本发明基于汉语发音特点的HMM语音识别技术，属于语音信号处理和识别技术领域。本发明将基于段长的隐含马尔可夫模型方法具体应用于计算机汉语语音识别，从而使计算机既能对特定人或非特定人汉语语音特点进行识别，又可识别孤立汉字、词组以及连续语音，而且在计算机语音识别系统中进行足够的语音训练后，达到语音识别的高识别率，高稳定性。

一种幼儿学话和家庭留言的电子装置-93214570.1
发明人：冯建涛 -专利权人：冯建涛
申请日： 1993-05-27 - 公布日： 1994-06-15 - 主分类号：
摘要：本实用新型属于一种语音录放装置，该语音录放装置主要由语音处理电路、存储器、话筒放大器、降噪滤波器、功率放大器和复位电路、放音触发器、录音触发器、存储器分区电路等电路组成。本实用新型提供的语音录放装置，具有幼儿语言学习和家庭留言功能。

自适应极值编码信号处理系统-89102158.2
发明人：阿里·维斯 -专利权人：阿里·维斯
申请日： 1989-02-22 - 公布日： 1989-12-20 - 主分类号：
摘要：一个处理模拟信号的装置，包括有用于检测该模拟信号极大值和极小值出现次数的检波器，由此产生出检波信号、用于对该模拟信号或检波信号提供实质上是随机噪声的噪声源，并且将该噪声叠加到这些信号上，而且具有在一个频段内含有比该模拟信号中的最高频率高得多的一些频率的宽带频谱，以及连接到在有噪声的情况下仅对该模拟信号极大值和极小值的出现次数以编码信号形式进行编码的编码器。该编码器具有比模拟信号带宽还要宽得多的带宽，并且该编码信号含有足以能使模拟信号从中再生的信息。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于远程访问自动语音/说话人识别的服务器的便携式声接口有效

专利文献下载