[发明专利]使用语音识别来检测应答机有效
申请号: | 200780026479.4 | 申请日: | 2007-05-15 |
公开(公告)号: | CN101490741A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | A·埃西罗;C·M·费什尔;D·余;Y-Y·王;Y-C·朱 | 申请(专利权)人: | 微软公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/00;G10L15/06;H04M1/67 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈 斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 语音 识别 检测 应答 | ||
1.一种确定呼叫接听者是真实的个人还是应答机的计算机实现的方 法(200),所述方法包括:
从呼叫接听者接收可听响应并用语音识别器处理所述可听响应来提供 指示所识别的语音的文本形式的输出(202);以及
用分类器处理所述指示所识别的语音的文本形式的输出来提供指示所 述呼叫接听者是真实的个人还是应答机的输出(204),该处理基于对所述 指示所识别的语音的文本形式的输出的统计分析,
其中,所述语音识别器使用语言模型,所述分类器使用分类器模型, 所述语言模型和所述分类器模型都是以真实的个人和应答机所使用的短语 来训练的,
所述统计分析包括确定指示所识别的语音的文本形式的输出在统计上 是否与真实的个人所使用的短语或应答机所使用的短语相一致。
2.如权利要求1所述的方法(200),其特征在于,处理(204)包括 处理所述可听响应来查明与所述可听响应相关联的非文字特征(304、306、 308),以及使用所述非文字特征作为基础来提供指示所述呼叫接听者是真 实的个人还是应答机的输出。
3.如权利要求2所述的方法(200),其特征在于,处理(204)包括 查明所述可听响应的持续时间(306、308),以及使用所述可听响应的持 续时间作为基础来提供指示所述呼叫接听者是真实的个人还是应答机的输 出。
4.如权利要求2所述的方法(200),其特征在于,处理(204)包括 查明所述可听响应中最初是否存在无声(304),以及使用所述无声的存在 作为基础来提供指示所述呼叫接听者是真实的个人还是应答机的输出。
5.如权利要求4所述的方法(200),其特征在于,处理(204)包括 查明所述可听响应中最初是否存在相对于所选长度的时间段的无声(304), 以及使用所述无声的存在作为基础来提供指示所述呼叫接听者是真实的个 人还是应答机的输出。
6.如权利要求2所述的方法(200),其特征在于,处理(204)包括 使用关于所述语音识别器是否能够识别所述可听响应中的任何语音的指示 作为基础,来提供指示所述呼叫接听者是真实的个人还是应答机的输出。
7.如权利要求3所述的方法(200),其特征在于,处理(204)包括 在发言的持续时间在所选范围内时使用统计分析(312、314)。
8.如权利要求1所述的方法(200),其特征在于,处理(204)包括 在发言的持续时间在所选范围内时使用统计分析(312、314)。
9.如权利要求1所述的方法,其特征在于,还包括操作所述语音识别 器来检测所述呼叫接听者的插话事件,以及如果检测到插话事件则向所述 呼叫接听者重放消息,直到所述消息被完整播放为止(206)。
10.如权利要求9所述的方法,其特征在于,向所述呼叫接听者重放 所述消息(206)包括:如果所述呼叫接听者是所述应答机则向所述呼叫接 听者重放所述消息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780026479.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有心轴锁定组件的电动工具
- 下一篇:改进的燃料电池组件