[发明专利]一种电话录音未接通原因识别方法有效
申请号: | 201910076136.3 | 申请日: | 2019-01-26 |
公开(公告)号: | CN109658939B | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 吴昊;庞在虎;朱风云;陈博 | 申请(专利权)人: | 北京灵伴即时智能科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/22;G10L15/06;H04M1/65;H04M3/42;H04M3/487;G06F16/63 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电话录音 接通 原因 识别 方法 | ||
1.一种针对未接通电话原因分析的数据库构建方法,包括如下步骤:
获取一定数量的未接通电话录音;
对未接通电话录音进行未接通原因标注,得到未接通电话录音-未接通原因标注数据库;
从未接通电话录音中提取音频指纹特征序列,并以对应的未接通原因作为键值,得到未接通电话录音-音频指纹特征数据库;对于单个录音文件,以各帧音频指纹联合各帧时间信息构成整个录音文件的指纹特征序列;
对未接通电话录音进行语音识别得到文本信息,再对文本信息进行未接通原因文本分类建模,得到未接通提示音文本分类模型并存入数据库;
根据在线信令或语音内容标注未接通原因;
所述数据库基于哈希表索引结构,所述哈希表索引结构的索引键值为音频指纹特征,所述哈希表索引结构的被索引单元内容为键值所对应的音频帧信息,所述音频帧信息包括所在未接通录音的文本信息和对应音频帧在录音中的位置;
还包括数据库更新方法,具体包括如下步骤:
用新增的未接通电话录音和未接通电话原因,来更新未接通电话录音-未接通原因标注数据库;
用新增的未接通电话录音及其音频指纹,来更新未接通电话录音-音频指纹特征数据库;
用新增的未接通电话录音及其文本信息,来更新未接通原因的文本分类模型;
用新增的未接通电话录音及其信令信息,来更新未接通原因的信令表;
所述新增的未接通电话录音指能够识别出未接通原因的未接通电话录音;
若所述新增的未接通电话录音中存在未被匹配的片段,取出所述片段作为对应未接通原因的训练特征序列更新未接通电话录音-音频指纹特征数据库。
2.如权利要求1所述的一种针对未接通电话原因分析的数据库构建方法,其特征在于:所述音频指纹特征序列以定长的时频域差分符号编码作为单帧语音信号的音频指纹。
3.一种电话未接通原因识别方法,包括:
通过信令标注未接通原因;
若未能通过信令分类得到原因,则从待识别电话录音中提取音频指纹特征序列,并利用所述序列在音频指纹数据库中进行检索;如找到匹配的指纹,则根据指纹键值中的未接通原因标签,为待识别电话进行未接通原因标注;
若未能找到匹配的指纹,通过自动语音识别将音频内容识别为文本内容,基于所述文本内容利用文本分类方法,在未接通原因文档分类模型中进行分类,用分类得到的未接通原因分类结果标注所述待识别电话录音;
对未接通电话录音逐帧提取音频指纹,得到待识别电话录音音频指纹序列;
对所述待识别电话录音音频指纹序列,在音频指纹数据库中进行单帧模糊检索,得到候选原始录音音频指纹特征的特征帧;
对所述候选原始录音音频指纹特征的特征帧进行整合,并与待识别电话录音音频指纹序列进行序列匹配,得到候选原始录音匹配序列集合;
将所述有序的候选原始录音匹配序列集合在未接通电话录音-未接通原因数据库中进行检索,选择出多个未接通原因候选;
对所述多个未接通原因候选进行筛选,得到最可能的电话未接通原因;
进行所述单帧模糊检索时,根据频带能量确定可能被干扰而出现失配的若干指纹位数,通过对位数组合取反生成一系列扩充候选指纹,联合原始指纹一起进行检索。
4.如权利要求3所述的一种电话未接通原因识别方法,其特征在于:在进行所述音频指纹特征整合与序列匹配时,首先计算所述候选原始录音音频指纹特征的特征帧与待匹配电话录音的特征帧在各自序列中的相对位移,当在相同相对位移下的匹配数量在原始电话录音中的占比满足阈值要求时,将具有相同相对位移的特征帧整合为数据库中原始电话录音中的片段,即为候选原始录音匹配序列,并将所述匹配数量在原始电话录音中的占比作为所述候选原始录音匹配序列的匹配命中率得分。
5.如权利要求4所述的一种电话未接通原因识别方法,其特征在于:对所述多个未接通原因候选进行筛选时,利用所述候选原始录音匹配序列的匹配命中率得分和各候选未接通原因的累积得分得到匹配得分,用所述匹配得分对候选未接通原因进行排序,如得分最高者高于预先设定的决策阈值,则选择为最终的未接通原因结果;所述累积得分是指将所述有序的候选原始录音匹配序列集合在数据库中进行检索时,对匹配上的部分的相似度评价。
6.如权利要求5所述的一种电话未接通原因识别方法,其特征在于:所述决策阈值的设定方法为:通过一组独立于训练数据的测试数据,计算所述测试数据在音频指纹数据库中实际未接通原因和其他未接通原因的匹配得分分布,按照最优区分性原则计算阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京灵伴即时智能科技有限公司,未经北京灵伴即时智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910076136.3/1.html,转载请声明来源钻瓜专利网。