[发明专利]基于说话内容的说话者身份识别方法、装置及存储介质在审
申请号: | 201910305438.3 | 申请日: | 2019-04-16 |
公开(公告)号: | CN110136727A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 王健宗;孙奥兰 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/18;G10L17/00;G10L15/26 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 王迎;袁文婷 |
地址: | 518033 广东省广州市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 说话 文本信息 初始语音信号 存储介质 身份识别 语音信号 身份 目标语音信号 身份验证过程 语音识别技术 电话客户 获取目标 片段获取 人力物力 语音处理 准确率 拼接 验证 采集 转换 应用 服务 | ||
本发明涉及语音处理领域,提出一种基于说话内容的说话者身份识别的方法、装置及存储介质,其中的方法包括采集初始语音信号,其中,初始语音信号包含多个待确认目标的说话内容;通过语音识别技术将初始语音信号转换为与说话内容对应的文本信息;根据文本信息对说话者身份进行识别,获取与各个待确认目标对应的文本信息片段,说话者为多个待确认目标其中之一;根据文本信息片段获取与待确认目标对应的语音信号段并进行拼接,获取目标语音信号;根据目标语音信号对待确认目标的身份进行确认。本发明基于说话内容进行说话人身份的识别及验证,能够提高身份验证过程中的准确率,实现其在电话客户服务中的应用,节省人力物力。
技术领域
本发明涉及语音信号处理技术领域,尤其涉及一种基于说话内容的说话者身份识别方法、装置及计算机可读存储介质。
背景技术
根据研究表明,声纹虽然不如指纹、人脸这样,个体差异明显,但是由于每个人的声道、口腔和鼻腔(发音要用到的器官)也具有个体差异性。因为反映到声音上,也是具有差异性的。就比如说,当我们在接电话的时候,通过一声喂,我们就能准确的分辨出接电话的是谁,我们人耳作为身体的接收器生来就具有分辨声音的能力,那么我们也可以通过技术的手段,使声纹也可以向人脸、指纹那样作为“个人身份认证”的重要信息。
声纹识别(Voiceprint Recognition,VPR),也称为说话人识别(SpeakerRecognition),包括两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。说话人识别是给定说话者语音信息,以接受或拒绝说话者身份的过程,被广泛应用在银行系统,金融商业和语音安全控制中。
为此,说话人识别技术逐渐发展并得到普及,尤其在安全验证、电话银行中得到广泛应用。该技术要求在单信道-单一说话者情景下应用,即输入单一客户的语音信息,能够获得较好的验证效果。但是,在客户导向的企业中,说话人识别能够帮助客户解决紧急需要,并获得个性化服务,也可以帮助实现精准营销。但是,现有业内产品多为基于说话者声纹的识别,但这种方法在对话双方性别不同时效果较好,性别相同时,效果相对差。
例如,在电话客户服务平台上,在电话录音的单一信道上记录的是客户与客服的对话音频,因此,不能够直接通过说话人验证技术对电话录音信息进行客户身份验证,导致电话客户服务效率低,浪费大量的人力物力。
发明内容
本发明提供一种基于说话内容的说话者身份识别方法、装置及计算机可读存储介质,其主要目的在于通过将录制的对话音频用自动语音识别技术转换为文字信息,然后使用深度学习分类方法进行客户或客服的身份识别,最后,对客户音频片段进行拼接及对拼接后的音频片段进行身份验证,能够根据电话销售中客户与客服说话内容存在差异的应用场景,基于说话内容进行说话人识别及验证,提高身份验证过程中的准确率,实现其在电话客户服务中的应用,节省人力物力。
为实现上述目的,本发明提供一种基于说话内容的说话者身份识别方法,应用于电子装置,所述方法包括:
采集初始语音信号,其中,所述初始语音信号包含多个待确认目标的说话内容;
通过语音识别技术将所述初始语音信号转换为与所述说话内容对应的文本信息;
根据所述文本信息对说话者身份进行识别,获取与各个待确认目标对应的文本信息片段,所述说话者为所述多个待确认目标其中之一;
根据文本信息片段获取与所述待确认目标对应的语音信号段并进行拼接,获取目标语音信号;
根据所述目标语音信号对所述待确认目标的身份进行确认。
此外,优选地,所述通过语音识别技术将所述初始语音信号转换为与所述说话内容对应的文本信息包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910305438.3/2.html,转载请声明来源钻瓜专利网。