[发明专利]基于智能外呼机器人的语音数据处理方法及装置在审
| 申请号: | 202210954076.2 | 申请日: | 2022-08-10 |
| 公开(公告)号: | CN115567645A | 公开(公告)日: | 2023-01-03 |
| 发明(设计)人: | 李伦军;周国华;赵景鹤;李剑;宋鑫龙;蒋仕坚 | 申请(专利权)人: | 科大讯飞华南有限公司 |
| 主分类号: | H04M3/527 | 分类号: | H04M3/527;G10L15/22;G10L15/04;G10L15/08 |
| 代理公司: | 广州恒成智道知识产权代理有限公司 44575 | 代理人: | 刘挺;龚洁 |
| 地址: | 510310 广东省广州市海珠区阅江西路218*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 智能 呼机 语音 数据处理 方法 装置 | ||
1.一种基于智能外呼机器人的语音数据处理方法,其特征在于,包括步骤:
获取待处理语音并处理成转写内容;
提升所述转写内容的可读性,并对所述转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;
根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话;
根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据。
2.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述提升所述转写内容的可读性的过程,包括步骤:
基于多信息融合及基于声学属性识别的声学置信度,结合语义信息,以提升异常语音的检测能力。
3.根据权利要求1或2所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述提升所述转写内容的可读性的过程,包括步骤:
组合CRF模型的标点技术、基于CRF模型的句子顺滑及基于最大熵模型的关键信息抽取,提升所述转写内容的可读性。
4.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述对所述转写内容进行划分处理的过程,包括步骤:
基于句子级别语义聚类和关联逻辑关系的分析,以及特殊的提示型词汇、停顿长度,将所述转写内容切分为语义相对独立的若干个段落,以执行划分处理。
5.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述执行关键信息、摘要提取,获得语义内容的过程,包括步骤:
基于文本自动摘要,根据所述待处理语音中说话人信息、语气强调重复信息,执行关键信息、摘要提取。
6.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,包括步骤:
建立对所述用户的对话状态跟踪;
基于最大熵的对话控制策略,在所述对话状态跟踪的基础上,最大化所述医疗知识库信息,基于目标驱动的策略生成系统响应,引导用户进行持续对话。
7.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据的过程,包括步骤:
根据医学本体知识库执行标准化处理,获得语音数据。
8.一种基于智能外呼机器人的语音数据处理装置,其特征在于,包括:
语音转写模块,用于获取待处理语音并处理成转写内容;
语义提取模块,用于提升所述转写内容的可读性,并对所述转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;
对话建立模块,用于根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话;
语音处理模块,用于根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据。
9.一种计算机存储介质,其上存储有计算机指令,其特征在于,所述计算机指令被处理器执行时实现如权利要求1至7任意一项所述的基于智能外呼机器人的语音数据处理方法。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行程序时实现如权利要求1至7任意一项所述的基于智能外呼机器人的语音数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞华南有限公司,未经科大讯飞华南有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210954076.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:应用于机器人的语音处理方法及装置
- 下一篇:一种纸箱生产设备





