[发明专利]工单填充方法、装置、电子设备及介质在审
申请号: | 202210953034.7 | 申请日: | 2022-08-09 |
公开(公告)号: | CN115374261A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 危枫;黄媛;冉猛;王晨子 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/338;G06F40/279;G06Q30/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 填充 方法 装置 电子设备 介质 | ||
本发明公开了一种工单填充方法、装置、电子设备及介质,涉及大数据技术领域。该方法包括:获取客服对话文本以及与客服对话文本对应的待填充工单,待填充工单包括多个待填充项;确定与每个所述待填充项对应的问题,得到多个问题;针对每一问题,基于预设的问答抽取模型对所述客服对话文本进行多轮问答抽取处理,得到所述问题的多个候选答案;基于所述多个候选答案,对所述问题对应的所述待填充项进行填充,以填充所述待填充工单。该方法通过对客服对话文本进行多轮问答抽取处理,解决了留单业务中客服对话文本过长、信息分散多次出现的问题,能够准确地从客服对话文本中抽取出与待填充工单对应的信息。
技术领域
本发明涉及大数据技术领域,尤其涉及一种工单填充方法、装置、电子设备及介质。
背景技术
随着网络信息技术的发展,各行各业均存在呼叫中心的规模与日剧增的情况。目前,大多数呼叫中心一般采用人工或人工智能进行留单。其中,留单是指坐席客服在接到用户一通来电后会生成一个工单,通话结束后坐席会根据对话的内容对工单中的选项、字段进行手动填充并提交系统。
由于呼叫中心语音数据体量大,是典型的非结构化数据,依靠人工方式留单,存在效率低下以及留单标准不统一等诸多问题。而,人工智能留单的方式,需要对客服与客户的对话文本(以下简称客服对话文本)进行文本分类,例如对用户的意图进行识别分类、对用户原因进行识别分类。由于客服对话文本的文本长度较长、且对话场景跳转频繁、客服对话文本中的信息分散,所以对客服对话文本的理解、类别预测以及工单填充造成了一定的困难。传统的人工智能方法存在以下局限性:其仅考虑了单个词的特征,没有考虑文本的上下关联性,对于特征不明显的类别难以识别。基于卷积神经网络的阅读理解模型应用在对话类的客服对话文本的阅读理解任务中存在以下局限性:对于长文本进行阅读理解时,其难以提取到关键的特征;在口语化的文本中,可能会对一些无意义的词赋予很大的权重,难以识别有用文本和无用文本。
发明内容
为解决上述技术问题或至少部分地解决上述技术问题,本发明实施例提供一种工单填充方法、装置、电子设备及介质。
第一方面,本发明实施例提供了一种工单填充方法,包括:获取客服对话文本以及与所述客服对话文本对应的待填充工单,所述待填充工单包括多个待填充项;确定与每个所述待填充项对应的问题,得到多个问题;针对每一所述问题,基于预设的问答抽取模型对所述客服对话文本进行多轮问答抽取处理,得到所述问题的多个候选答案;基于所述多个候选答案,对所述问题对应的所述待填充项进行填充,以填充所述待填充工单。
在可选的实施例中,基于所述多个候选答案,对所述问题对应的所述待填充项进行填充,以填充所述待填充工单,包括:对所述多个候选答案进行筛选,将筛选出的所述候选答案作为所述问题的目标答案;将所述目标答案写入与所述问题对应的所述待填充项,以填充所述待填充工单。
在可选的实施例中,所述针对每一所述问题,基于预设的问答抽取模型对所述客服对话文本进行多轮问答抽取处理,得到所述问题的多个候选答案,包括:对所述客服对话文本进行切分,获得多个文本片段;针对每一所述问题,分别将所述多个文本片段与所述问题进行组合,得到多个文本对;基于预设的问答抽取模型,分别对所述多个文本对进行问答抽取处理,以对所述客服对话文本进行多轮问答抽取处理,得到所述问题的多个候选答案。
在可选的实施例中,所述预设的问答抽取模型包括BERT子模型和分类子模型;
所述基于预设的问答抽取模型,分别对所述多个文本对进行问答抽取处理,得到所述问题的多个候选答案,包括:针对每一所述文本对,将所述文本对作为当前文本对,所述当前文本对中的文本片段作为当前文本片段,所述当前文本对中的问题作为当前问题;将所述当前文本对作为第一输入参数输入所述BERT子模型,确定所述当前文本对的语义特征向量;将所述语义特征向量作为第二输入参数输入所述分类子模型,确定所述当前文本片段中的字符的置信度,所述置信度用于指示所述字符为所述当前问题的候选答案的概率;基于所述置信度,从所述当前文本片段中抽取出所述当前问题的候选答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210953034.7/2.html,转载请声明来源钻瓜专利网。