[发明专利]基于机器阅读理解的客户画像确定方法、系统和电子设备在审
| 申请号: | 202310074113.5 | 申请日: | 2023-01-30 |
| 公开(公告)号: | CN116051151A | 公开(公告)日: | 2023-05-02 |
| 发明(设计)人: | 张益凡;徐华 | 申请(专利权)人: | 思必驰科技股份有限公司 |
| 主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06F16/332 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;侯晓艳 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 机器 阅读 理解 客户 画像 确定 方法 系统 电子设备 | ||
本发明实施例提供一种基于机器阅读理解的客户画像确定方法、系统和电子设备。该方法包括:将客户与服务人员在目标对话领域交互的对话文本截取为多个语义段,从多个语义段中选取上下文相关的部分语义段;为上下文相关的部分语义段拼接目标对话领域内表示客户画像标签的问题,将拼接后得到的部分语义段‑问题输入机器阅读理解模型,输出客户画像标签的预测问答对;对预测问答对进行归一化后处理,得到文本标准化问答对,基于文本标准化问答对构建客户的客户画像。本发明实施例能够提升抽取标签的准确率,也能够根据泛化性得到较好的召回率。机器阅读理解模型可以在训练的过程中学习到更多的上下文信息,以此输出的结果更加能表现客户真实的想法。
技术领域
本发明涉及智能语音领域,尤其涉及一种基于机器阅读理解的客户画像确定方法、系统和电子设备。
背景技术
为了给予用户提供更好的服务,了解用户的画像可以更加准确的确定用户希望调用的技能,也可以更加精准的为用户提供精准推送。这就需要能够获得客户的客户画像。通常来说,对话场景中客户画像模型的构建主要依赖于客户与服务人员的沟通过程。例如,线下销售服务人员接待客户的过程,也可以是线上智能语音客服与用户的交互沟通。在沟通过程中的对话文本抽取出客户重点关注的信息,以此分析客户的偏好和意向,从而更好的完成智能营销系统的构建。
对于客户信息的抽取通常有以下方法:
1、基于规则的信息抽取算法:对于画像任务而言,最常见的方法是采用大量的规则来匹配原始文本中的关键内容。主要实现方法分为两个部分,第一部分是逐句匹配对话中表现客户意图的文本,匹配手段常以正则表达式或关键词库等体现。第二部分是逐句抽取出能够明确表现客户意向的槽位,通过对提取槽位的后处理和归一化,以此构建出用户对产品的实际需求。
2、基于序列标注模型的槽位提取算法:这类方法主要采用NLP(Natural LanguageProcessing,自然语言处理)中的序列标注模型来生成服务人员问句和目标客户槽位。具体实现方法首先是人工标注文本中体现服务人员问句和客户意向的内容,以下述形式呈现(例如“你想买个多大的”,可以标为B-询问面积,I-询问面积...)。标注完成后,借助深度模型循环神经网络或BERT等提取语义特征,从语义特征信息中预测出原始句的类别信息(比如询问面积)。完成模型的训练后,和规则算法类似的逐句扫描对话,利用上下文来匹配当前意图最近的槽位信息,以此提取出客户画像信息。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
1、基于规则的信息抽取算法:第一个问题是难以在准确率和召回率之间找到平衡,具体表现在规则如果比较宽泛,会导致召回数量多,误召回量也会进一步增加,从而导致准确率偏低。如果规则写的较为精细,会导致算法出的结果比较少,进而导致召回率较低。第二个问题是规则的固定性导致的,闲聊式对话的内容通常表现为多变的话术表达,因此在这种随机性非常高的数据中找到固定的规律是难以实现的,需要不断的人工标注和规则更新,表现为初期迭代快但是后期优化慢。
2、基于序列标注模型的槽位提取算法:这类算法的先验是认为对话都是以一问一答的形式呈现。然而,在真实ASR(Automatic Speech Recognition,自动语音识别)转写文本中,由于话者分离的局限性,通常会导致客户和销售的话杂揉在一块。假设大部分客户的回复都在销售的话中,那么这类方法无法提取到任何的画像结果。因此,这类方法对ASR转写的效果依赖性较高,自适应能力较差。
发明内容
为了至少解决现有技术中基于规则难以在准确率和召回率之间找到平衡、后期优化困难,基于序列标注模型自适应能力较差提取的客户画像不够精准的问题。
第一方面,本发明实施例提供一种基于机器阅读理解的客户画像确定方法,包括:
将客户与服务人员在目标对话领域交互的对话文本截取为多个语义段,从所述多个语义段中选取上下文相关的部分语义段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310074113.5/2.html,转载请声明来源钻瓜专利网。





