[发明专利]基于对话的用户画像抽取方法及相关装置有效

专利信息
申请号: 202110458709.6 申请日: 2021-04-26
公开(公告)号: CN113051384B 公开(公告)日: 2023-09-19
发明(设计)人: 孙梓淇;张智;白祚;莫洋 申请(专利权)人: 中国平安人寿保险股份有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/335;G06F16/35;G06F40/242;G06F40/295;G06N3/0442
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 熊永强
地址: 518000 广东省深圳市福田区益田路5033号*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 对话 用户 画像 抽取 方法 相关 装置
【说明书】:

本申请实施例提供一种基于对话的用户画像抽取方法及相关装置,其中,该方法包括:获取多轮对话的任意一轮对话中用户的第一对话语句及业务员的第二对话语句;对第一对话语句和第二对话语句进行实体识别;对第一对话语句和第二对话语句中的代词进行识别,基于预设数据表中记录的实体对识别出的代词进行指代消解,得到目标第一对话语句和目标第二对话语句;然后对目标第一对话语句和目标第二对话语句进行用户画像抽取;对抽取出的属于业务员的用户画像进行过滤,得到任意一轮对话中属于用户的用户画像,将多轮对话的每一轮对话中抽取出的属于用户的目标用户画像合并。本申请实施例有利于提高用户画像抽取的准确度。

技术领域

本申请涉及数据分析技术领域,尤其涉及一种基于对话的用户画像抽取方法及相关装置。

背景技术

在业务处理中,会涉及到大量与客户沟通的场景,比如客户情况了解、产品服务咨询、售后处理等,沟通中产生的对话信息对用户挖掘或业务拓展有着极其重要的意义,比如对对话信息进行用户画像抽取,有助于后续的个性化推荐、用户使用情况追踪,还可引导话题走向,做进一步的用户画像挖掘。传统的用户画像抽取主要基于人力和规则对对话信息进行挖掘,从用户的回答中提取出能反应用户一定个人信息的标签,但是这种方式抽取出的用户画像往往不全面,在描述用户的准确度上偏低。

发明内容

针对上述问题,本申请提供了一种基于对话的用户画像抽取方法及相关装置,有利于提高用户画像抽取的准确度。

为实现上述目的,本申请实施例第一方面提供了一种基于对话的用户画像抽取方法,该方法包括:

获取多轮对话的任意一轮对话中用户的第一对话语句及业务员的第二对话语句;

对所述第一对话语句和所述第二对话语句进行实体识别,并将识别出的实体记录至预设数据表;

对所述第一对话语句和所述第二对话语句中的代词进行识别,基于所述预设数据表中记录的实体对识别出的代词进行指代消解,得到目标第一对话语句和目标第二对话语句;

基于第一预设规则对所述目标第一对话语句进行用户画像抽取,以及基于第二预设规则对所述目标第二对话语句进行用户画像抽取;

对所述目标第一对话语句和所述目标第二对话语句中抽取出的属于业务员的用户画像进行过滤,得到所述任意一轮对话中属于用户的用户画像,将所述多轮对话的每一轮对话中抽取出的属于用户的目标用户画像合并。

结合第一方面,在一种可能的实施方式中,所述基于所述预设数据表中记录的实体对识别出的代词进行指代消解,包括:

在所述任意一轮对话为所述多轮对话的首轮对话的情况下,从所述预设数据表中获取所述首轮对话中识别出的实体,基于所述首轮对话中识别出的实体对识别出的代词进行指代消解;

在所述任意一轮对话为所述多轮对话中除所述首轮对话以外的目标轮次对话的情况下,从所述预设数据表中获取所述目标轮次对话中识别出的实体以及历史轮次对话中识别出的实体,基于所述目标轮次对话中识别出的实体以及所述历史轮次对话中识别出的实体对识别出的代词进行指代消解;其中,所述历史轮次对话为所述多轮对话中所述目标轮次对话之前的对话。

结合第一方面,在一种可能的实施方式中,所述基于第一预设规则对所述目标第一对话语句进行用户画像抽取,包括:

对所述目标第一对话语句进行敏感词和业务话术检测,以得到第一候选规则集;

采用正则表达式对所述目标第一对话语句进行规则匹配,得到第二候选规则集;

对所述第一候选规则集和所述第二候选规则集取交集,得到第三候选规则集;

在所述第三候选规则集中的规则为所述第一预设规则的情况下,抽取所述目标第一对话语句中的用户画像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110458709.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top