[发明专利]基于NLP的业务活动大数据挖掘方法及系统在审
申请号: | 202210371214.4 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114756653A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 付庆龙 | 申请(专利权)人: | 付庆龙 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京恒和顿知识产权代理有限公司 11014 | 代理人: | 林涛 |
地址: | 330224 江西省南昌市*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 nlp 业务 活动 数据 挖掘 方法 系统 | ||
本公开实施例公开了基于NLP的业务活动大数据挖掘方法及系统,方法包括:对初始线上活动事件的第一用户会话文本簇进行文本特征相关性分析获得交叉性会话文本内容集,并基于所述交叉性会话文本内容集确定不同于初始线上活动事件的第二线上活动事件以及所述第二线上活动事件的第二用户会话文本簇;以及根据所述第二用户会话文本簇,确定所述第二线上活动事件与所述初始线上活动事件之间的活动依赖性。应用于本公开实施例,能够对不同线上活动事件的用户会话文本数据进行深入挖掘,以尽可能高质量地挖掘用户会话文本数据的潜在依赖特征,从而实现对大量的用户会话文本数据的事件依赖性分析和挖掘。
技术领域
本公开涉及大数据技术领域,尤其涉及一种基于NLP的业务活动大数据挖掘方法及系统。
背景技术
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。NLP的主要应用领域包括:机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别等。当下,NLP与大数据挖掘的结合越来越紧密,通过NLP辅助进行用户大数据挖掘和分析已成为热点。然而在实际应用过程中发明人发现,如何高质量地实现在线业务活动的分析挖掘是现目前需要解决的一个问题。
发明内容
本公开的一个目的是提供一种基于NLP的业务活动大数据挖掘方法及系统。
本公开的技术方案是通过如下至少部分实施例实现的。
一种基于NLP的业务活动大数据挖掘方法,该方法通过大数据挖掘平台系统实施,该方法至少包括:
对初始线上活动事件的第一用户会话文本簇进行文本特征相关性分析获得交叉性会话文本内容集,并基于所述交叉性会话文本内容集确定不同于初始线上活动事件的第二线上活动事件以及所述第二线上活动事件的第二用户会话文本簇;
以及,根据所述第二用户会话文本簇,确定所述第二线上活动事件与所述初始线上活动事件之间的活动依赖性。
在一些独立性实施例下,所述对初始线上活动事件的第一用户会话文本簇进行文本特征相关性分析获得交叉性会话文本内容集,并基于所述交叉性会话文本内容集确定不同于初始线上活动事件的第二线上活动事件以及所述第二线上活动事件的第二用户会话文本簇,包括:获得不少于两个初始线上活动事件中各所述初始线上活动事件的第一用户会话文本簇;其中,所述不少于两个初始线上活动事件携带一致的或者存在联系的要素信息,各所述第一用户会话文本簇中包含至少一个用户会话文本;对所述不少于两个初始线上活动事件的第一用户会话文本簇中的用户会话文本进行文本特征相关性分析,确定出至少一个交叉性会话文本内容集;确定在所述至少一个交叉性会话文本内容集内存在的不同于所述不少于两个初始线上活动事件的至少一个第二线上活动事件,以及各所述第二线上活动事件在所述至少一个交叉性会话文本内容集内的第二用户会话文本簇;
所述根据所述第二用户会话文本簇,确定所述第二线上活动事件与所述初始线上活动事件之间的活动依赖性,包括:就各所述第二线上活动事件而言,在所述第二线上活动事件的第二用户会话文本簇中用户会话文本的数目大于用户会话文本数目判定值的基础上,确定所述第二线上活动事件与所述不少于两个初始线上活动事件之间具有活动依赖性。
在一些独立性实施例下,所述在所述第二线上活动事件的第二用户会话文本簇中用户会话文本的数目大于用户会话文本数目判定值的基础上,确定所述第二线上活动事件与所述不少于两个初始线上活动事件之间具有活动依赖性,包括:
在所述第二线上活动事件的第二用户会话文本簇中用户会话文本的数目大于用户会话文本数目判定值的基础上,确定所述第二用户会话文本簇中各用户会话文本配对的交叉性会话文本内容集;
在所述第二用户会话文本簇中用户会话文本配对的交叉性会话文本内容集的数目大于第一交叉数目判定值的基础上,确定所述第二线上活动事件与所述不少于两个初始线上活动事件之间具有活动依赖性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于付庆龙,未经付庆龙许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210371214.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:直立式河岸生态化改造结构
- 下一篇:一种高速运动物体轨迹测定装置