[发明专利]一种实现自适应消息过滤的即时通讯系统和即时通讯方法有效
申请号: | 201611176758.6 | 申请日: | 2016-12-19 |
公开(公告)号: | CN106789572B | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 孟青 | 申请(专利权)人: | 重庆博琨瀚威科技有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58 |
代理公司: | 北京艾皮专利代理有限公司 11777 | 代理人: | 刘媛 |
地址: | 401520 重庆市*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 自适应 消息 过滤 即时通讯 系统 方法 | ||
1.一种实现自适应消息过滤的即时通讯方法,包括以下步骤:
步骤S1,针对即时通讯过程中用户收发的消息记录,进行初步的文本化和格式转换;
步骤S2,根据表征每条消息的时间区间的指标,对消息记录进行聚合,生成聚合文本段;
步骤S3,根据聚合文本段的关键词,生成语义特征向量,并基于各聚合文本段的语义特征向量的相似性,实现聚合文本段的再划分处理,形成具有语义特征属性的再划分文本段;
步骤S4,根据用户对具有不同语义特征属性的再划分文本段的兴趣响应特征,确定过滤条件;
步骤S5,基于过滤条件,对用户实时收到的消息以及在消息记录中保存的消息执行过滤;
步骤S2中,对用户与某个联系对象的消息记录中时间上相邻的每两条消息计算消息间隔时长T1,T2,......Tk,......Tn;自适应地确定一间隔阈值T,从而将各消息间隔时长T1,T2,......Tk,......Tn按照相对于该间隔阈值T的大小而划分到第一消息间隔时长集合G1和第二消息间隔时长集合G2;该间隔阈值T的取值使得该第一消息间隔时长集合G1中全部消息间隔时长的均值TG1与第二消息间隔时长集合G2中全部消息间隔时长的均值TG2二者差值绝对值|TG1-TG2|达到最大化;将每两条消息的消息间隔时长T1,T2,......Tk,......Tn逐一与所确定的间隔阈值T进行比较,当Tk≤T时,则将以Tk为间隔的两条消息划分至同一个消息组;反之当Tk>T时,则将以Tk为间隔的两条消息划分至不同的消息组;将每个消息组中的各条消息的文本合并在一起,形成所述聚合文本段。
2.根据权利要求1所述的即时通讯方法,其特征在于,步骤S3中,从聚合文本段当中提取关键词,并统计每个关键词在该聚合文本段中的出现次数;并且将从聚合文本段中提取出来的关键词的出现次数累计至该关键词所从属于的语义概念的出现次数;根据每一个语义概念及其出现次数,对该聚合文本段进行向量化,生成表征该聚合文本段的语义特征向量VD={w1,w2,...wk,...wn},其中VD表示聚合文本段D的语义特征向量,w1,w2,...wk,...wn表示该向量在每个坐标轴上的坐标值,也即在每个坐标轴相应的语义概念上的出现次数值。
3.根据权利要求2所述的即时通讯方法,其特征在于,步骤S3中,对于两个聚合文本段,以二者各自的语义特征向量之间的夹角余弦值作为相近程度量化指标;在两个聚合文本段在消息记录中的时间间隔不超过预定时间范围的前提下,如果二者的相近程度量化指标在预定的相似阈值以上,则将这两个聚合文本段合并为同一个聚合文本段,并重新统计语义概念的出现次数以及重新计算合并后的语义特征向量;然后该聚合文本段继续参与与其它聚合文本段的再划分,直至剩余的所有聚合文本段均不能满足合并的条件,则结束再划分的过程,再划分处理之后的每一个聚合文本段作为最终的再划分文本段。
4.根据权利要求3所述的即时通讯方法,其特征在于,步骤S4中,将再划分文本段重新对应到消息记录中组成该文本段的各条消息;然后,在组成该再划分文本段的全部消息当中统计用户的兴趣响应特征;用户的兴趣响应特征采用组成该再划分文本段的全部消息当中该用户发送消息条目的占比或者用户发送消息文本量的占比来表征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆博琨瀚威科技有限公司,未经重庆博琨瀚威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611176758.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种物联网蒸煮锅
- 下一篇:自动加水及加米的智能电饭煲系统