[发明专利]一种垃圾评论信息识别方法及装置有效
申请号: | 201711481027.7 | 申请日: | 2017-12-29 |
公开(公告)号: | CN110020057B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 韩明清;惠友为;费菲;吴江;宋公良 | 申请(专利权)人: | 中国移动通信集团陕西有限公司;中国移动通信集团公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F40/216;G06F40/279 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 710075*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 垃圾 评论 信息 识别 方法 装置 | ||
本发明实施例提供一种垃圾评论信息识别方法及装置,用于解决现有技术中服务器对垃圾评论信息的识别准确度较低的技术问题。该方法包括:包括以下步骤:获取针对第一原文的待处理评论信息,并确定待处理评论信息对应的评论者ID以及第一原文对应的发布者ID;其中,待处理评论信息的内容具有至少一个预设特征;确定评论者ID针对发布者ID的至少一个原文发出的评论信息的总数量,以及目标评论信息的数量;其中,至少一个原文包括第一原文,目标评论信息为包含至少一个预设特征的评论信息;若确定目标评论信息的数量大于等于第一预设数量,且目标评论信息的数量与评论信息的总数量的比值大于等于预设比值,则确定待处理评论信息为垃圾评论信息。
技术领域
本发明涉及通信技术领域,特别涉及一种垃圾评论信息识别方法及装置。
背景技术
随着互联网应用的普及,用户可以通过各种方式在互联网中发布相关内容,同时,观看该内容的其他用户也可以发布相关评论,甚至通过评论的方式与内容的发布者进行交互。
有些不法用户,会在评论中插入隐含广告或其它垃圾内容,例如qq号、微信号、超链接等。目前针对隐含垃圾内容的评论信息的方式中,主要是通过检测评论信息中包括的相关的特征词汇,如字符串、敏感词汇等来识别垃圾评论信息。但在流行的社会化互联网应用中,例如歌唱类具有社会化网络特点的应用,将发布内容的用户称作主播,将参与评论的用户称作观众。观众在通过评论方式与主播进行互动时,评论的信息中可能包括了希望与主播建立联系的诉求,例如在交互过程中,通过评论信息向主播推荐自己的字符串账号等。如此,若按照上述的特殊词汇的方式,该评论信息就极有可能被服务器屏蔽掉。
由此可见,现有技术中服务器对垃圾评论信息的识别准确度较低。
发明内容
本发明实施例提供一种垃圾评论信息识别方法及装置,用于解决现有技术中服务器对垃圾评论信息的识别准确度较低的技术问题。
第一方面,本发明实施例提供一种垃圾评论信息识别方法,包括以下步骤:
获取针对第一原文的待处理评论信息,并确定所述待处理评论信息对应的评论者ID以及所述第一原文对应的发布者ID;其中,所述待处理评论信息的内容具有至少一个预设特征;
确定所述评论者ID针对所述发布者ID的至少一个原文发出的评论信息的总数量,以及所述评论信息中目标评论信息的数量;其中,所述至少一个原文包括所述第一原文,所述目标评论信息为包含所述至少一个预设特征的评论信息;
若确定所述目标评论信息的数量大于等于第一预设数量,且所述目标评论信息的数量与所述评论信息的总数量的比值大于等于预设比值,则确定所述待处理评论信息为垃圾评论信息。
可选的,在确定所述评论者ID针对所述发布者ID的至少一个原文的评论信息的总数量,以及所述评论信息中包括的目标评论信息的数量之前,所述方法还包括:
确定所述发布者ID对应的关注者数量;
确定所述关注者数量大于等于第二预设数量。
可选的,在确定所述评论者ID针对所述发布者ID的至少一个原文发出的评论信息的总数量,以及所述评论信息中包括的目标评论信息的数量之后,所述方法还包括:
确定所述发布者ID对应的来自所述评论者ID的互动信息的数量,所述互动信息为所述评论者ID针对所述至少一个原文发出的;
根据所述评论信息的总数量及所述互动信息的数量,确定所述评论者ID对应的所述第一预设数量和所述预设比值。
可选的,根据所述评论信息的总数量及所述互动信息的数量,确定所述评论者ID对应的所述第一预设数量和所述预设比值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团陕西有限公司;中国移动通信集团公司,未经中国移动通信集团陕西有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711481027.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种股票资讯智能提取方法
- 下一篇:信息处理方法、装置、设备及介质
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置