[发明专利]文本处理方法及装置在审
申请号: | 201610995440.4 | 申请日: | 2016-11-10 |
公开(公告)号: | CN108073604A | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 贺达 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本数据 重要性指标 文本处理 微博 数据处理技术 自然语言处理 自然语言习惯 公式计算 关联数据 用户交互 舆情分析 权重 预设 预置 文本 输出 携带 中文 | ||
1.一种文本处理方法,其特征在于,包括:
获取微博或微信中待处理的文本数据;
根据所述文本数据携带的用户交互关联数据及预置权重公式计算所述文本数据的重要性指标;
输出符合预设重要性指标条件的文本数据。
2.根据权利要求1所述的方法,其特征在于,所述输出符合预设重要性指标条件的文本数据包括:
判断所述文本数据的重要性指标是否大于预设阈值;
若是,则输出所述文本数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述文本数据携带的用户交互关联数据及预置权重公式计算所述文本数据的重要性指标之前,所述方法还包括:
获取所述文本数据的数据特征;
根据所述数据特征对所述文本数据进行去重操作;
所述根据所述文本数据携带的用户交互关联数据及预置权重公式计算所述文本数据的重要性指标包括:
根据去重后的文本数据携带的用户交互关联数据及预置权重公式计算所述文本数据的重要性指标。
4.根据权利要求3所述的方法,其特征在于,所述获取微博或微信中待处理的文本数据之后,所述方法还包括:
按照自然语言的语法规范对所述文本数据进行筛选,得到符合语法规范的文本数据。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述用户交互关联数据包括所述用户的交互信息及用户认证类型信息,所述用户的交互信息包括文本数据的文本浏览量、点赞量及评论量,所述预置权重公式包括:
Ri=Vi*(a*Ai+b*Bi+c*Ci);
所述Ri为第i条微博或微信的重要性指标,Vi为第i条微博或微信发布公众号的用户认证类型信息所对应的权重,Ai为第i条微博或微信文本数据的阅读量,a为所述阅读量对应的权重值,Bi为第i条微博或微信文本数据的点赞量,b为所述点赞量对应的权重值,Ci为第i条微博或微信文本数据的评论量,c为所述评论量对应的权重值。
6.一种文本处理装置,其特征在于,包括:
获取单元,用于获取微博或微信中待处理的文本数据;
计算单元,用于根据所述文本数据携带的用户交互关联数据及预置权重公式计算所述文本数据的重要性指标;
输出单元,用于输出符合预设重要性指标条件的文本数据。
7.根据权利要求6所述的装置,其特征在于,所述输出单元包括:
判断模块,用于判断所述文本数据的重要性指标是否大于预设阈值;
输出模块,用于若判断模块判断所述文本数据的重要性指标大于预设阈值,则输出所述文本数据。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:去重单元,
所述获取单元,还用于获取所述文本数据的数据特征;
所述去重单元,用于根据所述数据特征对所述文本数据进行去重操作;
所述计算单元,还用于根据去重后的文本数据携带的用户交互关联数据及预置权重公式计算所述文本数据的重要性指标。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
筛选单元,用于按照自然语言的语法规范对所述文本数据进行筛选,得到符合语法规范的文本数据。
10.根据权利要求6-9任一项所述的装置,其特征在于,所述用户交互关联数据包括所述用户的交互信息及用户认证类型信息,所述用户的交互信息包括文本数据的文本浏览量、点赞量及评论量,所述预置权重公式包括:
Ri=Vi*(a*Ai+b*Bi+c*Ci);
所述Ri为第i条微博或微信的重要性指标,Vi为第i条微博或微信发布公众号的用户认证类型信息所对应的权重,Ai为第i条微博或微信文本数据的阅读量,a为所述阅读量对应的权重值,Bi为第i条微博或微信文本数据的点赞量,b为所述点赞量对应的权重值,Ci为第i条微博或微信文本数据的评论量,c为所述评论量对应的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610995440.4/1.html,转载请声明来源钻瓜专利网。