[发明专利]社交网络中领域的特征词库迭代更新方法和装置有效
申请号: | 201410213846.3 | 申请日: | 2014-05-20 |
公开(公告)号: | CN104063422B | 公开(公告)日: | 2018-02-27 |
发明(设计)人: | 李金奎;谌贻荣 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市京大律师事务所11321 | 代理人: | 张璐,方晓明 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种社交网络中领域的特征词库迭代更新方法和装置,所述方法包括根据社交网络中领域的用户群体发布的文本内容,对该领域的特征词库进行迭代更新;其中一次迭代更新过程包括对于该领域的用户群体中的每个用户,根据当前的该领域的特征词库计算该用户发布的每篇文本内容与该领域的相关度;根据该用户发布的每篇文本内容与该领域的相关度,计算该用户与该领域的相关度;从该领域的用户群体中确定出与该领域的相关度大于第一相关度阈值的用户,将确定出的用户发布的、与该领域的相关度大于第二相关度阈值的文本内容作为该领域的语料,从中提取出该领域的特征词,得到该领域的特征词库。本发明可以提高领域的特征词库的准确度。 | ||
搜索关键词: | 社交 网络 领域 特征 词库 更新 方法 装置 | ||
【主权项】:
一种社交网络中领域的特征词库迭代更新方法,其特征在于,包括:对于社交网络中待更新特征词库所属的领域,根据所述领域的用户群体发布的文本内容,对所述领域的特征词库进行设定次数的迭代更新;其中,一次迭代更新过程包括:对于所述领域的用户群体中的每个用户,根据当前的所述领域的特征词库,计算该用户发布的每篇文本内容与所述领域的相关度;并根据该用户发布的每篇文本内容与所述领域的相关度,计算出该用户与所述领域的相关度;从所述领域的用户群体中确定出与所述领域的相关度大于预设的第一相关度阈值的各用户,将确定出的各用户发布的、与所述领域的相关度大于预设的第二相关度阈值的文本内容,作为所述领域的特征训练语料;从得到的所述领域的特征训练语料中提取出所述领域的特征词后,更新当前的所述领域的特征词库,得到本次迭代更新后的所述领域的特征词库;其中,所述根据当前的所述领域的特征词库,计算该用户发布的每篇文本内容与所述领域的相关度,具体包括:对于获取的该用户发布的每篇文本内容,对该篇文本内容进行分词,从分词后的各词语中确定出与当前的所述领域的特征词库中的特征词相同的词语,作为该篇文本内容的特征词;并根据该篇文本内容的特征词,计算该篇文本内容与所述领域的相关度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410213846.3/,转载请声明来源钻瓜专利网。
- 上一篇:处理静态资源的方法及设备
- 下一篇:信息处理装置及信息处理系统