[发明专利]一种为文本添加超级链接的方法和装置有效
申请号: | 201210087642.0 | 申请日: | 2012-03-29 |
公开(公告)号: | CN103365831B | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 贺翔;卞琪;焦峰 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了为文本添加超级链接的方法和装置预先生成超链词列表和特征词列表,并针对每个特征词,分别确定其与每个超链词的共现频率;针对每个待添加超级链接的文本X,分别对其进行切词处理,并从切词结果中提取出在超链词列表中出现的超链词以及在特征词列表中出现的特征词,确定每个提取出的超链词和特征词的权值,根据每个提取出的特征词与每个提取出的超链词的共现频率以及所述权值,分别得到每个提取出的超链词的最终权值;按照最终权值由大到小的顺序对提取出的各超链词进行排序,为排序后处于前K位的超链词添加超级链接。应用本发明所述方案,能够提高所添加的超级链接与文本的相关性,且实现起来简单方便。 | ||
搜索关键词: | 一种 文本 添加 超级链接 方法 装置 | ||
【主权项】:
一种为文本添加超级链接的方法,其特征在于,包括:预先生成一个超链词列表,并收集各种文本,通过对各文本进行切词处理,生成一个特征词列表,针对每个特征词,分别确定其与每个超链词的共现频率;针对每个待添加超级链接的文本X,分别进行如下处理:对文本X进行切词处理;从切词结果中提取出在超链词列表中出现的超链词以及在特征词列表中出现的特征词,并确定每个提取出的超链词和每个提取出的特征词的权值;根据每个提取出的特征词与每个提取出的超链词的共现频率以及每个确定出的权值,分别得到每个提取出的超链词的最终权值;按照最终权值由大到小的顺序对提取出的各超链词进行排序,为排序后处于前K位的超链词添加超级链接,K为正整数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210087642.0/,转载请声明来源钻瓜专利网。