[发明专利]一种基于页面主题的页面背景匹配方法及装置在审
申请号: | 202110391022.5 | 申请日: | 2021-04-12 |
公开(公告)号: | CN113204723A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 郭世仁;廖琳;吴东庆;黄灏然;连剑波 | 申请(专利权)人: | 仲恺农业工程学院 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F16/958;G06F40/284;G06F40/242 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;颜希文 |
地址: | 510225 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 页面 主题 背景 匹配 方法 装置 | ||
1.一种基于页面主题的页面背景匹配方法,其特征在于,所述方法包括:
获取含有页面内容的待匹配页面,从所述待匹配页面的页面内容中筛选得到页面文本集合;
对所述页面文本集合进行文本提取,得到若干个关键文本;
基于所述若干个关键文本确定页面主题类型;
根据所述页面主题类型从预置的网页背景库匹配对应的页面背景。
2.根据权利要求1所述的基于页面主题的页面背景匹配方法,其特征在于,所述基于所述若干个关键文本确定页面主题类型,包括:
通过预设的网页情绪词典将所述若干个关键文本划分成多个情绪文本集合,其中,每个情绪文本集合包含N个关键文本信息,N为大于或等于0的正整数;
从所述多个情绪文本集合中确定包含关键文本个数最多的情绪文本集合为目标情绪文本,以所述目标情绪文本对应的情绪为页面主题类型。
3.根据权利要求1所述的基于页面主题的页面背景匹配方法,其特征在于,所述对所述页面文本集合进行文本提取,得到若干个关键文本,包括:
通过预设的分词器对所述页面文本集合进行分词,得到若干个分词文本;
从所述若干个分词文本中筛选若干个非虚词的分词文本,得到若干个关键文本。
4.根据权利要求1-3任意一项所述的基于页面主题的页面背景匹配方法,其特征在于,所述从所述待匹配页面的页面内容中筛选得到页面文本集合,包括:
获取所述待匹配页面中包含HTML标记的标记页面内容;
对所述标记页面内容进行标记样式筛选,筛选得到显示页面内容;
从所述显示页面内容中提取页面文本集合。
5.根据权利要求4所述的基于页面主题的页面背景匹配方法,其特征在于,所述显示页面内容包括:M个标题句内容,M为大于或等于1的正整数;
所述从所述显示页面内容中提取页面文本集合,包括:
当M等于1时,将所述标题句内容添加至预设的文本集合中,得到页面文本集合;
当M大于1时,遍历每个标题句内容对应的内容属性值,得到M个内容属性值;
比较第i个内容属性值是否大于第i+1个内容属性值的数值大小;
当所述第i个内容属性值的数值大于所述第i+1个内容属性值的数值时,以所述第i个内容属性值为参考属性值,其中,所述参考属性值的初始值为零;
当所述第i个内容属性值的数值小于所述第i+1个内容属性值的数值时,以所述第i+1个内容属性值为参考属性值,其中,所述参考属性值的初始值为零;
判断i+1是否等于M;
若i+1不等于M,则将i+1赋值给i,并重复执行所述比较第i个内容属性值是否大于第i+1个内容属性值的数值大小的步骤;
若i+1等于M,则以所述参考属性值对应的标题句内容添加至预设的文本集合中,得到页面文本集合。
6.根据权利要求5所述的基于页面主题的页面背景匹配方法,其特征在于,所述内容属性值包括:字号属性值和标题属性值;
其中,所述字号属性值包括数值字号属性值和百分比字号属性值。
7.根据权利要求4所述的基于页面主题的页面背景匹配方法,其特征在于,所述显示页面内容包括:描述内容;
所述从所述显示页面内容中提取页面文本集合,包括:
从所述描述内容中提取content属性值,其中,所述content属性值包括关键词属性值和概括属性值;
将所述content属性值添加至预设的文本集合,得到页面文本集合。
8.一种基于页面主题的页面背景匹配装置,其特征在于,所述装置包括:
筛选模块,用于获取含有页面内容的待匹配页面,从所述待匹配页面的页面内容中筛选得到页面文本集合;
提取模块,用于对所述页面文本集合进行文本提取,得到若干个关键文本;
确定模块,用于基于所述若干个关键文本确定页面主题类型;
匹配模块,用于根据所述页面主题类型从预置的网页背景库匹配对应的页面背景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于仲恺农业工程学院,未经仲恺农业工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110391022.5/1.html,转载请声明来源钻瓜专利网。