[发明专利]一种基于页面主题的页面背景匹配方法及装置在审
申请号: | 202110391022.5 | 申请日: | 2021-04-12 |
公开(公告)号: | CN113204723A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 郭世仁;廖琳;吴东庆;黄灏然;连剑波 | 申请(专利权)人: | 仲恺农业工程学院 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F16/958;G06F40/284;G06F40/242 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;颜希文 |
地址: | 510225 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 页面 主题 背景 匹配 方法 装置 | ||
本发明公开了一种基于页面主题的页面背景匹配方法及装置,所述方法包括:获取含有页面内容的待匹配页面,从所述待匹配页面的页面内容中筛选得到页面文本集合;对所述页面文本集合进行文本提取,得到若干个关键文本;基于所述若干个关键文本确定页面主题类型;根据所述页面主题类型从预置的网页背景库匹配对应的页面背景。本发明不但可以提高匹配的准确率,也可以缩短匹配时间,提高匹配效率,同时整个过程可以自动、高效且智能地完成,无需人工干预,减少人为的误差,进一步提高匹配的准确率,达到精准、简单而又高效的网页背景设置的效果,实现了网页内容传播和情绪表达的最佳结合。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于页面主题的页面背景匹配方法及装置。
背景技术
移动互联网的兴起以及Web的应用领域和普及进一步扩大。各大组织、单位或个人都可以通过Web发布资讯信息,资讯内容的文本作为主体嵌入在网络页面中,再配上各种背景与装饰从而形成一个完整的网页页面呈现给用户。而网页背景是整个网页的重要陪衬,直接决定了网页的风格和色调,如果背景运用不当,不仅影响网页的整体美观,还会妨碍页面主体内容的表现。
目前,常用的背景添加方式是由网页编辑人员对网页的资讯内容进行人工识别,在基于个人的判断选取相应的页面背景以及相适配的主题情绪,从而编辑生成一个新的网页。
但目前常用的添加和编辑方法有如下问题:首先每次判断前需要编辑人员花费大量时间阅读待展示的资讯内容,不但延长了匹配的时间,还降低匹配效率,而且每次匹配均基于编辑人员对资讯内容的主观判断,容易导致添加匹配的主题背景或主题情绪与资讯内容不符,导致编辑出错。
发明内容
本发明提出一种基于页面主题的页面背景匹配方法及装置,所述方法可以将网页的文字与预设的背景主题匹配得到适应的主题背景,减少人为误差、提高网页主题的匹配效率和准确率。
本发明实施例的第一方面提供了一种基于页面主题的页面背景匹配方法,所述方法包括:
获取含有页面内容的待匹配页面,从所述待匹配页面的页面内容中筛选得到页面文本集合;
对所述页面文本集合进行文本提取,得到若干个关键文本;
基于所述若干个关键文本确定页面主题类型;
根据所述页面主题类型从预置的网页背景库匹配对应的页面背景。
在第一方面的一种可能的实现方式中,所述基于所述若干个关键文本确定页面主题类型,包括:
通过预设的网页情绪词典将所述若干个关键文本划分成多个情绪文本集合,其中,每个情绪文本集合包含N个关键文本信息,N为大于或等于0的正整数;
从所述多个情绪文本集合中确定包含关键文本个数最多的情绪文本集合为目标情绪文本,以所述目标情绪文本对应的情绪为页面主题类型。
在第一方面的一种可能的实现方式中,所述对所述页面文本集合进行文本提取,得到若干个关键文本,包括:
通过预设的分词器对所述页面文本集合进行分词,得到若干个分词文本;
从所述若干个分词文本中筛选若干个非虚词的分词文本,得到若干个关键文本。
在第一方面的一种可能的实现方式中,所述从所述待匹配页面的页面内容中筛选得到页面文本集合,包括:
获取所述待匹配页面中包含HTML标记的标记页面内容;
对所述标记页面内容进行标记样式筛选,筛选得到显示页面内容;
从所述显示页面内容中提取页面文本集合。
在第一方面的一种可能的实现方式中,所述显示页面内容包括:M个标题句内容,M为大于或等于1的正整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于仲恺农业工程学院,未经仲恺农业工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110391022.5/2.html,转载请声明来源钻瓜专利网。