[发明专利]基于人工智能的图书自动分类方法有效
申请号: | 202110209964.7 | 申请日: | 2021-02-24 |
公开(公告)号: | CN112861985B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 陈淑慧;陈柯明;张艳婷;张旭朣;胡稳 | 申请(专利权)人: | 郑州轻工业大学 |
主分类号: | G06V30/416 | 分类号: | G06V30/416;G06V30/148;G06V30/18;G06V30/19 |
代理公司: | 郑州芝麻知识产权代理事务所(普通合伙) 41173 | 代理人: | 陈长山 |
地址: | 450001 河南省郑州*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 图书 自动 分类 方法 | ||
本发明提出一种基于人工智能的图书自动分类方法,该方法包括:采集封面图像并转换色彩空间,获取HSV色彩模型并选取底色;根据底色构建底色邻域模型,输出非底色模型和其中的预选像素。根据三维空间中和封面图像中预选像素的位置进行聚类,获得若干个第二集合。检测第二集合中像素外接矩形的特征序列,分析得到文字类型,选择各种第二集合组成集合组合,获得集合组合中对应的字符感兴趣区域面积并计算集合组合面积评价指数,再根据外接矩形中心点计算集合组合的离散度评价指数。判断是否需要调整底色,输出最佳集合组合。根据最佳集合组合中第二集合对应外接矩形从封面图像中分割出字符检测区域,检测关键词并获得图书的类别。
技术领域
本申请涉及图书馆资料管理领域、计算机视觉领域,具体涉及一种基于人工智能的图书自动分类方法。
背景技术
如今全民阅读的风气盛行,得益于图书馆等阅读的基础设施趋于完善。图书馆中的藏书数量庞大,但如何高效地管理藏书,更好地为读者提供服务成为图书馆服务人员要面临的课题。图书馆藏书繁多,读者在选择图书时一般是通过图书分类索引进行检索,来获取感兴趣类型的图书。但是现在图书馆对图书的分类往往是粗略的分类,分类信息不够细致、丰富。对读者检索感兴趣的书籍造成了一定的困难,不利于读者高效快速地检索书籍。
现有图书分类方法一般为人工预先对图书进行分类,并将各图书的分类信息导入数据库中,通过扫码读出图书的分类信息,存在效率低下的问题。而且人工分类考虑的分类维度受限,导致分类信息比较单一,不够丰富,无法为读者提供足够的参考信息。
发明内容
针对以上问题,本发明提出一种基于人工智能的图书自动分类方法,该方法包括:采集封面图像并转换色彩空间,获取HSV色彩模型并选取底色;根据底色构建底色邻域模型,输出非底色模型和其中的预选像素。根据三维空间中和封面图像中预选像素的位置进行聚类,获得若干个第二集合。检测第二集合中像素外接矩形的特征序列,分析得到文字类型,选择各种第二集合组成集合组合,获得集合组合中对应的字符感兴趣区域面积并计算集合组合面积评价指数,再根据外接矩形中心点计算集合组合的离散度评价指数。判断是否需要调整底色,输出最佳集合组合。根据最佳集合组合中第二集合对应外接矩形从封面图像中分割出字符检测区域,检测关键词并获得图书的类别。
一种基于人工智能的图书自动分类方法,该方法包括:
S1、采集封面图像并转换色彩空间,再将色彩空间映射到三维空间中得到HSV色彩模型,统计各颜色值包含像素的数量并选取底色;
S2、根据底色的颜色值得到底色邻域模型,去除HSV色彩模型中属于底色邻域模型的区域,得到非底色模型和其中的预选像素;其中,所述底色邻域模型的获取方法为:
统计各颜色值包含像素的数量,按从大到小排列得到像素数量序列,选择像素数量序列中第a个颜色值作为底色,底色的坐标为(x′a,y′a,z′a),初始的a为1;
设置x轴方向阈值mx′、y轴方向阈值my′、z轴方向阈值mz′,底色邻域模型所占空间为[x′a-mx′,x′a+mx′]、[y′a-my′,y′a+my′]、[z′a-mz′,z′a+mz′];
S3、根据预选像素集合中像素点在三维空间中的颜色值进行第一密度聚类,获得若干个第一集合;
S4、根据各第一集合中像素点在封面图像对应图像坐标系中的位置进行第二密度聚类,获得若干个第二集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业大学,未经郑州轻工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110209964.7/2.html,转载请声明来源钻瓜专利网。