[发明专利]基于人工智能的图书自动分类方法有效

申请号：	202110209964.7	申请日：	2021-02-24
公开（公告）号：	CN112861985B	公开（公告）日：	2023-01-31
发明（设计）人：	陈淑慧;陈柯明;张艳婷;张旭朣;胡稳	申请（专利权）人：	郑州轻工业大学
主分类号：	G06V30/416	分类号：	G06V30/416;G06V30/148;G06V30/18;G06V30/19
代理公司：	郑州芝麻知识产权代理事务所(普通合伙) 41173	代理人：	陈长山
地址：	450001 河南省郑州***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于人工智能图书自动分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出一种基于人工智能的图书自动分类方法，该方法包括：采集封面图像并转换色彩空间，获取HSV色彩模型并选取底色；根据底色构建底色邻域模型，输出非底色模型和其中的预选像素。根据三维空间中和封面图像中预选像素的位置进行聚类，获得若干个第二集合。检测第二集合中像素外接矩形的特征序列，分析得到文字类型，选择各种第二集合组成集合组合，获得集合组合中对应的字符感兴趣区域面积并计算集合组合面积评价指数，再根据外接矩形中心点计算集合组合的离散度评价指数。判断是否需要调整底色，输出最佳集合组合。根据最佳集合组合中第二集合对应外接矩形从封面图像中分割出字符检测区域，检测关键词并获得图书的类别。

技术领域

本申请涉及图书馆资料管理领域、计算机视觉领域，具体涉及一种基于人工智能的图书自动分类方法。

背景技术

如今全民阅读的风气盛行，得益于图书馆等阅读的基础设施趋于完善。图书馆中的藏书数量庞大，但如何高效地管理藏书，更好地为读者提供服务成为图书馆服务人员要面临的课题。图书馆藏书繁多，读者在选择图书时一般是通过图书分类索引进行检索，来获取感兴趣类型的图书。但是现在图书馆对图书的分类往往是粗略的分类，分类信息不够细致、丰富。对读者检索感兴趣的书籍造成了一定的困难，不利于读者高效快速地检索书籍。

现有图书分类方法一般为人工预先对图书进行分类，并将各图书的分类信息导入数据库中，通过扫码读出图书的分类信息，存在效率低下的问题。而且人工分类考虑的分类维度受限，导致分类信息比较单一，不够丰富，无法为读者提供足够的参考信息。

发明内容

针对以上问题，本发明提出一种基于人工智能的图书自动分类方法，该方法包括：采集封面图像并转换色彩空间，获取HSV色彩模型并选取底色；根据底色构建底色邻域模型，输出非底色模型和其中的预选像素。根据三维空间中和封面图像中预选像素的位置进行聚类，获得若干个第二集合。检测第二集合中像素外接矩形的特征序列，分析得到文字类型，选择各种第二集合组成集合组合，获得集合组合中对应的字符感兴趣区域面积并计算集合组合面积评价指数，再根据外接矩形中心点计算集合组合的离散度评价指数。判断是否需要调整底色，输出最佳集合组合。根据最佳集合组合中第二集合对应外接矩形从封面图像中分割出字符检测区域，检测关键词并获得图书的类别。

一种基于人工智能的图书自动分类方法，该方法包括：

S1、采集封面图像并转换色彩空间，再将色彩空间映射到三维空间中得到HSV色彩模型，统计各颜色值包含像素的数量并选取底色；

S2、根据底色的颜色值得到底色邻域模型，去除HSV色彩模型中属于底色邻域模型的区域，得到非底色模型和其中的预选像素；其中，所述底色邻域模型的获取方法为：

统计各颜色值包含像素的数量，按从大到小排列得到像素数量序列，选择像素数量序列中第a个颜色值作为底色，底色的坐标为(x′_a,y′_a,z′_a)，初始的a为1；

设置x轴方向阈值m_x′、y轴方向阈值m_y′、z轴方向阈值m_z′，底色邻域模型所占空间为[x′_a-m_x′,x′_a+m_x′]、[y′_a-m_y′,y′_a+m_y′]、[z′_a-m_z′,z′_a+m_z′]；