[发明专利]基于机器学习的大规模企业环境信息图片分类方法及系统在审
申请号: | 202310304897.6 | 申请日: | 2023-03-24 |
公开(公告)号: | CN116416466A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 白羽;丁小敏 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06N3/0464;G06N3/08;G06N20/00 |
代理公司: | 北京久诚知识产权代理事务所(特殊普通合伙) 11542 | 代理人: | 齐葵 |
地址: | 230009 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 大规模 企业 环境 信息 图片 分类 方法 系统 | ||
本发明提供一种基于机器学习的大规模企业环境信息图片分类方法及系统,涉及图片分类技术领域。本发明基于LDA主题模型从获取的环境信息文本数据中提取环境信息图片内容分类标准,并基于颜色的色域值获取环境信息图片颜色分类标准,并基于环境信息图片内容分类标准对模型训练环境图像进行标注,并基于标注后的模型训练环境图像训练图片分类模型;最后利用基于训练后的图片分类模型对待分类环境信息原始图片进行环境信息图片内容的分类,同时基于计算机视觉库按照环境信息图片颜色分类标准对待分类环境信息原始图片进行环境信息图片颜色的分类。本发明实现了对大规模企业环境信息图片进行高准确率、高效分类的目的。
技术领域
本发明涉及图片分类技术领域,具体涉及一种基于机器学习的大规模企业环境信息图片分类方法及系统。
背景技术
环境信息披露是指企业公开提供环境或与环境相关的财务与非财务信息,是社会责任信息披露的一个重要方面,是环境监管的产物。环境信息披露方式除了文字、数据以外,还有图片、视频等。图片作为一种可视化工具,因其具备最大限度、直观的表达信息量,可以强化信息内容的传递等特点,可有效加快信息处理,在公司传播环境信息时发挥的作用远胜于文字和数据等形式。但是如何快速对企业披露的大规模环境图片中的内容和颜色进行识别并进行分类的技术,一直以来是较为缺乏的。
随着计算机技术的发展,目前针对环境信息披露的文字内容的挖掘,虽然已由人工手动内容编码发展至使用机器进行自动化文本内容分析,但针对环境信息图片的分析还停留在使用人工进行图片内容和颜色的识别,准确率不高且耗时耗力。另外,一些技术领域虽然也有利用基于机器学习的CNN(Convolutional Neural Network,卷积神经网络)模型对照片内容进行分类的方法,但由于在环境管理领域,环境图片内容和颜色的暂无分类标准,所以无法基于机器学习的计算机图像分类方法运用到大规模环境图片的分类上,更无法保证分类的准确率。
综上可知,现有技术主要聚焦在文本分析上和人工对小规模环境图片进行分类,而针对大规模环境图片内容和颜色的识别与分类,若使用人工需要耗费大量时间,且分类准确率不能得到保证。可见,现有技术无法实现大规模环境图片的高准确率分类。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于机器学习的大规模企业环境信息图片分类方法及系统,解决了现有技术无法实现对大规模环境图片进行高准确率分类的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,本发明首先提出了一种基于机器学习的大规模企业环境信息图片分类方法,所述方法包括:
获取环境信息文本数据和待分类环境信息原始图片;
基于LDA主题模型从所述环境信息文本数据中提取环境信息图片内容分类标准,并基于颜色的色域值获取环境信息图片颜色分类标准;
获取模型训练环境图像,并基于所述环境信息图片内容分类标准对所述模型训练环境图像进行标注,并基于标注后的所述模型训练环境图像训练图片分类模型;
基于训练后的所述图片分类模型对所述待分类环境信息原始图片进行环境信息图片内容的分类,同时基于计算机视觉库程序按照所述环境信息图片颜色分类标准对所述待分类环境信息原始图片进行环境信息图片颜色的分类。
优选的,所述环境信息图片内容分类标准包括:环境意识、环境认证、环保设施、环境绿化和可再生能源。
优选的,所述基于颜色的色域值获取环境信息图片颜色分类标准包括:基于常用颜色的色域值构建颜色字典,并将所述颜色字典作为环境信息图片颜色分类标准。
优选的,所述图片分类模型包括卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310304897.6/2.html,转载请声明来源钻瓜专利网。