[发明专利]一种煤矿违章信息文本自动分类方法和系统在审
申请号: | 202111538123.7 | 申请日: | 2021-12-16 |
公开(公告)号: | CN113934852A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 栗婧;张志珍;辛艳丽;刘紫薇;柳慧妍;秦永莹;杨磊 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/242;G06F40/289;G06Q50/02 |
代理公司: | 北京五洲洋和知识产权代理事务所(普通合伙) 11387 | 代理人: | 刘春成;刘素霞 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 煤矿 违章 信息 文本 自动 分类 方法 系统 | ||
本申请属于电数字数据处理技术领域,提供了一种煤矿违章信息文本自动分类方法和系统,该方法包括:基于事故致因“2‑4”模型和MECE原则,构建违章行为分类体系;根据违章行为分类体系,对煤矿违章信息文本进行处理,得到违章形式文本集合;根据违章形式文本集合和煤矿违章信息文本,构建煤矿违章信息的空间向量模型;基于煤矿违章信息的空间向量模型,对待分类的违章记录进行自动分类,得到煤矿违章信息文本分类结果。通过该方法,有效解决煤矿领域的违章信息文本分类问题,提高了煤矿违章信息文本的利用率。
技术领域
本申请涉及电数字数据处理技术领域,特别涉及一种煤矿违章信息文本自动分类方法和系统。
背景技术
近年来,煤矿安全生产形势总体趋于稳定,煤矿事故数和百万吨死亡率逐年降低,但距发达国家仍有不小的差距。煤矿安全成为煤矿生产工作过程中的重中之重。随着我国煤矿生产管理体系愈发完善,我国各大煤矿企业累积了大量的违章记录,通过对特定煤矿所有员工“三违”数据的统计分析,不仅可使煤矿生产企业及时了解和保证煤矿安全,而且有助于煤矿生产企业进行正确决策,维护煤矿安全生产。
违章数据具有总量大、记录不规范、特征不明显、类别不具体等特点,且目前煤矿企业对其所属员工违章数据的统计分析,仍然依靠人工对照历史数据、安全规章,凭借经验进行分析,缺乏现代科学手段,不仅影响所分析的数据的质量,而且使煤矿企业难以进行正确决策,使得大量违章数据失去作用。
国内外研究学者对违章行为的研究及文本分类进行了多方面探索,但仍然存在着一些不足:以往的研究多是根据经验总结的定性研究,缺乏从大量违章数据得来的定量分析和实证研究;针对海量煤矿违章文本记录,目前国内外仍缺乏有效的智能管理方式;文本分类技术较多的应用于非专业领域及医学领域,在其他专业领域的发展应用并不广泛。
因此,需要提供一种针对上述现有技术不足的改进技术方案。
发明内容
本申请的目的在于提供一种煤矿违章信息文本自动分类方法和系统,以解决或缓解上述现有技术中存在的问题。
为了实现上述目的,本申请提供如下技术方案:
本申请提供了一种煤矿违章信息文本自动分类方法,该方法包括:
步骤S100、基于事故致因“2-4”模型和MECE原则,构建违章行为分类体系;
步骤S200、根据所述违章行为分类体系,对所述煤矿违章信息文本进行处理,得到违章形式文本集合;
步骤S300、根据所述违章形式文本集合和所述煤矿违章信息文本,构建煤矿违章信息的空间向量模型;
步骤S400、基于所述煤矿违章信息的空间向量模型,对待分类的违章记录进行自动分类,得到煤矿违章信息文本分类结果。
优选的,所述构建违章行为分类体系,具体为:
基于事故致因“2-4”模型,对煤矿违章行为进行划分,得到煤矿违章行为大类,所述煤矿违章行为大类包括:违章指挥、违章行动、违章操作;
基于MECE原则,对煤矿违章行为大类进行细化,得到煤矿违章行为小类;
根据所述煤矿违章信息文本,对所述煤矿违章行为小类进行调整,得到所述违章行为分类体系。
优选的,步骤S200中,所述根据所述违章行为分类体系,对所述煤矿违章信息文本进行处理,得到违章形式文本集合,具体为:
根据所述违章行为分类体系中的所述煤矿违章行为小类,对所述煤矿违章信息文本进行拆分,得到违章形式文本集合。
优选的,步骤S300中,根据所述违章形式文本集合和所述煤矿违章信息文本,构建煤矿违章信息的空间向量模型,具体为:
对所述煤矿违章信息文本、所述违章形式文本进行分词处理,得到违章信息对应的词项集合;
基于TF-IDF模型,对所述词项进行权重计算,得到词项集合中的每一个词项对应的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111538123.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文字自动生成场景视频的方法及系统
- 下一篇:一种稠油降粘剂及其制备方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置