[发明专利]一种工程材料类别智能识别方法有效
申请号: | 201710554907.6 | 申请日: | 2017-07-10 |
公开(公告)号: | CN107480126B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 尹绍青;查世伟;李惠君;陈宁;王云祥;黄宁;胡焱;陈玉辉;黄文妙;钟琳 | 申请(专利权)人: | 华联世纪工程咨询股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫 |
地址: | 510000 广东省广州市越*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 工程 材料 类别 智能 识别 方法 | ||
本发明提供了一种工程材料类别智能识别方法,其包括:步骤S1:准备材料训练样本和材料测试样本;步骤S2:对材料测试样本的材料名称进行分词后去除停用词;对材料训练样本进行分词后去重,得到各类别关键词组合名称;步骤S3:计算清洗后的材料测试样本材料名称与材料训练样本关键词组合名称的相似系数;根据相似系数选出材料测试样本的候选类别,或者分离出机器算法无法识别的材料测试样本,人工介入识别;步骤S4:筛选出候选类别对应的材料训练样本,并提取特征关键词;步骤S5:使用机器学习分类算法对材料名称进行最终类别确认。本发明结合大数据处理技术与机器学习分类算法,可智能识别材料类别;识别准确、效率较高,成本较低。
技术领域
本发明涉及一种工程材料类别智能识别方法。
背景技术
大数据、云计算等新技术的发展,为工程造价信息化发展带来了新的出路。BIM技术的普及和发展是基于企业核心数据的累积、存储和管理的。工程造价信息化是行业趋势,其核心是人才机价格;工程造价主要由材料价格构成,材价是最复杂、变化最大的因素。实现材价分析和材价预测的前提是对材料进行准确分类;然而现实中材料名称写法多样,不同地区别名叫法不同,加大了材料分类的难度。
目前常用的方法是人工识别材料种类,手动输入材料名称,建立材料词库。
上述方式的缺陷在于:通过人工手动建立工程材料词库和规则库来实现材料类别识别,错误率高、效率低、成本过大。
因此,如何提供一种识别准确、效率较高,成本较低的的工程材料类别智能识别方法成为了业界需要解决的问题。
发明内容
针对现有技术的缺点,本发明的目的是提供一种工程材料类别智能识别方法,其识别准确、效率较高,成本较低。
为了实现上述目的,本发明提供了一种工程材料类别智能识别方法,工程材料类别智能识别方法包括:
步骤S1:准备材料训练样本和材料测试样本;
步骤S2:对材料测试样本的材料名称进行分词后去除停用词;对材料训练样本进行分词后去重,得到各类别关键词组合名称;
步骤S3:计算清洗后的材料测试样本材料名称与材料训练样本关键词组合名称的相似系数;根据相似系数选出材料测试样本的候选类别,或者分离出机器算法无法识别的材料测试样本,人工介入识别;
步骤S4:筛选出候选类别对应的材料训练样本,并提取特征关键词;
步骤S5:使用机器学习分类算法对材料名称进行最终类别确认。
本发明结合大数据处理技术与机器学习分类算法,实现了材料类别的智能识别;可自动学习,效率较高;随着材料训练样本不断完善,准确率呈指数增长。
根据本发明另一具体实施方式,步骤S1中,材料测试样本是通过接口或者人工导入的材料数据和待识别类型;材料训练样本是已经被识别类型的材料样本。
本方案中,材料类别以《GB/T 50851-2013建设工程人工材料设备机械数据标准》(简称国标)的二级分类为准;材料训练样本有国标二级分类编码及其对应的材料名称(国标二级分类名称),材料测试样本只有材料名称。
根据本发明另一具体实施方式,步骤S2进一步包括:
步骤S2.1:将材料测试样本中的材料名称进行分词,并与整理好的停用词库中的词汇进行匹配;删除材料名称中的停用词,实现对材料名称的清洗;
步骤S2.2:分别对国标二级分类编码所对应的材料训练样本进行分词处理,并对分词进行去重;留下的词为该类别的关键词,将这些关键词组合成各类别材料组合名称。
本方案中,停用词是指对材料类别识别没有意义的词,也称无效词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华联世纪工程咨询股份有限公司,未经华联世纪工程咨询股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710554907.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于知识图谱的关系链接方法
- 下一篇:舆情分析方法及装置