[发明专利]一种基于标签分层延深建模的企业画像方法有效
申请号: | 202011303829.0 | 申请日: | 2020-11-19 |
公开(公告)号: | CN112580332B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 李翔;丁行硕;王媛媛;朱全银;高尚兵;王留洋;马甲林;张柯文;成洁怡 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/242;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 梁耀文 |
地址: | 223005 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 分层 建模 企业 画像 方法 | ||
发明公开了一种基于标签分层延深建模的企业画像方法,首先对企业模糊标签进行统计和筛选,筛选出如批发业、零售业等不能完整概括企业特点的标签,使用Bert模型依据企业经营范围和企业标签对筛选出的标签进行分类延深;然后将企业名称、企业简介、经营范围信息整合,基于预先建立好的企业词库进行特征拓展,分别使用TextRank、TF‑IDF、LDA主题模型从综合信息中抽取关键词,将处理后的关键词作为更深层的企业延深标签;最后,将本建模方法应用到企业画像系统中,优化标签精确概括能力。本发明普遍适用于标签延深建模和标签提取问题,充分考虑了标签延深的层次关系,可以有效的提高标签和企业画像系统的准确度。
技术领域
本发明属于企业画像和自然语言处理技术领域,特别涉及一种基于标签分层延深建模的企业画像方法。
背景技术
本发明中的标签分层延深对画像技术有重要的作用和意义。在面对画像标签问题的时候,研究者们通常会选择分类匹配,但是这种模型存在明显的不足,忽视了标签的由浅入深的分层关系,标签无法精确概括企业特点,且无法对标签做进一步的延深建模。因此,通过结合神经网络和自然语言处理能够很好的解决标签延深建模问题,从而提高标签和画像系统的准确度。
李翔、朱全银等人已有的研究基础包括:X.Li,Z.Wang,S.Gao,R.Hu,Q.Zhu andL.Wang,An Intelligent Context-Aware Management Framework for Cold ChainLogistics Distribution,in IEEE Transactions on Intelligent TransportationSystems.doi:10.1109/TITS.2018.2889069;X.Li,Z.Wang,L.Wang,R.Hu and Q.Zhu,AMulti-Dimensional Context-Aware Recommendation Approach Based on ImprovedRandom Forest Algorithm,in IEEE Access,vol.6,pp.45071-45085,2018,doi:10.1109/ACCESS.2018.2865436;Li,X.,Wang,Z.,Hu,R.et al.Recommendation algorithmbased on improved spectral clustering and transfer learning.Pattern AnalApplic 22,633–647(2019);李翔,朱全银.联合聚类和评分矩阵共享的协同过滤推荐[J].计算机科学与探索,2014,8(6):751-759;李翔、朱全银等人申请、公开与授权的相关专利:朱全银,潘舒新,李翔等.一种多维度网页浏览行为评估方法.发明专利号ZL2017100546758.1,2020.02.07;朱全银,李翔,胡荣林等.一种科技新闻的增量学习多层次二分类方法.发明专利号ZL 201510642902.X,2018.08.10;朱全银,邵武杰,李翔等.一种科学新闻标题的多层次多分类方法.发明专利号ZL 201610114278.0,2019.04.19;朱全银,尹永华,李翔等.一种基于神经网络的多品种商品价格预测的数据预处理方法.发明专利号ZL201210325368.6,2016.06.08;朱全银,辛诚,李翔等.一种基于K-means和LDA双向验证的网络行为习惯聚类方法.发明专利号ZL 201610565749.X,2019.06.11。
企业画像:
企业画像是大数据时代下的产物,是基于用户画像而产生,它通过企业的基本信息,抽取出标签化的企业模型,使用图表的形式将企业信息全方位展示出来。企业画像标签的建立是通过最基础的统计类标签,以及企业用户行为而产生的规则类标签,最后在使用数据挖掘对企业某些属性进行预测判断,挖掘潜在的价值信息,这些标签就组成了企业画像的标签体系。企业画像能够形象展示出一个企业的综合实力,当企业在进行项目合作时,可以将画像信息作为重要依据。同时还可以减少企业之间的竞争,使企业趋利避害。而对于政府,了解企业信息有利于对企业进行监管。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011303829.0/2.html,转载请声明来源钻瓜专利网。