[发明专利]一种从文本中挖掘和定位个人能力的方法有效
申请号: | 201910538161.9 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110263341B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 吴漾;王鹏宇;缪新萍;杨箴;周玲;田钺 | 申请(专利权)人: | 贵州电网有限责任公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284 |
代理公司: | 贵阳中新专利商标事务所 52100 | 代理人: | 胡绪东 |
地址: | 550002 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种从文本中挖掘和定位个人能力的方法,该方法包括步骤:将文档数据和邮件数据入数据库;采用数据库生成人名词库以及系统词库文件;根据生成的人名词库以及系统词库分词并去掉停用词;提取出所有谓词并生词谓词文件;利用谓词文件人工标注出能力词并形成能力词库文件;利用能力词文件、人名词库和系统词库分词并去掉停用词,根据正则和规则判断能力、人名之间是不是并列的关系,若是,生成能力和人员对应关系,否,则根据距离计算最近的,然后将生成对应人员能力并存入数据库。本发明能自动从对应能力查找人员,进而大幅度提高了办公效率。 | ||
搜索关键词: | 一种 文本 挖掘 定位 个人 能力 方法 | ||
【主权项】:
1.一种从文本中挖掘和定位个人能力的方法,其特征在于:该方法包括以下步骤:(1)数据入库:通过将文档数据以及多封邮件数据入库;(2)利用文档数据和邮件数据生成的数据库生成人名词库以及系统词库文件;(3)根据生成的人名词库以及系统词库分词并去掉停用词;(4)提取出所有谓词并生词谓词文件;(5)利用谓词文件人工标注出能力词并形成能力词库文件;(6)利用能力词文件、人名词库以及系统词库分词并去掉停用词,分析文档每句话,根据正则和规则判断能力、人名之间是不是并列的关系,若是,则生成能力和所有人员对应关系,不是,则根据距离计算最近的,然后将生成对应人员能力并存入数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司,未经贵州电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910538161.9/,转载请声明来源钻瓜专利网。