[发明专利]一种语句识别方法与系统在审
申请号: | 201710258868.5 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107168948A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 王鹏 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06Q10/10 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 何世磊 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语句 识别 方法 系统 | ||
技术领域
本发明涉及语句识别技术领域,特别涉及一种语句识别方法与系统。
背景技术
众所周知的,在职场求职的过程中,简历被公认为求职成功的“敲门砖”。具体的,简历就是对个人学历、经历、特长、爱好及获奖情况等所作的简明扼要的书面介绍,是一种有针对性的自我介绍的规范化、逻辑化的书面表达。
一般的,在简历的筛选过程中,常常需要对简历进行整体评分,而进行评分时求职者的获奖情况是一个十分重要的评分指标。在对求职者的获奖情况进行评估时,首先需要从简历语句中提取对应的参赛名称(例如,在“2014年参加全国节能减排大赛并赢得校级三等奖”中“全国节能减排大赛”即为参赛名称),在提取了对应的参赛名称之后再对参赛名称进行具体评估以得到最终评分。因此,如何有效地对参赛名称进行提取成为了一个较为重要的前置条件。
一般的,现有的从简历中提取参赛名称主要通过人工提取的方式进行,但是此方法仅适用于数据工作量较小的情况,当所需要处理的简历量非常大时,通过人工提取参赛名称的方法无疑费时费力,尤其在当前大数据的环境下,无法满足实际应用需求。
发明内容
基于此,本发明的目的在于提出一种新型的语句识别方法与系统,可同时对大量简历中的参赛名称进行准确识别并提取,在很大程度上提高了数据处理效率,满足了实际应用需求。
本发明提出一种语句识别方法,其中,所述方法包括如下步骤:
对一待识别语句进行依存分析以得到与所述待识别语句相对应的依存句法树;
在所述依存句法树中查找预定词语的具体位置信息,根据所述具体位置信息确定包含所述预定词语的依存子树;
在所述依存子树中获取所有的非时间性短语以得到比赛名称。
所述语句识别方法,其中,所述在所述依存子树中获取所有的非时间性短语以得到比赛名称的步骤包括:
通过正则表达式检验所述依存子树中是否存在时间性短语;
若存在,则通过所述正则表达式将所述依存子树中的所述时间性短语进行删除;
在删除了所述时间性短语之后的所述依存子树中获取所有的所述非时间性短语以得到所述比赛名称。
所述语句识别方法,其中,在所述依存子树中获取所有的非时间性短语以得到比赛名称的步骤之后,所述方法还包括:
在所述比赛名称中获取区域性短语,根据所述区域性短语确定区域等级;
根据所述区域等级在预设评分数据库中确认与所述区域等级相对应的等级评分。
所述语句识别方法,其中,在根据所述区域等级在预设评分数据库中确认与所述区域等级相对应的等级评分之后,所述方法还包括:
将多个简历根据其对应的所述等级评分按照降序的方式进行排列。
所述语句识别方法,其中,在所述依存子树中获取所有的非时间性短语以得到比赛名称的步骤之后,所述方法还包括:
在所述比赛名称中获取比赛主题短语,根据所述比赛主题短语确定对应的比赛类型;
将与所述比赛类型一一对应的简历划分到对应的简历分区中。
本发明还提出一种语句识别系统,其中,所述系统包括:
依存分析模块,用于对一待识别语句进行依存分析以得到与所述待识别语句相对应的依存句法树;
查找确定模块,用于在所述依存句法树中查找预定词语的具体位置信息,根据所述具体位置信息确定包含所述预定词语的依存子树;
名称获取模块,用于在所述依存子树中获取所有的非时间性短语以得到比赛名称。
所述语句识别系统,其中,所述名称获取模块包括:
短语检验单元,用于通过正则表达式检验所述依存子树中是否存在时间性短语;
短语删除单元,用于若存在所述时间性短语,则通过所述正则表达式将所述依存子树中的所述时间性短语进行删除;
名称获取单元,用于在删除了所述时间性短语之后的所述依存子树中获取所有的所述非时间性短语以得到所述比赛名称。
所述语句识别系统,其中,所述系统还包括等级评分模块,所述等级评分模块包括:
区域划分单元,用于在所述比赛名称中获取区域性短语,根据所述区域性短语确定区域等级;
等级评分单元,用于根据所述区域等级在预设评分数据库中确认与所述区域等级相对应的等级评分。
所述语句识别系统,其中,所述系统还包括一等级排序模块,所述等级排序模块用于将多个简历根据其对应的所述等级评分按照降序的方式进行排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710258868.5/2.html,转载请声明来源钻瓜专利网。