[发明专利]一种简历结构化处理方法在审
申请号: | 201811152110.4 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109271479A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 林巧彬;伍林斌;孔令贤;何正;苏祖军;郭洋;范金庆;杨土华;林煜斌 | 申请(专利权)人: | 广东润弘科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06K9/00 |
代理公司: | 广州圣理华知识产权代理有限公司 44302 | 代理人: | 顿海舟;李唐明 |
地址: | 510000 广东省广州市天河区珠江*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子简历 移动智能设备 结构化处理 纸质 存储器存储 存储器 标签匹配 定位模块 简历文档 内存单元 排版格式 时间成本 信息匹配 应用载体 智能转换 计算机 版块 手写 录入 服务器 节约 转换 服务 图片 | ||
一种简历结构化处理方法,该方法以计算机、移动智能设备以及与计算机或移动智能设备连接的服务为应用载体,服务器设有存储器和内存单元,存储器存储有版块标签匹配规则列表和信息匹配规则列表,通过把已有纸质简历的照片、简历图片或简历文档转换成电子简历,可以大大简化求职者简历填写的过程,完成纸质简历到电子简历的快速智能转换,免去了手写录入电子简历的繁琐,节约大量时间成本;同时在面对不同排版格式的简历时,能通过程序进行定位模块,准确识别,对于识别出的数据还可进行增删或修改,减轻求职者的负担。
技术领域
本发明涉及计算机领域,尤其涉及一种简历结构化处理方法。
背景技术
随着网络的快速发展,传统的招聘方式已经发生改变,网络招聘成为主流。在国外,运用互联网进行人才招聘的企业和求职者不在少数,许多优秀的第三方人才招聘网站也脱颖而出。在国内,有越来越多的网络招聘平台,著名的有前程无忧、智联招聘、58同城等,这些传统的平台主要是进行社会招聘为主的比较多,同时,传统招聘网站的市场份额正在逐渐缩小,现阶段中国互联网招聘公司手机应用软件的使用规模达720万人之多,手机移动端的发展趋势较好。另外,在技术研究和新技术引入方面比较少,导致了招聘平台缺少了用户功能上的优化,如简历书写方面,现在的招聘平台简历书写都是比较繁琐的,还有求职互动方面,很多求职者简历投出去了,但大部分简历石沉大海,得不到企业的实际反馈。
在当今互联网技术高速发展的时代,招聘平台更重要的是站在用户的角度去想问题,如何才能让用户快速生成简历,如何才能让求职者找到合适的工作,这些问题是现在招聘平台都需要去考虑的问题。
在实践的过程中发现,由于求职者简历数量的巨大,简历填写过程繁杂,耗时久,每更换一个招聘网站都需要重新填写个人信息,完善简历,且各大招聘网站的简历填写格式、简历包含内容参差不齐,进而增加了求职者的负担,使用这种传统的网络招聘反而会造成简历筛选效率低下,岗位匹配度低,招聘有效性很差。同时,随着互联网技术和智能手机的发展纸质简历的应用会越来越少,电子化简历的应用越来越广泛,电子化简历不但可以减少用户书写简历的时间,而且还可以实现电子化留档,易于管理简历。
因此,针对现有技术中存在的问题,亟需提供一种能够把纸质简历的照片、简历图片或简历文档识别为结构化简历的方法,将识别到的简历格式标准化,快速生成电子简历,显得尤为重要。
发明内容
为了解决现有技术中存在的问题,提出一种能够把简历照片或者普通文档识别为结构化简历的方法,其技术方案如下:
一种简历结构化处理方法,该方法以计算机、移动智能设备以及与计算机或移动智能设备连接的服务器为应用载体,服务器设有存储器和内存单元,存储器存储有版块标签匹配规则列表和信息匹配规则列表,其中,版块标签匹配规则列表中的每个版块标签均设有版块标题,信息匹配规则列表包括若干个板块和若干信息项,每个版块与版块标签匹配规则列表中的版块标签一一对应,每个信息项均与的某一版块关联且每个信息项均关联有信息匹配规则,该方法包括以下步骤:
S1:源文件识别:计算机或移动智能设备把源文件录入到服务器中进行识别,识别出源文件的文字内容数据;
S2:文字预处理:服务器对识别到的文字内容数据进行逐项提取,生成文本集合并存储在存储器中,其中,文本集合包括若干个文本单元,文本单元均设有排列序号,排列序号根据文本单元在文本中的出现顺序生成,且提取时对识别到的文字进行去重处理,去掉文字内容中的乱码、空白行、空白段落以及重复段落;
S3:在存储器中调取版块标签匹配规则列表并放入内存单元;
S4:标记版块标签:按顺序在存储器中调取一个文本单元并与的版块标签匹配规则列表进行逐条比对;若文本单元与正在比对的某一版块标签匹配规则相匹配,则对该文本单元进行信息关联,将其关联匹配到的版块标签并进行标记;若文本单元不存在匹配的版块标签匹配规则,则不对该文本单元进行操作;重复步骤S4直至完成对所有文本单元的匹配;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东润弘科技有限公司,未经广东润弘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811152110.4/2.html,转载请声明来源钻瓜专利网。