[发明专利]一种查找人员影踪的方法及装置在审
申请号: | 201410451454.0 | 申请日: | 2014-09-08 |
公开(公告)号: | CN104239483A | 公开(公告)日: | 2014-12-24 |
发明(设计)人: | 刘健萍 | 申请(专利权)人: | 刘健萍 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 528100 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 查找 人员 影踪 方法 装置 | ||
1.一种查找人员影踪的方法,其特征在于,所述方法包括 :将存储的新闻数据中的每个独立的句子通过模式匹配提取每个独立句子中的时间信息 ;在包含有时间信息的独立句子中提取地点信息,在检测出该地点信息的前一个相邻的词存在于存储的趋向描述词集合时,则确定所述地点信息为有效的地点信息 ;在包含有效地点信息的独立句子中提取人员信息,如提取的人员信息为唯一的人员,则将所述独立句子中的人员、时间、地点作为该人员的一条影踪,并存储该人员影踪;在具有人员影踪的独立句子中获取事件描述词,并对该事件描述词赋予权重值 ;并将该事件描述词和事件描述词的权重值增加到存储的人员影踪中。
2.根据权利要求1所述的方法,其特征在于,所述方法在存储该人员影踪之前还包括 :统计相同的人员影踪出现的次数,并将该相同的人员影踪出现的次数增加到存储的人员影踪中。
3.根据权利要求 1 所述的方法,其特征在于,所述在具有人员影踪的独立句子中获取事件描述词包括 :搜索所述独立句子中与预先存储的事件描述词列表匹配的事件描述词,并将该匹配的事件描述词作为获取的事件描述词;或提取句子中的动词,将该动词作为获取的事件描述词。
4.根据权利要求 1 所述方法,其特征在于,所述方法在存储该人员影踪之后,还包括 :接收到查找特定人员在特定日期的命令时,在存储的影踪中获取与该特定人员和特定日期相匹配的影踪,并选择人员影踪的出现次数超出次数阈值且事件描述词的权重值最大的影踪输出。
5.根据权利要求 1 所述的方法,其特征在于,所述在包含有时间信息的独立句子中提取地点信息包括 :将所述独立句子进行分词处理后,提取地点信息。
6.根据权利要求 1 所述的方法,其特征在于,将存储的新闻数据中的每个独立的句子通过模式匹配提取每个独立句子中的时间信息包括 :对所述每个独立的句子采用正则表达式提取所述每个独立句子中的时间信息。
7.一种查找人员影踪的装置,其特征在于,所述装置包括 :时间单元,用于将存储的新闻数据中的每个独立的句子通过模式匹配提取每个独立句子中的时间信息 ;地点单元,用于在包含有时间信息的独立句子中提取地点信息,在检测出该地点信息的前一个相邻的词存在于存储的趋向描述词集合时,则确定所述地点信息为有效的地点信息 ;任务单元,用于在包含有效地点信息的独立句子中提取人员信息,如提取的人员信息为唯一的人物,则将所述独立句子中的人员、时间、地点作为该人员的一条影踪,并存储该人员影踪 ;事件单元,用于在具有人员影踪的独立句子中获取事件描述词,并对该事件描述词赋予权重值 ;并将该事件描述词和事件描述词的权重值增加到存储的人员影踪中。
8.根据权利要求 7 所述的装置,其特征在于,所述装置还包括 :次数单元,用于统计相同的人员影踪出现的次数,并将该相同的人员影踪出现的次数增加到存储的人员影踪中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘健萍,未经刘健萍许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410451454.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:升级文件的清理方法和装置
- 下一篇:一次性病理活检标本瓶内胆