[发明专利]非结构化数据处理方法及系统有效
申请号: | 201410054773.8 | 申请日: | 2014-02-18 |
公开(公告)号: | CN103761337B | 公开(公告)日: | 2017-02-08 |
发明(设计)人: | 叶向维 | 申请(专利权)人: | 上海锦恩信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海弼兴律师事务所31283 | 代理人: | 胡美强,王婧荷 |
地址: | 201308 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种非结构化数据处理方法及系统。该非结构化数据处理方法包括以下步骤设置多个包括关键词的特征模板;分别使用各个特征模板扫描存储有多条非结构化数据的数据库,针对各条非结构化数据分别判断其中是否记载有和各个特征模板一致的内容,并将判断结果为是的特征模板作为各条非结构化数据匹配的特征模板记录;生成与该多条非结构化数据分别一一对应的多个模板向量,每个模板向量具有一一对应于该多个特征模板的多个维度。本发明的非结构化数据处理方法及系统,通过利用特征模板将非结构化数据处理成向量形式,使得后续的计算处理针对模板向量进行,降低了对于非结构化数据的数据分析所需要的计算资源和时间。 | ||
搜索关键词: | 结构 数据处理 方法 系统 | ||
【主权项】:
一种非结构化数据处理方法,其特征在于,包括以下步骤:S1、设置多个特征模板,每个特征模板包括关键词;S2、分别使用各个特征模板扫描存储有多条非结构化数据的一数据库,针对各条非结构化数据分别判断其中是否记载有和各个特征模板一致的内容,并将判断结果为是的特征模板作为各条非结构化数据匹配的特征模板记录;S3、生成与该多条非结构化数据分别一一对应的多个模板向量,每个模板向量具有一一对应于该多个特征模板的多个维度,该多个维度中,各条非结构化数据匹配的特征模板对应的维度的标量值为1、不匹配的特征模板对应的维度的标量值为0;S4、读取待挖掘特征;S5、判断该多个特征模板中是否存在和该待挖掘特征一致的特征模板,若是则执行S6,若否则执行S7;S6、选取和该待挖掘特征一致的特征模板对该多个模板向量进行匹配,选取匹配成功的模板向量作为待输出向量,并执行S9;S7、生成一特征模板组合以表示该待挖掘特征,该特征模板组合为由逻辑运算符连接的若干特征模板;S8、采用该特征模板组合对该多个模板向量进行匹配,选取匹配成功的模板向量作为待输出向量,并执行S9;S9、选取和待输出向量对应的非结构化数据,并输出选取的非结构化数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海锦恩信息科技有限公司,未经上海锦恩信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410054773.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车起动机机壳多凸台一次成型模具
- 下一篇:一种非尼古丁戒烟器