[发明专利]对文件自定义字段标引的处理方法、装置、服务器在审
| 申请号: | 202110254317.8 | 申请日: | 2021-03-09 |
| 公开(公告)号: | CN113095039A | 公开(公告)日: | 2021-07-09 |
| 发明(设计)人: | 杨林林;刘旭阳;张鑫;项晓露;周志翔 | 申请(专利权)人: | 智慧芽信息科技(苏州)有限公司 |
| 主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/169;G06F16/335;G06F16/35 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 唐敏 |
| 地址: | 215500 江苏省苏州市苏州工*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文件 自定义 字段 标引 处理 方法 装置 服务器 | ||
1.一种对文件进行自定义字段标引的处理方法,其特征在于,包括:
确定自定义字段的标引规则以及使用所述标引规则的文件范围,其中所述标引规则用于对所述自定义字段下的全部或部分子项的分类字段进行设置,所述文件范围的种类包括:对全部文件进行标引;
响应自动标引的触发指令,利用所述标引规则对所述文件范围内的文件进行自定义字段的标引处理。
2.根据权利要求1所述的方法,其特征在于,所述标引规则包括:
对于文本类型的自定义字段,基于文本字段中过滤词汇出现的次数设置的词频过滤规则。
3.根据权利要求1所述的方法,其特征在于,所述标引规则中的全部或部分规则基于与、或、非的逻辑运算进行关联。
4.根据权利要求2所述的方法,其特征在于,所述词频过滤规则还用于:
对所述文件中文本内容出现的过滤词汇进行过滤,
和/或,
对所述文件中所包括的批复信息中出现的过滤词汇进行过滤,其中,所述批复信息包括下述中的至少一种:
文件中内容的注释信息;
文件中内容的批注信息;
文件中内容的备忘信息;
以及与所述注释信息、批注信息、备忘信息的相对应的回复信息。
5.根据权利要求2所述的方法,其特征在于,所述文件为专利文件,所述词频过滤规则还可以用于对至少下述之一的文本内容进行词频过滤:发明名称、摘要、权利要求、说明书、识别出的说明书附图中所包含的文字信息。
6.根据权利要求1所述的方法,其特征在于,所述文件范围的种类还包括:
对未标引的文件进行标引、对新增的文件进行标引。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应规则修改指令,对所述自定义字段的标引规则进行修改,得到更新后的标引规则;
或者,响应规则修改指令,对所述自定义字段的标引规则进行修改,得到更新后的标引规则之后,利用更新后的标引规则对所述文件范围内的文件进行自定义字段的标引处理。
8.根据权利要求1所述的方法,其特征在于,所述自定义字段标的类型包括:
选项字段和/或层级字段。
9.根据权利要求7所述的方法,其特征在于,所述对所述自定义字段的标引规则进行修改,得到更新后的标引规则包括:
根据标引处理的结果调整所述标引规则中的参数值和/或运算逻辑,得到更新后的标引规则。
10.一种对文件进行自定义字段标引的处理装置,其特征在于,包括:
规则定义模块,用于确定自定义字段的标引规则以及使用所述标引规则的文件范围,其中所述标引规则用于对所述自定义字段下的全部或部分子项的分类字段进行设置,所述文件范围的种类包括;对全部文件进行标引;
标引处理模块,用于响应自动标引的触发指令,利用所述标引规则对所述文件范围内的文件进行自定义字段的标引处理。
11.根据权利要求10所述的装置,其特征在于,所述标引规则包括:
对于文本类型的自定义字段,基于文本字段中过滤词汇出现的次数设置的词频过滤规则。
12.根据权利要求10所述的装置,其特征在于,所述标引规则中的全部或部分规则基于与、或、非的逻辑运算进行关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智慧芽信息科技(苏州)有限公司,未经智慧芽信息科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110254317.8/1.html,转载请声明来源钻瓜专利网。





