|
钻瓜专利网为您找到相关结果 948209个,建议您 升级VIP下载更多相关专利
- [发明专利]数据抽取方法及装置-CN202210282481.4在审
-
周煜桦
-
北京国双科技有限公司
-
2022-03-22
-
2023-10-10
-
G06F40/289
- 本发明公开了一种数据抽取方法及装置,获取待进行数据抽取的目标文本的分词结果,并确定所述分词结果之间的依存关系,基于所述分词结果之间的依存关系,确定所述分词结果的依存结果,述依存结果包括与所述分词结果具有依存关系的依存子节点,筛选出依存子节点的依存关系为预设依存关系的分词结果,并将分词结果以及所述依存子节点进行排序,得到初始三元组,对所述初始三元组进行数据预处理操作,得到目标三元组。即本发明中,通过分词结果的依存关系,进行三元组的抽取,不再需要预先进行数据标注以及数次的模型训练迭代,提高三元组抽取效率。
- 数据抽取方法装置
- [发明专利]一种基于GRU-Glove算法的复杂文本分类方法-CN202210913217.6在审
-
阿音嘎;杨珍;房胜男;顾悦;姜军;冯翌新
-
公安部第一研究所
-
2022-08-01
-
2022-10-25
-
G06F40/289
- 首先,在分词阶段,利用GRU网络对文本进行初始分词,并利用Glove模型对分词结果进行补充修正,从而获得分词结果;其次,在分类阶段,使用GRU网络作为分类器算法对文本进行分类。本发明方法在分词阶段,利用GRU网络对文本进行初始分词,并利用Glove模型对分词结果进行补充修正,从而获得分词结果,最终的分词结果能够有效识别网络新词,解决现有技术所存在的分词不精确的问题,从而可以提高带有新型词汇复杂文本的分词的精确度和分类任务精确度
- 一种基于gruglove算法复杂文本分类方法
- [发明专利]文本召回方法及装置-CN202211740123.X在审
-
陈哲诗
-
北京龙智数科科技服务有限公司
-
2022-12-30
-
2023-04-14
-
G06F16/33
- 该方法包括:利用语句拓展模型对查询语句进行拓展,得到拓展语句;分别对查询语句和拓展语句进行预处理;利用维特比算法分别对预处理后的查询语句和拓展语句进行新词发现处理;利用结巴分词算法分别对新词发现处理后的查询语句和拓展语句进行分词,得到第一分词结果和第二分词结果;依据领域词库分别对第一分词结果和第二分词结果中的词语按照词语领域进行标注;根据查询语句、拓展语句、预处理后的查询语句和拓展语句、第一分词结果、第二分词结果、标注后的第一分词结果和第二分词结果,生成查询语句对应的搜索树;根据搜索树进行文本召回,以确定目标用户的查询结果。
- 文本召回方法装置
- [发明专利]一种中文分词方法及系统-CN200710076131.8无效
-
张会鹏
-
腾讯科技(深圳)有限公司
-
2007-06-26
-
2007-12-05
-
G06F17/27
- 本发明涉及中文信息处理领域,提供了一种中文分词方法及系统。所述方法包括以下步骤:A.对输入的中文文本进行原子切分,并根据所得的原子序列建立初始的切分词图;B.基于原子序列分别进行词典词切分和特定词识别,并将各自的独立分词结果添加到所述切分词图中;C.根据所述切分词图中的各独立分词结果生成一条最优分词路径,并按照所述最优分词路径输出综合分词结果。本发明基于中文文本的原子序列分别进行词典词切分和特定词识别,根据各自的独立分词结果生成一条最优分词路径,最终按照该最优分词路径输出综合分词结果,从而提高了中文分词的准确性。另外,在特定词识别中,根据具体情况有选择地启动对各类特定词的识别,提高了中文分词的效率。
- 一种中文分词方法系统
|