|
钻瓜专利网为您找到相关结果 43024个,建议您 升级VIP下载更多相关专利
- [发明专利]同义词的获取方法及装置-CN201410156167.7有效
-
阮淑梨;蒋建;魏洪平;谢庆伟
-
阿里巴巴集团控股有限公司
-
2014-04-17
-
2018-12-14
-
G06F17/30
- 本发明涉及一种同义词的获取方法及装置,该方法包括:获取文本集,对文本集进行分词生成第一词语集;对第一词语集通过停词表进行无效词过滤生成第二词语集;对第二词语集中的任意两个词语进行编辑距离处理生成第一同义词对集;对第一词语集中的词语构建向量空间模型;根据该模型获得每对同义词的空间向量,计算每对同义词的余弦相似度值,将每对同义词进行余弦阈值过滤策略的识别,生成第二同义词对集;对第二同义词对集中的词语进行词性标注生成第三同义词对集;将第三同义词对集中的词语通过一元模型处理后获取同义词。因此,本申请实现了检索出的同义词更为准确,并且没有歧义词语和无效词语出现,从而智能的检索出同义词的相关网页。
- 同义词获取方法装置
- [发明专利]信息检索方法及装置-CN201110391864.7有效
-
申月;金凯民
-
阿里巴巴集团控股有限公司
-
2011-11-30
-
2013-06-05
-
G06F17/30
- 本申请公开了一种信息检索方法及装置,该方法包括:获取选定类目下的展示信息,从所述展示信息中挖掘同义词对;确定所述同义词对中包含的词的语境谱和属性谱;其中,所述语境谱包括包含的词与其同义词的相关度;所述属性谱包括包含的词的属性以及每个所述属性的属性权重;针对每个同义词对,根据同义词对中包含的词的语境谱和属性谱,得到同义词对的综合相关度,为综合相关度符合设定条件的同义词对建立一个共用检索索引;当获取到的用户的搜索信息中包含所述同义词对中的词时,使用所述同义词对的共用检索索引进行检索该方法能够更有效的挖掘到可用的同义词对,提高搜索引擎的检索效率。
- 信息检索方法装置
- [发明专利]同义词挖掘方法、同义词挖掘装置及存储介质-CN201911234262.3在审
-
张振中
-
京东方科技集团股份有限公司
-
2019-12-05
-
2020-04-10
-
G06F40/247
- 一种同义词挖掘方法、同义词挖掘装置及存储介质。该同义词挖掘方法包括:对输入的语料数据进行识别处理,以得到至少一个类别的命名实体集合;对每个类别的命名实体集合进行聚类处理,以得到每个类别对应的同义词候选集合;以及,基于词形相似度和上下文相似度,对每个类别对应的同义词候选集合进行过滤处理,以得到每个类别对应的同义词集合。该同义词挖掘方法可以基于词形相似度和上下文相似度,对聚类处理得到的同义词候选集合进行过滤处理,从而可以提升得到的同义词集合的纯度,进一步地,基于挖掘的同义词集合可以构建同义词词典,将其应用于自然语言处理领域时,可以提高知识点过滤、关键词提取、文本分类、语义聚类等任务的准确性。
- 同义词挖掘方法装置存储介质
- [发明专利]同义词获取方法及装置-CN201910160822.9有效
-
谭小龙;汤煌;张小鹏
-
腾讯科技(深圳)有限公司
-
2019-03-04
-
2023-05-30
-
G06F40/247
- 本申请实施例公开了一种同义词获取方法及装置,利用两个关键词对应的语句对的数目越大,两个关键词是同义词的概率越大的思想,两个关键词对应的语句对是指该语句对的查询语句包含一个关键词,该语句对的命中结果语句包含另一个关键词;首先得到查询词对应的至少一个候选同义词,获取所述至少一个候选同义词分别对应的加权共现频次,一个候选同义词的加权共现频次至少表征语句集合包含的第一语句对的数目,第一语句对中的查询语句包含查询词且第一语句对中的命中结果语句包括该候选同义词至少基于所述至少一个候选同义词分别对应的加权共现频次,从所述至少一个候选同义词中获得所述查询词的同义词。从而实现了获取查询词的同义词的目的。
- 同义词获取方法装置
|