“聚类词袋”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果1061065个，建议您升级VIP下载更多相关专利

[发明专利]一种基于语义层次聚类的软件功能需求分类方法及系统-CN202011488329.9在审
发明人：张腾飞;刘建;褚福常 -专利权人：江苏徐工工程机械研究院有限公司
申请日： 2020-12-16 - 公布日： 2021-02-26 - 主分类号： G06F40/30 文献下载
摘要：本发明公开了一种基于语义层次聚类的软件功能需求分类方法，包括将功能需求文本整理成名词加动词的标准文本；对整理后的标准文本进行切词；对切词后的文本构建词袋模型；将词袋模型中的词袋向量转成权值向量；对转换后的权值向量进行余弦相似度计算；对经过余弦相似度计算后的权值向量进行聚类，本发明利用层次聚类算法计算能力强，效率高且分类个数可调的特点，直观准确的显示分类效果。
一种基于语义层次软件功能需求分类方法系统

[发明专利]一种基于词袋树群模型的机器人定位和导航方法-CN201710081020.X有效
发明人：刘宏;金永庆;宋章军;张国栋;赵晨阳;吴观明 -专利权人：北京大学深圳研究生院;深圳市银星智能科技股份有限公司
申请日： 2017-02-15 - 公布日： 2020-07-10 - 主分类号： G01C21/20 文献下载
摘要：本发明公开一种基于词袋树群模型的机器人定位和导航方法。该方法为：1)输入长时间的包含低动态室内场景变化的视频流；2)从视频流图像中离线抽取特征；3)对得到的特征通过k‑means++算法进行聚类；4)对聚类得到的子空间进行迭代聚类；5)对迭代聚类后的特征建立词袋树模型；6)建立词袋树群模型；7)通过统计原理对低动态物体的运动规律进行统计；8)根据词袋树群模型，利用所述运动规律分析确定当前时刻对应的词袋树模型；9)将确定的词袋树模型用于回环检测，实现机器人在低动态环境下的定位和导航
一种基于词袋树群模型机器人定位导航方法

[发明专利]文本聚类的方法及系统-CN201610830223.X有效
发明人：李贤;陈振安;王鹏 -专利权人：广州视源电子科技股份有限公司
申请日： 2016-09-18 - 公布日： 2020-02-07 - 主分类号： G06F16/35 文献下载
摘要：本发明涉及一种文本聚类的方法及系统，一种文本聚类的方法，包括以下步骤：在接收到待分类文本时，提取待分类文本的关键词；根据获取的最终词袋中的关键词，对待分类文本的关键词进行匹配，得到待分类文本的类型标签；最终词袋为根据预设的选取规则对各类标词袋中的关键词进行排序和筛选后得到的；类标词袋为对各类型标签分别对应的各文本进行关键词提取后生成的关键词的集合。本发明通过已有标签的记录来提取每个标签对应的核心词，得到最终词袋，然后通过最终词袋中的核心词来分类每个待分类的文本，对于噪音数据有着很好的适应性，不会出现在有较多噪音情况下，准确率大幅下降的情况；通过质心大范围阈值化
文本方法系统

[发明专利]图像处理方法、装置、电子设备及存储介质-CN201911084122.2在审
发明人：施智平;付超凡;邵振洲;关永;韩旭;张永祥;姜那 -专利权人：首都师范大学
申请日： 2019-11-07 - 公布日： 2020-02-28 - 主分类号： G06K9/34 文献下载
摘要：本公开实施例公开了一种图像处理方法、装置、电子设备及存储介质，所述方法包括：对待处理图像集中待处理图像中的动态物体进行过滤，得到静态图像；利用CNN网络提取所述静态图像中的局部特征，并对所述局部特征进行聚类，得到多个聚类中心点；根据所述多个聚类中心点构建所述静态图像的视觉词袋模型，将所述静态图像的局部特征映射到所构建的所述视觉词袋模型上，并根据所述视觉词袋模型对所述待处理图像集进行特征向量表示，并根据所述特征向量表示的结果进行闭环检测
图像处理方法装置电子设备存储介质

[发明专利]基于双聚类的微博用户标签自动生成算法-CN201510026697.4有效
发明人：刘合兵;韩立新;张钰;郑晓刚;朱利达 -专利权人：河海大学
申请日： 2015-01-19 - 公布日： 2017-08-11 - 主分类号： G06F17/30 文献下载
摘要：本发明公开了一种基于双聚类的微博用户标签自动生成算法，其特征在于包括以下步骤以维基百科为基础，采用双聚类算法构建语义本体；获取微博用户的微博信息并进行预处理，得到词袋模型；利用语义本体从词袋模型中提取词，并对有歧义词进行消歧处理；将消歧后的词映射到维基百科中相应的类别节点上，构造类别子树；针对用户微博内容收集用户标签；采用投票策略，最终生成用户标签。本发明以维基百科为基础，采用双聚类算法构建语义本体，定位微博中文本词语的对应词，对有歧义词进行消歧处理，为词准确对应类别，为用户生成高准确率的标签。
基于双聚类用户标签自动生成算法

[发明专利]一种词袋模型优化和图像识别的方法及装置-CN201610900207.3有效
发明人：柳杨;李学明 -专利权人：北京邮电大学
申请日： 2016-10-14 - 公布日： 2019-08-06 - 主分类号： G06K9/62 文献下载
摘要：一种词袋模型优化和图像识别的方法及装置，其中，所述图像识别方法，包括：获取待测试图像的局部特征向量；将所述局部特征向量输入到利用词袋模型优化方法优化后的词袋模型中；根据所述词袋模型中的聚类词汇以及所述聚类词汇的权重，计算所述测试图像在每一个词袋模型中的编码残差；将所述多个词袋模型的所述编码残差进行排序，根据所述编码残差的大小，判断所述待测试图像的类别，本方法不需要大量训练样本图像就能获得很好的识别准确率，同时解决了大部分图像识别模型扩展能力差的问题
一种模型优化图像识别方法装置

[发明专利]一种基于分类驱动的可视化词袋特征权重化方法和系统-CN201310285891.5无效
发明人：金海;郑然;朱磊;冯晓文 -专利权人：华中科技大学
申请日： 2013-07-08 - 公布日： 2013-11-20 - 主分类号： G06F17/30 文献下载
摘要：本发明公开了一种基于分类驱动的可视化词袋特征权重化方法，包括：从网络下载图像，并建立图像数据库，提取图像数据库中所有N张图像的可视化词袋特征，建立所有N张图像的可视化词袋特征的倒排索引，从图像数据库中随机抽取N1张图像及其对应的可视化词袋特征，通过聚类算法将N1张图像形成C个视觉类，并从每个视觉类中随机选择图像组成该视觉类的学习样本集，针对每一视觉类，在该视觉类的学习样本集上建立可视化词袋特征的权重学习样本集，并利用该权重学习样本集训练每个视觉类，以形成该视觉类的支持向量机判别模型。
一种基于分类驱动可视化特征权重方法系统

[发明专利]一种基于多义词和同义词的聚类矫正方法-CN202310248724.7在审
发明人：郑志松;林锋;吴运昌;丁仙峰 -专利权人：江苏数兑科技有限公司
申请日： 2023-03-15 - 公布日： 2023-07-04 - 主分类号： G06F40/247 文献下载
摘要：本发明公开了一种基于多义词和同义词的聚类矫正方法，包括以下步骤：构建文本语料库并统计文本的词频信息；在文本的上下文中找出含有多义词或同义词的句子；对于多义词，提取原始句子的特征向量，进行多义矫正，计算词向量的余弦相似度；对于同义词，使用word2vec模型训练文本的上下文重建文本语料库，将单词表示成一个长向量，输入到机器学习模型当中作为语料库，进行同义矫正，将数字存储在哈希表中；进行迭代优化，计算梯度，并在非叶节点处提取向量；本方案通过关注聚类过程中的多义词和同义词问题，使用词袋模型来区分相同词语的语境以及通过word2vec模型来重新聚类具有相似含义的词，达到聚类过程纠正的目的。
一种基于多义词同义词矫正方法

[发明专利]文本推荐方法、装置、计算机设备和存储介质-CN202210582087.2在审
发明人：易明 -专利权人：中国平安人寿保险股份有限公司
申请日： 2022-05-26 - 公布日： 2022-08-23 - 主分类号： G06F16/335 文献下载
摘要：本申请涉及人工智能领域，提供一种文本推荐方法、装置、计算机设备和存储介质，该文本推荐方法首先获取待推荐的文本列表，待推荐的文本列表包括多个文本；然后利用预设的词袋模型对每一个文本进行特征提取，得到各个文本对应的多级标签；基于各个文本对应的多级标签，得到各个文本对应的关键词列表；随后利用预设的人工智能模型对关键词列表进行特征提取处理，得到与各个关键词列表对应的聚类簇；当各个聚类簇中存在多个关键词列表，从多个关键词列表对应的文本中随机选取一个文本，得到各个聚类簇对应的推荐文本；遍历各个聚类簇，由各个聚类簇对应的推荐文本构成文本推荐列表。
文本推荐方法装置计算机设备存储介质

[发明专利]关键词的聚类方法、装置、存储介质和电子设备-CN201910944133.7在审
发明人：韩旭红 -专利权人：北京国双科技有限公司
申请日： 2019-09-30 - 公布日： 2021-03-30 - 主分类号： G06F16/35 文献下载
摘要：本发明公开了一种关键词的聚类方法、装置、存储介质和电子设备。该方法包括：确定待聚类关键词的词向量；根据待聚类关键词的词向量和每个聚类中所包含关键词的词向量，确定待聚类关键词与每个聚类之间的相似度；根据待聚类关键词与每个聚类之间的相似度，确定待聚类关键词所在的聚类通过本发明，达到了提高对关键词进行聚类的准确性的效果。
关键词方法装置存储介质电子设备

[发明专利]基于共现分析和谱聚类的医疗数据信息检索方法-CN202210234485.5有效
发明人：陈宣亦;张子成;章斌;朱志安;杨杰 -专利权人：南京云设智能科技有限公司
申请日： 2022-03-10 - 公布日： 2022-12-09 - 主分类号： G06F16/33 文献下载
摘要：本发明公开了一种基于共现分析和谱聚类的医疗数据信息检索方法，对检索任务词汇进行查询扩展，将扩展后的检索任务词汇分类为检索词、扩展词和特征词，对文献进行首次记分，如果首次得分大于阈值T则选中文献，小于阈值T则放弃文献；对选中文献进行二次计分和共现分析，得到二次得分和共现得分，并通过首次得分、二次得分和共现得分计算文献的综合得分；使用词袋模型将文献的化学词列表、医学主题词列表、摘要和关键词列表组成描述文献的向量，以向量距离矩阵作为谱聚类的输入对选中文献进行聚类，输出聚类簇；输出平均综合得分最高的那个类作为检索结果，并对检索结果中的文献按综合得分进行降序排序输出。
基于分析谱聚类医疗数据信息检索方法

[发明专利]一种基于深度学习和词袋模型的闭环检测方法-CN202110024649.7在审
发明人：阮晓钢;余鹏程;朱晓庆 -专利权人：北京工业大学
申请日： 2021-01-08 - 公布日： 2021-04-23 - 主分类号： G06K9/62 文献下载
摘要：本发明公开了一种基于深度学习和词袋模型的闭环检测方法，将VGG16网络提取的多个含有语义信息的特征图作为多个语义描述子代替ORB描述子传给词袋模型，使提取的特征更适用于闭环检测；构建词袋模型的单词表，用K‑means对前面提取的语义特征描述子进行聚类运算，获得聚类的中心从而当做词袋模型的单词表；提取该算法下的特征向量，利用VGG网络，从每幅图像中提取很多个语义描述子，这些语义描述子都用单词表中的单词近似代替本发明在数据集上实验表明,相较于传统的视觉词袋模型方法,该算法具有更强的泛化性,可以在闭环检测中达到更高的准确率。
一种基于深度学习模型闭环检测方法

[发明专利]文本聚类方法、装置、电子设备及计算机程序产品-CN202111264094.X在审
发明人：万飞 -专利权人：语联网（武汉）信息技术有限公司
申请日： 2021-10-27 - 公布日： 2023-05-02 - 主分类号： G06F16/33 文献下载
摘要：本申请涉及文本处理技术领域，提供一种文本聚类方法、装置、电子设备及计算机程序产品，该方法包括：根据预训练词向量集合和各个待聚类文本的类别标签关键词和文本关键词，计算各个待聚类文本的类别标签关键词向量和文本关键词向量；根据预训练词向量集合和预设知识图谱中的各个聚类文档，计算预设知识图谱中各个簇类的类别平均关键词向量和类别文档平均关键词向量；根据各个待聚类文本的类别标签关键词向量和文本关键词向量，与各个簇类的类别平均关键词向量和类别文档平均关键词向量，之间的相似度值对各个待聚类文本进行聚类。本申请实施例提供的文本聚类方法通过知识图谱和词向量对待聚类文本进行聚类，提升了文本聚类的效率。
文本方法装置电子设备计算机程序产品

[发明专利]一种基于AP聚类词袋建模的行为识别方法-CN201610216759.2在审
发明人：宦若虹;郭峰;王楚 -专利权人：浙江工业大学
申请日： 2016-04-07 - 公布日： 2016-08-03 - 主分类号： G06K9/62 文献下载
摘要：一种基于AP聚类词袋建模的行为识别方法，包括：视频的时空兴趣点检测；对检测得到的所有时空兴趣点使用3D HOG和3D HOF描述子进行描述得到联合的特征向量；对所有的特征向量进行AP聚类生成视觉词典，并用视觉词典重新描述特征向量本发明可以一次性获取合适的视觉词典容量，不需要像传统的词袋模型那样进行多次试验，可以极大地减少聚类时间，且该方法对联合描述的多种局部特征的聚类效果更佳，有利于提高行为识别率。
一种基于 ap 聚类词袋建模行为识别方法

[发明专利]一种面向图书市场书名的短文本聚类方法-CN201510886332.9有效
发明人：李欢;孙阳;刘海星;张立;尤树林 -专利权人：北京航空航天大学;化学工业出版社
申请日： 2015-12-04 - 公布日： 2019-09-20 - 主分类号： G06F16/35 文献下载
摘要：本发明提供一种面向图书市场书名的短文本聚类方法，包括：对文本数据及设定的聚类关键词进行词向量化，计算文本数据词向量到所述聚类关键词向量的距离，根据每个文本数据词向量到所述聚类关键词向量的距离确定所述文本数据的聚类类型，根据所述文本数据的聚类类型将所述文本数据划分到对应的聚类集合；计算每个聚类集合中的所有文本数据词向量中的特征词的文件词频‑逆向文件频率TF‑IDF值，确定TF‑IDF值满足设定条件的特征词作为所述聚类集合的更新后的聚类关键词；根据所述更新后的聚类关键词确定所述文本数据的聚类类型。采用本发明实施例提供的方法，能够更加准确地确定文本数据的聚类类型，使聚类结果能够更接近用户的实际需求。
一种面向图书市场书名文本方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
下一页»
尾页
共 100000 条