[发明专利]基于科技政策文本的主题发现与趋势分析方法在审
申请号: | 201711202951.7 | 申请日: | 2017-11-27 |
公开(公告)号: | CN108009225A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 范通让;王建民;贾红佳;赵月琴;张博 | 申请(专利权)人: | 石家庄铁道大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 石家庄轻拓知识产权代理事务所(普通合伙) 13128 | 代理人: | 黄辉本 |
地址: | 050043 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于科技政策文本的主题发现与趋势分析方法,针对科技政策文本规模大、篇幅长的特点,采用LDA主题模型对政策文本进行建模,将文本集合从高维的词空间映射到低维的主题空间,有效解决了在处理大规模数据时容易产生的文本表示空间高维稀疏的问题,提高分析效率;本发明还提出了依据科技政策中包含主题的相似度大小,利用k‑means算法实现对科技政策的聚类操作,将科技政策集合划分为不同的类簇,针对k‑means算法存在的不足,提出了基于社区发现的k‑means改进算法,通过社区发现和社区中的中心节点选择方法,确定最优的聚类数量和初始聚类中心,并通过实验验证了所提出改进方法的有效性。 | ||
搜索关键词: | 基于 科技 政策 文本 主题 发现 趋势 分析 方法 | ||
【主权项】:
1.一种基于科技政策文本的主题发现与趋势分析方法,其特征在于:首先根据科技政策主题与所构建的主题库之间的关系,建立文本数学模型,用于实现文本信息到数字信息的转化过程,再与构建的主题库进行关联分析;然后利用改进聚类算法对科技政策实现主题发现,建立主题强度模型,进行主题过滤和主题趋势分析,目的在于对所发现的科技政策主题建立热门程度的度量标准,强度越大,表明该主题的关注度越高;最后构建用于指导判断科技政策的主题发现与主题分析的数据模型,利用所构建的数据模型进行科技政策文本的主题发现和趋势分析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石家庄铁道大学,未经石家庄铁道大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711202951.7/,转载请声明来源钻瓜专利网。