[发明专利]一种保留非结构化文本语义的文本可视化方法有效
申请号: | 201911081479.5 | 申请日: | 2019-11-07 |
公开(公告)号: | CN110781289B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 周锋;汪文君;李小勇 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/338 | 分类号: | G06F16/338;G06F40/106;G06F40/284;G06F40/289;G06F40/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种保留非结构化文本语义的社交媒体文本可视化方法,包括如下步骤:步骤S101,对输入本文进行分词、过滤、词性标注、获取依赖关系;步骤S102,基于词性标注与词汇间的依赖关系,构建句法二叉树,计算每条文本的情感极性,将文本集划分为正、负两类;步骤S103,分别对正负两类文本,基于词频与词汇在每条文本中的共现关系,生成词汇序列模式,保留语义;步骤S104,基于正负文本集所占权重,分配可视空间,设计可视字体、色彩;步骤S105,采用布局算法,展现序列模式内、序列模式间的语义关系;步骤S106,引入交互设计,使用户可关注局部细节。采用本发明的方法,实现对社交媒体文本的可视化,清晰呈现文本的情感取向、观点语义与舆论支持度,有效呈现文本信息,有助于文本分析。 | ||
搜索关键词: | 一种 保留 结构 文本 语义 可视化 方法 | ||
【主权项】:
1.一种保留非结构化文本语义的社交媒体文本可视化方法,其特征在于包括如下步骤:/n步骤S101,对输入本文进行分词、过滤、词性标注和词汇间依赖关系的获取;/n步骤S102,基于词性标注与词汇间的依赖关系,构建句法二叉树,计算每条文本的情感极性,将文本集划分为正、负两类;/n步骤S103,分别对正负两类文本,基于词频和词汇在每条文本中的共现关系,生成词汇序列模式,保留语义;/n步骤S104,基于正负文本集所占权重,分配可视空间,设计可视字体、色彩;/n步骤S105,采用布局算法,展现序列模式内、序列模式间的语义关系;/n步骤S106,引入交互设计,使用户可关注局部细节;/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911081479.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种汉语由字组词方法及装置
- 下一篇:一种长篇章结构化文本摘要提取方法