[发明专利]信息处理方法及装置、存储介质、电子装置在审
申请号: | 201810644005.6 | 申请日: | 2018-06-21 |
公开(公告)号: | CN110633410A | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 陆平;韦安军;胡晓 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/182;G06K9/62 |
代理公司: | 11240 北京康信知识产权代理有限责任公司 | 代理人: | 江舟;董文倩 |
地址: | 518057 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 话题数据 结构化数据 预处理 存储介质 电子装置 模型文件 热度信息 信息处理 流行度 话题 分析 | ||
1.一种信息处理方法,其特征在于,包括:
获取话题数据;
对所述话题数据进行预处理得到结构化数据;
将所述结构化数据输入至模型文件,计算得到所述话题数据的热度信息。
2.根据权利要求1所述的方法,其特征在于,在计算得到所述话题数据的热度信息之后,所述方法还包括:
在前端界面展示所述话题数据的热度信息。
3.根据权利要求1所述的方法,其特征在于,在将所述结构化数据输入至模型文件之前,所述方法还包括以下之一:
训练所述模型文件;
预设所述模型文件。
4.根据权利要求3所述的方法,其特征在于,训练所述模型文件包括:
对样本文本数据进行分词,去掉所述样本文本数据中指定类型的字符,得到第一数据;
对所述第一数据进行单词嵌入处理,得到第二数据;
对所述第二数据的词向量进行加和并取平均值,得到第三数据;
对所述第三数据按照类别对原始模型进行高斯混合模型训练,得到所述模型文件。
5.根据权利要求1所述的方法,其特征在于,将所述结构化数据输入至模型文件,计算得到所述话题数据的热度信息,包括:
对结构化数据进行分词,去掉所述结构化数据中指定类型的字符,得到第一结构化数据;
对所述第一结构化数据进行单词嵌入处理,得到第二结构化数据;
对所述第二结构化数据的词向量进行加和并取平均值,得到第三结构化数据;
将所述第三结构化数据输入至所述模型文件,得到每条数据的归类和类别概率;
计算所述类别概率得到所述话题数据的热度信息。
6.根据权利要求1所述的方法,其特征在于,对所述话题数据进行预处理得到结构化数据包括:
按照数据类型拆分所述话题数据;
删除所述话题数据中包含的特定类型的数据,得到候选数据,其中,所述特定类型包括以下至少之一:图片,语音,表情;
将所述候选数据规整为结构化数据。
7.根据权利要求1所述的方法,其特征在于,获取话题数据包括:
从互联网上抓取所述话题数据,其中,所述话题数据包括以下至少之一:话题内容,评论信息。
8.一种信息处理装置,其特征在于,包括:
获取模块,用于获取话题数据;
处理模块,用于对所述话题数据进行预处理得到结构化数据;
计算模块,用于将所述结构化数据输入至模型文件,计算得到所述话题数据的热度信息。
9.根据权利要求8所述的装置,其特征在于,所述计算模块包括:
第一处理单元,用于对结构化数据进行分词,去掉所述结构化数据中指定类型的字符,得到第一结构化数据;
第二处理单元,用于对所述第一结构化数据进行单词嵌入处理,得到第二结构化数据;
第一计算单元,用于对所述第二结构化数据的词向量进行加和并取平均值,得到第三结构化数据;
第二计算单元,用于将所述第三结构化数据输入至所述模型文件,计算得到每条数据的归类和类别概率;
第三计算单元,用于计算所述类别概率得到所述话题数据的热度信息。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的方法。
11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7任一项中所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810644005.6/1.html,转载请声明来源钻瓜专利网。