[发明专利]一种数据处理方法、设备、系统及计算机可读介质有效
申请号: | 201711283167.3 | 申请日: | 2017-12-07 |
公开(公告)号: | CN107967260B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 董超;崔朝辉 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/35 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 郭一斐;叶万东 |
地址: | 110179 辽宁省沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及一种数据处理方法、设备、系统及计算机程序产品,其中方法包括:对原始数据进行预处理以获得多个数据集;基于所检测到的情感标识和评价对象来生成包括内容项的意见短语,并且为每个意见短语设置关联权重;基于情感标识对意见短语进行分类,以确定正面意见短语集合和负面意见短语集合;基于评价对象来获得多个正面对象组和多个负面对象组;以及基于每个正面对象组中内容项的组内相似度确定正面表达项,并基于每个负面对象组中内容项的组内相似度确定负面表达项。 | ||
搜索关键词: | 一种 数据处理 方法 设备 系统 计算机 可读 介质 | ||
【主权项】:
一种数据处理方法,所述方法包括:对原始数据进行预处理以获得多个数据集,其中每个数据集包括至少一个数据单元;基于每个数据单元中所检测到的情感标识和评价对象来生成包括内容项的意见短语,并且为每个意见短语设置关联权重;基于情感标识对意见短语进行分类,以确定正面意见短语集合和负面意见短语集合;基于评价对象对所述正面意见短语集合中的意见短语进行归类以获得多个正面对象组,并且基于评价对象对所述负面意见短语集合中的意见短语进行归类以获得多个负面对象组;以及基于每个正面对象组中内容项的组内相似度确定正面表达项,并基于每个负面对象组中内容项的组内相似度确定负面表达项。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711283167.3/,转载请声明来源钻瓜专利网。
- 上一篇:泰语音节切分的方法及装置
- 下一篇:智能客服中交互式问句语义理解方法