[发明专利]一种信息处理方法及电子设备有效
| 申请号: | 201910815033.4 | 申请日: | 2019-08-30 |
| 公开(公告)号: | CN110516254B | 公开(公告)日: | 2021-07-16 |
| 发明(设计)人: | 王萌萌 | 申请(专利权)人: | 联想(北京)有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/35 |
| 代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 韩岳松 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息处理 方法 电子设备 | ||
本申请公开了一种信息处理方法及电子设备,方法包括:获取预设的第一数据,根据预设提取规定所定义的词汇权重,从第一数据中提取出至少一个实体词;确定与实体词相关联的关联词,建立实体词与关联词之间的关联边,以构建对应于第一数据的共现图,其中,实体词、关联词以及关联边均对应有各自的权重;基于预设聚类规定对共现图进行聚类操作,形成至少一个图聚类,图聚类中至少包括一个实体词及相应的关联词;基于图聚类中的实体词和/或关联词的含义,确定图聚类对应的表达意图,以确定第一数据的表达意图。该方法可以每个实体词从各个角度全面归纳出第一数据的实际意图;实现了对第一数据的智能分析,从而能够对当前数据进行精确而有效的处理。
技术领域
本申请涉及人工智能领域,特别涉及一种信息处理方法及电子设备。
背景技术
在信息处理的过程中,经常会对大量的数据进行识别,以获取该数据的准确的意思表达,例如在智能客服场景中,需要对用户发出的信息进行识别,以得到用户所要表达内容的真实含义,但是对于用户发出的大量信息,往往需要人工进行归纳处理,费事费力,处理效率低下。即使使用其他算法来处理,也会造成处理结果不是用户真实意图的表达,即会出现对于目标信息的实际意图表达不准确的现象。
发明内容
本申请实施例的目的在于提供一种信息处理方法及电子设备,该信息处理方法,能够对第一数据进行智能分析,并准确的确定该第一数据所要表达的实际意图,有效的提高了对信息的处理效率。
为了解决上述技术问题,本申请的实施例采用了如下技术方案:一种信息处理方法,包括:
获取预设的第一数据,根据预设提取规定所定义的词汇权重,从所述第一数据中提取出至少一个实体词;
确定与所述实体词相关联的关联词,建立所述实体词与所述关联词之间的关联边,以构建对应于所述第一数据的共现图,其中,所述实体词、所述关联词以及所述关联边均对应有各自的权重;
基于预设聚类规定对所述共现图进行聚类操作,形成至少一个图聚类,其中所述图聚类中至少包括一个实体词及相应的关联词;
基于所述图聚类中的实体词和/或所述关联词的含义,确定所述图聚类对应的表达意图,以确定所述第一数据的表达意图。
作为优选,所述的基于预设聚类规定对所述共现图进行聚类操作,形成至少一个图聚类包括:
以从所述第一数据中获取达到特定权重的第一类型词汇作为节点;
将所有的所述节点进行聚类操作,并当包含所述关联边最多的所述图聚类的内部边与外部边之间的数量关系符合特定条件,则停止所述聚类操作,其中所述内部边为所述关联边最多的所述图聚类内的节点之间的关联边,所述外部边为所述关联边最多的所述图聚类内的节点与其他图聚类内的节点之间的关联边。
作为优选,所述的基于所述图聚类中的实体词和/或所述关联词的含义,确定所述图聚类对应的表达意图包括:
基于所述实体词、相应的所述关联词以及相应的所述关联边的权重,在所述图聚类中选定特定数量的代表词汇;
根据所述代表词汇的含义,确定所述图聚类对应的表达意图,以确定所述第一数据的表达意图。
作为优选,获取预设的第一数据,根据预设提取规定所定义的词汇权重,从所述第一数据中提取出至少一个实体词包括:
从第一数据中获取达到特定权重的第一类型词汇;
根据所述预设提取规定,在达到特定权重的所述第一类型词汇中选定所述实体词;
对选定的所述实体词进行的语义规范化的第一操作,以使经过第一操作后的所述实体词的语义表述达到特定标准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910815033.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:中文口语语义理解方法及系统
- 下一篇:一种角色姓名提取方法及系统





