[发明专利]电商本体构建方法有效

专利信息
申请号: 201711305840.9 申请日: 2017-12-11
公开(公告)号: CN108052583B 公开(公告)日: 2020-07-24
发明(设计)人: 章振增 申请(专利权)人: 康成投资(中国)有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/35;G06F16/31;G06F40/216;G06F40/284
代理公司: 上海盈盛知识产权代理事务所(普通合伙) 31294 代理人: 孙佳胤
地址: 200436*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 本体 构建 方法
【说明书】:

发明涉及语义识别技术领域,尤其涉及一种电商本体构建方法。所述电商本体构建方法包括如下步骤:通过对问答语料库、日常语料库、商品语料库的空间概率分布调整、分析,建立包括多个候选词的候选词集合;对多个候选词进行筛选,以构建包括多个本体概念的本体概念集合;对任两个本体概念在同一会话中共同出现的概率进行统计分析,以建立本体概念间的关联规则;对多个本体概念进行层次聚类分析,以建立本体概念间的层次关系树;根据本体概念集合、关联规则、层次关系树建立电商本体。本发明构建了针对性较强的电商领域本体,解决了现有技术中电商智能客服在与客户会话的过程中语义识别准确度较低的问题。

技术领域

本发明涉及语义识别技术领域,尤其涉及一种电商本体构建方法。

背景技术

经统计目前电商网站的订单数与咨询用户数的比例大约4%左右,不同类型的电商网站该比例会有所差异,但总体从该比率中可以看出电商网站客服的成本压力巨大,而且随着业务的持续发展、订单数的规模增长,客服的成本也将会变得越来越高,极大制约着电商成本控制,因此电商智能客服系统研究开发极为迫切。

本体技术的发展为信息检索提供了新的解决方案,通过本体对知识进行重新抽取、组织,能够实现知识的准确理解、匹配,从而提供更好的语义理解。本体是指一种“形式化的,对于共享概念体系的明确而又详细的说明”,即本体提供的是一种共享词表,也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系。简而言之,本体是一种概念描述,建立本体模型主要是为了可以计算概念间的语义关系,对电商智能客服系统中的对话信息进行泛化后,可以使用共同的概念进行连接处理。大多数的本体构建都是基于实体、类(概念)、属性及关系来构建词间语意关系来完成。

电商智能客服系统中的语义理解属于自然语言处理应用级,而自然语言处理应用级的开发都离不开最基础的NLP(Natural Language Processing,自然语言处理)处理问题,字、词、短语、句子、段落、篇章层层递进式的分析处理;而本体是在词层面处理分析的一种重要工具。由于自然语言处理在特定领域不论字、词、短语、句子的处理都是无法达到很好的准确度,这些处理往往也互相依赖导致越上层处理准确率越低,成为自然语言处理中一个很棘手的问题。对自然语言处理的第一步就是需要构建本体,然而,本体构建在不同领域往往对于知识的定义属性具有很大的差异。因此,如何对电商智能客服系统中的本体进行准确的构建,以提高后续语义识别的精准度,是目前亟待解决的技术问题。

发明内容

本发明提供一种电商本体构建方法,用以解决现有技术中电商智能客服的语义识别准确度较低的问题,以提高电商智能客服与用户的线上交流效率,并增强用户体验。

为了解决上述问题,本发明提供了一种电商本体构建方法,包括如下步骤:

构建问答语料库、日常语料库、商品语料库,所述问答语料库中包括多组客服与客户的会话;

通过对所述问答语料库、所述日常语料库、所述商品语料库的空间概率分布调整、分析,建立包括多个候选词的候选词集合;

对多个候选词进行筛选,以构建包括多个本体概念的本体概念集合;

对任两个本体概念在同一会话中共同出现的概率进行统计分析,以建立本体概念间的关联规则;

对多个本体概念进行层次聚类分析,以建立本体概念间的层次关系树;

根据所述本体概念集合、所述关联规则、所述层次关系树建立电商本体。

优选的,对所述会话进行预处理以获取多个候选词,并通过对所述问答语料库、所述日常语料库、所述商品语料库的交叉运算调整所述候选词的空间概率分布,建立包括多个候选词及其排名信息的候选词集合的具体步骤包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康成投资(中国)有限公司,未经康成投资(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711305840.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top