[发明专利]一种基于分词的语义识别方法在审

申请号：	201711249363.9	申请日：	2017-12-01
公开（公告）号：	CN109871527A	公开（公告）日：	2019-06-11
发明（设计）人：	陈斌;阮曙东;陈平;汤超	申请（专利权）人：	武汉楚鼎信息技术有限公司
主分类号：	G06F17/27	分类号：	G06F17/27
代理公司：	暂无信息	代理人：	暂无信息
地址：	430000 湖北省武汉市东湖新技术开***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分词匹配历史记录命名实体语义识别字模板权重引擎数据库知识库系统稳定性场景模块调度引擎检索引擎命令模板人机交互问题推荐相关信息引擎调用语义分析扩展性识别率伸缩加载调用智能挖掘部署
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于分词的语义识别方法，其方法包括所述控制与调度引擎调用各个引擎，分词引擎加载各个场景模块，对问句进行分词，生成关键词及匹配的命名实体；语义分析引擎调用数据库中的历史记录，根据历史记录的时间权重对所述匹配的命名实体同命令字模板进行匹配，提取命令字模板；知识库检索引擎根据所述时间权重最高的命令模板从数据库中提取相关信息呈现。本发明的系统稳定性、可靠性强、识别率高、人机交互体验好，系统中的所有模块均可采用多点部署，伸缩、扩展性强。能智能将用户的问句结合到情境中去，匹配到用户最关心的问题，并尽可能挖掘用户想知道的问题进行问题推荐。

技术领域

本发明涉及一种语义识别方法，尤其涉及一种应用于互联网金融行业的分布式语义识别方法。

背景技术

随着信息技术的发展，传统的搜索引擎已经不能满足人们的信息获取和检索的需求，基于自然语言的智能客服系统应运而生。互联金融企业用户基数庞大，信息纷繁复杂，实时性要求高，如何快速对用户输入自然语言进行准确语义识别是智能客服的关键。传统的语义理解通常采用基于关键词的精确或模糊匹配方法，这对大规模的金融数据和场景，有以下几个问题：

（1）检索速度慢，由于金融行业场景多，业务复杂，如果采用基于关键词的匹配方法，命名实体数量会非常巨大，在百万级规模，在如此庞大的关键词库中去循环检索，不仅效率差、耗费计算机资源，而且响应速度慢，人机交互体验差。

（2）关键词词库维护成本大，如果采用基于关键词的匹配方法，命名实体库是决定识别率的关键，所以必须花费大量的人力进行命名实体库的维护和更新。

（3）识别率低，由于用户普遍采用语音输入的方式，不可避免的有口音问题，如“同洲电子”说成“同邹电子”的平翘舌音问题，“九龙电力”说成“九农电力”，而且很多股票都有别名，如“道恩股份”实际上指的是“N道恩”，这样如果采用基于关键词的匹配方法就会匹配失败。

（4）不能结合用户上下文语境理解用户的意图，比如用户第一句问“万科的行情”，第二句问“那万达呢”，如果采用基于关键词的匹配方法，就没办法理解用户第二句的意图是要问万达的行情。

可见，在金融领域，基于关键词匹配的语义理解不能有效的解决金融领域的语义识别问题。

发明内容

为解决上述现有技术中存在的问题，本发明提供了一种系统稳定性、可靠性强、识别率高、人机交互体验好的应用于金融行业的分布式语义识别方法，其主要的技术方案为：

作为第一方面，输入装置获取信息数据转换为文本数据；

所述控制与调度引擎调用分词引擎；

所述分词引擎调用场景应用模块中的多个场景模块，加载所述各个场景模块及对应的命名实体，对所述文本数据进行分词，按照分词顺序生成关键词及匹配的命名实体；

所述控制与调度引擎调用语义分析引擎；

所述语义分析引擎调用场景应用模块中的多个场景模块，加载所述各个场景模块及对应的命令字模板，对所述匹配的命名实体同命令字模板进行匹配，提取与所述匹配的命名实体相同的命令字模板；

所述控制与调度引擎调用分析推荐引擎；

所述分析推荐引擎根据所述关键词的匹配率乘以所述命令字模板的预设优先级得出所述关键词的匹配度，输出匹配度最高的命令字模板；所述匹配率为匹配到模板的关键词字节长度除以所述文本数据的字节长度的结果数值；

所述控制与调度引擎调用知识库检索引擎，所述知识库检索引擎根据所述匹配度最高的命令模板从数据库中提取相关信息呈现。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉楚鼎信息技术有限公司，未经武汉楚鼎信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201711249363.9/2.html，转载请声明来源钻瓜专利网。

上一篇：一种股票行业的语义识别方法及系统装置
下一篇：语音数据的语义识别方法及装置、存储介质、计算机设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于分词的语义识别方法在审

专利文献下载