[发明专利]一种针对语义分析行业数据分类方法在审
申请号: | 201810227544.X | 申请日: | 2018-03-20 |
公开(公告)号: | CN108416052A | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 祝磊;祝斌;袁杭军 | 申请(专利权)人: | 杭州声讯网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02;G10L15/26 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 施敬勃 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行业数据 分类 文本数据 语义分析 语音数据 分类库 构建 语句 预处理 电话交流 语法分析 语音识别 修正 分割 客户 | ||
本发明公开了一种针对语义分析行业数据分类方法,包括获取与客户进行电话交流的语音数据;对所述语音数据进行语音识别,得到相应的文本数据;对所述文本数据进行预处理,分割为语句和符号;构建行业数据分类库;对语句进行依存语法分析,构建行业数据分类表达树;基于所述行业数据分类表达树,结合所述符号和所述行业数据分类库的修正计算对应的行业数据分类值。
技术领域
本申请属于机器学习技术领域,特别是涉及一种针对语义分析行业数据分类方法。
背景技术
现代社会,很多企业是依靠电话销售来实现自己的赢利。
在传统技术中,企业通常在自己的电话销售部门设置多个座席,每个座席上由一个电销人员,手动查找潜在客户的电话号码,再人工拨打该号码,待电话接通后与客户进行交流,事后进行分析总结,有成交希望的继续跟进直至促成交易。
在研究中发现,传统技术的缺陷在于,企业的电话销售大部分工作依赖人工,需要人工查询号码、人工拨打,人工和客户进行交流,再进行分析是否有成交可能,由此可见,人工依赖度高,效率低下。
发明内容
有鉴于此,本申请所要解决的是现有技术中企业的电话销售完全依赖人工交流和分析而导致的效率低下的问题。本发明提供了一种针对语义分析行业数据分类方法,可以解决上述问题。
为了解决上述技术问题,本发明通过以下技术方案得以实现:
一种针对语义分析行业数据分类方法,包括:
获取与客户进行电话交流的语音数据;
对所述语音数据进行语音识别,得到相应的文本数据;
对所述文本数据进行预处理,分割为语句和符号;
构建行业数据分类库;
对语句进行依存语法分析,构建行业数据分类表达树;
基于所述行业数据分类表达树,结合所述符号和所述行业数据分类库的修正计算对应的行业数据分类值。
在一个实施例中,所述构建行业数据分类库包括:构建专业用语行业数据分类库,以及构建口语或网络用语行业数据分类库。
在一个实施例中,所述专业用语行业数据分类库采集专业行业词语,并使用数值1和-1对应每个专业行业词语的行业数据分类值。
在一个实施例中,行业数据分类值为1表征客户倾向于签单,行业数据分类值为-1表征客户倾向于拒绝签单。
在一个实施例中,所述构建口语或网络用语行业数据分类库的步骤,包括:
对所述文本数据进行分词,并滤除所述专业行业词语,形成口语或网络用语词集;
计算每个口语或网络用语行业词语的上下文熵;
采用最大信息熵算法确定口语或网络用语词集对应的行业数据分类值。
在一个实施例中,所述对语句进行依存语法分析,构建行业数据分类表达树的步骤,包括:
通过分词、词性标注、句法分析过程,识别所述语句的依存语法结构;
识别所述依存语法结构结构的句法关系类型和情感模式;
根据所述情感模式,采用情感表达式构建算法确定对应的行业数据分类表达树。
与现有技术相比,本申请可以获得包括以下技术效果:
1)本发明提供的一种针对语义分析行业数据分类方法,能够极大地减少企业的人工成本,提高电话销售的效率。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州声讯网络科技有限公司,未经杭州声讯网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810227544.X/2.html,转载请声明来源钻瓜专利网。