[发明专利]一种确定语音信息的主题的方法和装置在审
申请号: | 201810696998.1 | 申请日: | 2018-06-29 |
公开(公告)号: | CN110727759A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 傅东博 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G10L15/26 |
代理公司: | 11219 中原信达知识产权代理有限责任公司 | 代理人: | 张一军;李阳 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信息 匹配逻辑 文本信息 音信息 匹配 文本 计算机技术领域 方法和装置 匹配条件 采集 转化 | ||
本发明公开了一种确定语音信息的主题的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:采集用户的语音信息,并将所述语音信息转化为文本信息;确定所述文本信息与指定主题的匹配逻辑文本是否匹配,若匹配,则确定所述语音信息为该指定主题,其中,所述指定主题的匹配逻辑文本用于表示所述指定主题的匹配条件。该实施方式能够高效、快速并且准确的确定语音信息的主题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种确定语音信息的主题的方法和装置。
背景技术
在电商运营过程中,每天都会有海量的客服电话,通过统计客服电话主题的趋势和集中情况。可以对电商业务进行调整,从而改进服务质量,提高客户体验。现有的确定电话录音主题的方法是通过大量的客服人员抽样采集客服电话录音,进行人工听取辨别来确定电话录音的主题。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:面对每天庞大的电话接入量,单纯依靠人工听取辨别,是一种极其费时费力的无奈之举,无法对每天海量的电话录音全部进行辨别,并且辨别的准确度也受到客服人员个体差异的影响。同时,抽样的准确率也无法保证,很可能高频发生事件并未被大量抽取,导致结果导向错误。
因此,亟需一种确定语音信息的主题的方法和装置,能够高效、快速并且准确的确定语音信息的主题。
发明内容
有鉴于此,本发明实施例提供一种确定语音信息的主题的方法和装置,能够高效、快速并且准确的确定语音信息的主题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种确定语音信息的主题的方法,包括:
采集用户的语音信息,并将所述语音信息转化为文本信息;
确定所述文本信息与指定主题的匹配逻辑文本是否匹配,若匹配,则确定所述语音信息为该指定主题,其中,所述指定主题的匹配逻辑文本用于表示所述指定主题的匹配条件。
进一步的,所述确定文本信息与指定主题的匹配逻辑文本是否匹配的步骤包括:
解析所述匹配逻辑文本,以获取其中每个字符的优先级信息;
根据所述优先级信息,将所述匹配逻辑文本转换为表示所述指定主题的匹配条件的正则表达式;
利用所述正则表达式对所述文本信息进行匹配,若匹配成功,则确定所述文本信息与该指定主题的匹配逻辑文本匹配,否则确定所述文本信息与该指定主题的匹配逻辑文本不匹配。
进一步的,所述匹配逻辑文本包括:由前优先级标识符号和后优先级标识符号组成的优先级标识符号对,位于优先级标识符号对内的字符具有同一优先级。
进一步的,所述解析匹配逻辑文本的步骤包括:
步骤a,检测当前匹配逻辑文本最外层的优先级标识符号对的位置,以确定位于该最外层的优先级标识符号对内的匹配逻辑文本的优先级;
步骤b,判断该最外层的优先级标识符号对内的匹配逻辑文本中是否有优先级标识符号对存在;
若存在,则将该最外层的优先级标识符号对内的匹配逻辑文本作为当前匹配逻辑文本,执行步骤a,否则执行步骤c;
步骤c,根据匹配逻辑文本的每个字符所属的优先级,将所述匹配逻辑文本拆解为字符单元集合,其中每个字符单元具有对应的优先级标识。
进一步的,所述匹配逻辑文本包括:匹配文字和逻辑符号,匹配逻辑文本通过匹配文字和逻辑符号的组合表示匹配条件;
所述将匹配逻辑文本转换为正则表达式的步骤包括:
根据所述优先级信息,逐级将所述逻辑符号替换为对应的正则表达式字符,以与所述匹配文字结合得到表示所述匹配条件的正则表达式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810696998.1/2.html,转载请声明来源钻瓜专利网。