[发明专利]基于领域预训练模型的对话方法、电子设备在审
| 申请号: | 202211029509.X | 申请日: | 2022-08-25 |
| 公开(公告)号: | CN115687913A | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 简仁贤;李龙威;马永宁 | 申请(专利权)人: | 竹间智能科技(上海)有限公司 |
| 主分类号: | G06F18/214 | 分类号: | G06F18/214 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 赵兴 |
| 地址: | 200030 上海市徐*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 领域 训练 模型 对话 方法 电子设备 | ||
本申请提供一种基于领域预训练模型的对话方法、电子设备,该方法包括:获取基于业务标签集合构建的业务模型和基于领域标签集合构建的领域预训练模型,通过业务模型和领域预训练模型得到用户问题归类于业务标签的第一得分和领域标签的第二得分;根据用户问题归类于业务标签的第一得分和领域标签的第二得分,可得到用户问题归类于业务标签的矫正分值;根据用户问题归类于每个业务标签的矫正分值,确定用户问题对应的目标业务标签,输出目标业务标签对应配置的标准答案。该方案通过融合领域预训练模型的方法,降低了对话业务语料的扩写量,降低了运营成本。
技术领域
本申请涉及智能问答技术领域,特别涉及一种基于领域预训练模型的对话方法、电子设备。
背景技术
基于算法模型的对话系统需要专家梳理对话业务语料,传统方式需要专家结合业务知识、语言学知识,采用模板法、语序变换、句式变换等方法进行人工扩写,这需要依赖大量人力成本、专家能力,而且不同专家的梳理工作难以保证稳定和统一。
为了降低运营成本,减少对话业务语料梳理工作,客户一般直接采用厂商提供的预训练模型。具体的,厂商通过神经网络训练方式,把自身积累的领域语料融入领域预训练模型,为客户提供领域预训练模型服务。这样即可以降低语料扩写成本,又可以保护领域数据资源。但很多时候,客户会根据自己的业务,定制一套标签体系,这与厂商的领域预训练模型的标签体系会有部分标签完全重合、也会有部分标签语义相近表述不同,因此没办法直接将厂商提供的领域预训练模型投入使用。
发明内容
本申请实施例提供了一种基于领域预训练模型的对话方法,用以降低对话业务语料的扩写量,降低运营成本。
本申请实施例提供了一种基于领域预训练模型的对话方法,包括:
获取基于业务标签集合构建的业务模型和基于领域标签集合构建的领域预训练模型;
通过所述业务模型和所述领域预训练模型分别对接收到的用户问题进行分类,得到所述用户问题归类于所述业务标签集合中任一业务标签的第一得分和所述用户问题归类于所述领域标签集合中任一领域标签的第二得分;
根据所述用户问题归类于所述业务标签集合中任一业务标签的第一得分和所述用户问题归类于所述领域标签集合中任一领域标签的第二得分,确定所述用户问题归类于每个所述业务标签的矫正分值;
根据所述用户问题归类于每个业务标签的矫正分值,确定所述用户问题对应的目标业务标签,输出所述目标业务标签对应配置的标准答案。
在一实施例中,所述根据所述用户问题归类于所述业务标签集合中任一业务标签的第一得分和所述用户问题归类于所述领域标签集合中任一领域标签的第二得分,确定所述用户问题归类于每个所述业务标签的矫正分值,包括:
针对每个业务标签,从所述领域标签集合中筛选出所述业务标签对应的目标领域标签;
若筛选得到所述目标领域标签,根据所述目标领域标签的第二得分,对所述业务标签的第一得分进行矫正,得到所述用户问题归类于所述业务标签的矫正分值。
在一实施例中,所述根据所述用户问题归类于所述业务标签集合中任一业务标签的第一得分和所述用户问题归类于所述领域标签集合中任一领域标签的第二得分,确定所述用户问题归类于每个所述业务标签的矫正分值,包括:
针对每个业务标签,从所述领域标签集合中筛选出所述业务标签对应的目标领域标签;
若不存在所述目标领域标签,将所述用户问题归类于所述业务标签的第一得分,作为所述用户问题归类于所述业务标签的矫正分值。
在一实施例中,所述针对每个业务标签,从所述领域标签集合中筛选出所述业务标签对应的目标领域标签,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于竹间智能科技(上海)有限公司,未经竹间智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211029509.X/2.html,转载请声明来源钻瓜专利网。





