[发明专利]跨平台税务智能客服语料迁移方法及装置在审
| 申请号: | 202011131586.7 | 申请日: | 2020-10-21 |
| 公开(公告)号: | CN112418875A | 公开(公告)日: | 2021-02-26 |
| 发明(设计)人: | 王芳;刘振宇;张天飒;林文辉;王志刚;杨硕;马谊骏 | 申请(专利权)人: | 航天信息股份有限公司 |
| 主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06Q40/00;G06F16/332 |
| 代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 姜丽辉 |
| 地址: | 100195 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 平台 税务 智能 客服 语料 迁移 方法 装置 | ||
1.一种跨平台税务智能客服语料迁移方法,其特征在于,包括:
利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到标准问题及相似问题;
从原有平台的源语料库中,分别提取与各标准问题对应的答案;
按照语料模型对应的样式模板组织各标准问题对应的格式数据,得到适用于目标平台的目标语料库;
将适用于目标平台的目标语料库迁移到目标平台,以使得目标平台利用目标语料库生成智能客服用知识库。
2.根据权利要求1所述的方法,其特征在于,
所述预先构建的目标平台的语料模型中,以标准问题为索引,
所述标准问题对应的格式数据包括:标准问题、类别标记、关联问题、相似问题及答案;
其中,标准问题是对应有标准答案的问题,在目标语料库内,各标准问题相互不重复;
关联问题是从业务流程上,与标准问题对应的向上延伸问题或向下延伸问题,该关联问题对应有标准答案;
相似问题是与标准问题的问法不同,但语义相似、且可以用同一个答案来回答的问题;
答案是分别对应于标准问题、关联问题及相似问题的标准答案。
3.根据权利要求2所述的方法,其特征在于,
所述按照语料模型对应的样式模板组织各标准问题对应的格式数据,包括;
在所述样式模板中,将标准问题作为当前的问题,占一个内容格;
向标准问题附加其对应的类别标记,所述类别标记占一个内容格;
向标准问题附加其对应的各相似问题,每一个相似问题占一个内容格;
向标准问题附加其对应的关联问题,每一个关联问题占一个内容格;
向标准问题附加其对应的标准答案,所述标准答案占一个内容格。
4.根据权利要求3所述的方法,其特征在于,
所述利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到标准问题,包括:
从待迁移的原有平台的源语料库中,根据预先设定的类别标记及标准问题,筛选出与任一标准问题语义相同的多个问题,并保留其中一个问题作为标准问题保留,将其他问题删除。
5.根据权利要求4所述的方法,其特征在于,
所述利用预先构建的目标平台的语料模型,对原有平台的源语料库去重,得到相似问题,包括:
从待迁移的原有平台的源语料库中,根据预先设定的类别标记及标准问题,筛选出与任一标准问题语义相似的多个问题,保留其中一个问题作为标准问题,将其他问题标记为该标准问题的相似问题。
6.根据权利要求5所述的方法,其特征在于,
所述按照语料模型对应的样式模板组织各标准问题对应的格式数据,得到适用于目标平台的目标语料库,包括:
所述目标平台的目标语料库为word文档的形式;
在获取到答案中的文本后,将该文本写入到目标word语料文档中;
在提取到答案中的网址后,以超链接的形式将该网址写入到目标word语料文档中;
在获取到答案中的图片在本地或服务器的存储地址后,下载图片并将下载的图片插入到目标word语料文档中;
在获取到答案中图片对应的超链接地址后,下载图片并将下载的图片插入到目标word语料文档中;
在目标word语料文档中,所述答案中的文本、图片和网址保留在源语料库中的先后顺序。
7.根据权利要求6所述的方法,其特征在于,
所述将适用于目标平台的目标语料库迁移到目标平台,以使得目标平台利用目标语料库生成智能客服用知识库,包括:
将所述目标word语料文档上传到目标平台的智能客服的后台,所述后台在训练智能客服的过程中,生成由目标平台的智能客服使用的知识库;所述目标平台的智能客服利用所述知识库提供税务智能客户服务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011131586.7/1.html,转载请声明来源钻瓜专利网。





