[发明专利]一种需求模型构建方法、装置、电子设备和介质有效
| 申请号: | 202010015505.0 | 申请日: | 2020-01-07 |
| 公开(公告)号: | CN111241124B | 公开(公告)日: | 2023-10-03 |
| 发明(设计)人: | 马东民;徐犇;遇越;李秀健 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司;上海小度技术有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F40/30 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 需求 模型 构建 方法 装置 电子设备 介质 | ||
本申请实施例公开了一种需求模型构建方法、装置、电子设备和介质,涉及自然语言处理技术领域。具体实现方案为:依据谓词搭配语料库和同义片段改写库中的至少一个,对标注的样本需求进行同义扩展;依据同义扩展结果,以及所述样本需求的标注,构建需求模型。通过本申请实施例的技术方案,能够准确解析用户的需求,且人力成本低。
技术领域
本申请涉及计算机技术,具体涉及自然语言处理技术,尤其涉及一种需求模型构建方法、装置、电子设备和介质。
背景技术
为了便于对用户的需求(query)进行理解和应答,目前需要将用户的query分配给程序员进行开发,而此过程不仅需要占用大量的人力,而且存在样本不足效果难以保证的缺陷。
发明内容
本申请实施例提供一种需求模型构建方法、装置、电子设备和介质,能够丰富样本且人力成本低,同时能够准确解析用户的需求。
第一方面,本申请实施例公开了一种需求模型构建方法,该方法包括:
依据谓词搭配语料库和同义片段改写库中的至少一个,对标注的样本需求进行同义扩展;
依据同义扩展结果,以及所述样本需求的标注,构建需求模型。
上述申请中的一个实施例具有如下优点或有益效果:在样本需求缺乏的场景下,通过充分利用谓词搭配语料库和同义片段改写库等中的至少一个自动对标注的样本需求进行同义扩展,不仅能够丰富样本需求,而且人力成本低;同时基于构建的需求模型能够快速解析用户的需求,为快速准确解析用户需求提供了一种新思路。
可选的,依据谓词搭配语料库,对标注的样本需求进行同义扩展,包括:
将所述样本需求中的谓词,与谓词搭配语料库中候选谓词进行匹配;
依据匹配结果,对所述样本需求中的谓词搭配进行同义扩展。
上述可选方式具有如下优点或有益效果:通过引入谓词搭配语料库对样本需求中的谓词搭配进行同义扩展,丰富了样本,增加了方案的灵活度。
可选的,依据同义片段改写库,对标注的样本需求进行同义扩展,包括:
从所述样本需求中抽取至少两个连续片段;
依据同义片段改写库,对所述至少两个连续片段进行同义扩展。
上述可选方式具有如下优点或有益效果:通过引入同义片段改写库对样本需求中的连续片段进行同义扩展,为丰富样本提供了一种可选方式。
可选的,依据同义扩展结果,以及所述样本需求的标注,构建需求模型,包括:
对同义扩展结果中的同义片段进行组合,得到所述样本需求的候选需求;
对所述候选需求进行过滤;
依据过滤后的候选需求,所述样本需求,以及所述样本需求的标注,构建所述需求模型中的需求词典。
上述可选方式具有如下优点或有益效果:通过采用组合方式,对同义扩展结果中的同义片段进行组合可得到多个与样本需求同义的候选需求,即丰富了样本;之后,可根据过滤后的候选需求、样本需求以及样本需求的标注一同构建需求词典,以便后续基于需求词典快速解析用户的需求。
可选的,依据同义扩展结果,以及所述样本需求的标注,构建需求模型,包括:
依据所述样本需求的标注中的槽位,以及同义扩展结果中的同义片段,对所述样本需求的原句式进行变化,得到新句式;
依据所述原句式,所述新句式,以及所述同义扩展结果中的同义片段,构建所述需求模型中的树形词典。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司;上海小度技术有限公司,未经百度在线网络技术(北京)有限公司;上海小度技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010015505.0/2.html,转载请声明来源钻瓜专利网。





