[发明专利]用于对训练样本进行分割的方法及装置在审
申请号: | 202210914562.1 | 申请日: | 2022-08-01 |
公开(公告)号: | CN115271098A | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 周梦迪;徐晟;胡森;许腾;王洪彬;万小军 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F40/174;G06F40/289 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉;刘景峰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本说明书实施例提供了用于对训练样本进行分割的方法及装置。在该方法中,根据主题对作为训练样本的对话文本进行分割,以得到各个主题对应的对话段落,其中,作为训练样本的结构化的表单按照主题分成多个表单分块,每个表单分块对应一个主题;在各个主题包括的同一类型的事件能够多次发生时,将该主题对应的对话段落按照类型的事件进行分割,以得到各个事件对应的对话片段;将所得到的各个对话片段与该对话片段对应的表单分块中的子分块确定为对应关系;以及将各个对话片段与对应的子分块以及未分割的各个对话段落与对应的表单分块确定为训练样本。 | ||
搜索关键词: | 用于 训练 样本 进行 分割 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210914562.1/,转载请声明来源钻瓜专利网。