[发明专利]用于生成会议纪要的方法、装置、设备、介质和产品有效
| 申请号: | 202110930151.7 | 申请日: | 2021-08-13 |
| 公开(公告)号: | CN113642294B | 公开(公告)日: | 2023-08-04 |
| 发明(设计)人: | 刘家辰;魏迪;陈默也;高帅;邵振;李伟;李钦瑞 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F16/35 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 生成 会议纪要 方法 装置 设备 介质 产品 | ||
1.一种用于生成会议纪要的方法,包括:
获取初始会议信息;
对所述初始会议信息进行过滤,得到目标会议信息;
基于所述目标会议信息和预设的信息分类模型,确定所述目标会议信息的分类信息;所述分类信息至少包括会议要点信息和会议非要点信息;
基于所述会议要点信息和所述会议非要点信息,生成会议纪要;
其中,所述预设的信息分类模型基于以下步骤训练得到:
基于预设的预训练任务,对预训练模型进行预训练,得到训练完成的目标预训练模型,所述预训练任务用于训练对关键信息的识别,关键信息包括关键主体、关键客体、关键动作;
获取样本信息,基于预设的信息条件进行粗略筛选,确定所述样本信息中的样本非要点信息和样本要点信息,以及通过用户标注的方式对粗略筛选出的样本要点信息进一步标注,确定最终的样本非要点信息和样本要点信息作为样本标注数据,所述预设的信息条件包括:出现指定关键词的为非要点信息、长度小于第一指定长度阈值或长度大于第二指定长度阈值的信息为非要点信息;
基于样本信息和样本标注数据,对所述目标预训练模型进行训练,以使所述目标预训练模型输出与所述样本信息对应的样本分类,并基于所述样本分类、所述样本标注数据和预设的损失函数,调整所述目标预训练模型的模型参数,直至所述预设的损失函数收敛,得到所述预设的信息分类模型。
2.根据权利要求1所述的方法,其中,所述对所述初始会议信息进行过滤,得到目标会议信息,包括:
对所述初始会议信息中的语气词进行过滤,得到过滤后的初始会议信息;
对所述过滤后的初始会议信息中的重复词进行过滤,得到所述目标会议信息。
3.根据权利要求2所述的方法,其中,所述对所述过滤后的初始会议信息中的重复词进行过滤,得到所述目标会议信息,包括:
确定所述过滤后的初始会议信息中的有意义重复词;
对所述过滤后的初始会议信息中除所述有意义重复词之外的重复词进行过滤,得到所述目标会议信息。
4.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定所述样本非要点信息和所述样本要点信息之间的信息数量差值大于预设的阈值,对所述样本信息进行重采样。
5.根据权利要求1所述的方法,其中,所述样本分类包括样本要点和样本非要点;以及,所述损失函数中所述样本要点对应的权重大于所述样本非要点对应的权重。
6.根据权利要求1所述的方法,其中,所述基于预设的预训练任务,对预训练模型进行预训练,得到训练完成的目标预训练模型,包括:
确定与所述预训练任务对应的任务输入数据和任务标注数据;
将所述任务输入数据输入所述预训练模型,以使所述预训练模型输出与所述任务输入数据对应的关键信息识别结果;
基于所述关键信息识别结果和所述任务标注数据,不断调整所述预训练模型的模型参数,得到训练完成的所述目标预训练模型。
7.根据权利要求1所述的方法,其中,所述获取初始会议信息,包括:
响应于确定所述初始会议信息的信息类别不为目标会议类别,获取所述初始会议信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110930151.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:量子点发光器件及其制备方法
- 下一篇:一种水泥基石蜡相变储能材料的制备方法





