[发明专利]应用于保险条款解析的保障责任摘要自动填充的技术方法在审
| 申请号: | 202111320911.9 | 申请日: | 2021-11-09 |
| 公开(公告)号: | CN114330283A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 李红丽;田立文;王志广 | 申请(专利权)人: | 世纪保众(北京)网络科技有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/166;G06Q40/08 |
| 代理公司: | 北京金蓄专利代理有限公司 11544 | 代理人: | 姚金良 |
| 地址: | 100176 北京市大兴区经济技*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 应用于 保险条款 解析 保障 责任 摘要 自动 填充 技术 方法 | ||
1.一种应用于保险条款解析的保障责任摘要自动填充的技术方法,其特征在于包括:
第一步骤:将保险条款PDF文件解析成txt文本文件;
第二步骤:在txt文本文件中提取出所需的保障责任内容;
第三步骤:针对所需的保障责任内容,利用余弦相似度对标准责任字段进行匹配;
第四步骤:利用Page Rank算法对匹配出的保障责任内容进行重新排序;
第五步骤:制作关键信息的数据作为训练数据,结合训练数据自动化抽取关键信息,以得到零散关键信息;
第六步骤:将得到的零散关键信息进行整合,从而形成摘要内容。
2.根据权利要求1所述的应用于保险条款解析的保障责任摘要自动填充的技术方法,其特征在于,将保险条款PDF文件解析成txt文本文件的步骤采用使用lazy parsing策略的PDFMiner工具。
3.根据权利要求1或2所述的应用于保险条款解析的保障责任摘要自动填充的技术方法,其特征在于,第三步骤采用的匹配算法是余弦相似度算法。
4.根据权利要求1或2所述的应用于保险条款解析的保障责任摘要自动填充的技术方法,其特征在于,第三步骤中,当相似度大于等于阈值时认为两个待比较字段是相似的,并且被作为统一字段使用。
5.根据权利要求1或2所述的应用于保险条款解析的保障责任摘要自动填充的技术方法,其特征在于,第三步骤中,当相似度小于阈值时认为两个待比较字段是不相似的,并且不被作为统一字段使用。
6.根据权利要求1或2所述的应用于保险条款解析的保障责任摘要自动填充的技术方法,其特征在于,制作关键信息的数据作为训练数据包括人为设定各类型保险条款的关键信息数据作为训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世纪保众(北京)网络科技有限公司,未经世纪保众(北京)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111320911.9/1.html,转载请声明来源钻瓜专利网。





