[发明专利]一种基于自然语言理解的税务知识中台及其构建方法在审
申请号: | 202011058114.3 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112148840A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 张传锋;井焜;朱锦雷;张琨;祖丕国;王太浩;潘玲玲 | 申请(专利权)人: | 神思电子技术股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/34;G06F16/36;G06N5/02;G06F40/30 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 赵玉凤 |
地址: | 250000 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 理解 税务 知识 及其 构建 方法 | ||
1.一种基于自然语言理解的税务知识中台,其特征在于:所述税务知识中台包括知识对齐模块、知识理解模块和知识交互模块;
知识对齐模块用于实现多源税务政策知识的整理与知识对齐,构建高度结构化的数据;所述整理是指实现多源知识的本地化,对齐是指多源知识的去重与优先级排序;
知识理解模块利用多维度自然语言理解技术,实现多源税务政策知识的关联、层级知识标签的构建及段落级内容的信息抽取,实现税务政策知识篇章级、段落级的理解;
知识交互模块实现多源税务知识的多维度展现,通过语义泛化及语义联想算法,用户通过知识交互模块实现对税务政策知识篇章级、段落级答案的抽取与查看。
2.权利要求1所述税务知识中台的构建方法,其特征在于:包括以下步骤:
S01)、构建知识对齐模块,具体步骤为:
S11)、基于结构化数据库构建本地结构化税务政策知识库模型,在此基础上实现税务知识的结构化整理;
S12)、整理典型税务政策知识站点,构建典型站点库;
S13)、构建动态监测机制,实现典型站点的知识抓取,在监测到政策更新时第一时间实现知识的爬取,确保知识更新的及时性;
S14)、对多源政策知识进行去重,并按照多维度优先级排序功能对所有税务政策文件进行排序;
S02)、构建知识理解模块,具体步骤为:
S21)、基于税种种类实现政策文件的分类,通过分类实现税务政策知识在同一税种意义下的文档关联;
S22)、基于语义挖掘技术实现类内税务政策知识的语义关联,解决税务政策知识不定时局部变化及临时变化的问题;
S23)、采用阅读理解技术,实现税务政策知识段落级重点内容的查找与结构化;
S03)、构建知识交互模块,具体步骤为:
S31)、采用深度学习方法对用户问题进行语义理解,推理得到问题的意图和实体信息;
S32)、对于用户问题进行多维度的内容交互与展现;
所述内容交互是基于用户问题推荐政策文件的税种意义下的标签,基于用户的税种选择再进行二次交互;
所述二次交互是推荐前N篇相关文档或者推荐N个关联度段落级答案或者直接给出最高置信度答案,所述N大于等于1。
3.根据权利要求2所述的税务知识中台的构建方法,其特征在于:步骤S14中,基于文本相似度计算或者关键特征比较实现去重。
4.根据权利要求2所述的税务知识中台的构建方法,其特征在于:步骤S14中,所述多维度优先级排序包括基于时间维度的排序、基于地域的排序以及基于税号的排序。
5.根据权利要求2所述的税务知识中台的构建方法,其特征在于:步骤S21中,基于税种种类实现政策文件的分类方法包括传统机器学习方法、深度学习方法、传统方法与深度学习的融合决策机制以及基于人机融合的方法。
6.根据权利要求2所述的税务知识中台的构建方法,其特征在于:步骤S22中,语义挖掘技术采用政策文件关键信息的抽取的方法,通过关键信息的对齐实现税务政策知识的语义关联。
7.根据权利要求2所述的税务知识中台的构建方法,其特征在于:步骤S22中,语义挖掘技术采用模糊匹配的方法实现一类税务政策安装时间节点排序的上下文图谱的构建,方便涉税人员对系列税务政策的查阅。
8.根据权利要求2所述的税务知识中台的构建方法,其特征在于:步骤S23中,税务政策知识的段落级重点内容包括纳税人、征收管理、税收优惠、征税范围、税务义务发生时间、税率、应纳税额计算、纳税地点。
9.根据权利要求2所述的纳税知识中台的构建方法,其特征在于:步骤S23中,阅读理解技术采用端到端的训练学习方法或者采用先选择候选段落在进行精细排序的方法。
10.根据权利要求2所述的纳税知识中台的构建方法,其特征在于:知识交互模块实现体验性友好的交互过程;所述友好的体验性包括记录当前用户的查找历史、计算用户重点关注的税种、统计查询习惯、根据用户重点关注的税种推荐相关最新政策文件内容、根据用户查询习惯实现定向语义联想和泛化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于神思电子技术股份有限公司,未经神思电子技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011058114.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于税务行业的内容更新推荐方法
- 下一篇:一种汽车往复举升装置