[发明专利]用于知识产权领域的自然语言处理系统以及自然语言处理方法在审
申请号: | 202010194795.X | 申请日: | 2020-03-19 |
公开(公告)号: | CN113495957A | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 张智尧;李嘉孟;苏仁浚 | 申请(专利权)人: | 荷盛崧钜智财顾问股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06N3/04;G06N3/08;G06F40/157;G06Q50/18 |
代理公司: | 厦门加减专利代理事务所(普通合伙) 35234 | 代理人: | 李强 |
地址: | 中国台湾台北市中*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 知识产权 领域 自然语言 处理 系统 以及 方法 | ||
本发明揭露一种自然语言处理系统,用于知识产权领域,包括文意深度学习模块、规范用语数据处理单元以及结合学习单元。文意深度学习模块接收文本,以产生文本文意表征。规范用语数据处理单元包括字符串比对模块与神经网络数据处理模块。字符串比对模块接收文本,并利用预定的知识产权字典库比对文本以产生第一输入信息,神经网络数据处理模块接收第一输入信息,并依据第一输入信息产生文本规范表征。结合学习单元包括结合模块与分类器。结合模块结合文本文意表征与文本规范表征以产生一第二输入信息,分类器接收第二输入信息以产生文本标签。藉此,可以有效地纳入知识产权领域特有的文本规范,解决知识产权领域在文本分类上的缺点。
技术领域
本发明涉及一种自然语言处理系统以及自然语言处理方法,尤其涉及一种利用深度学习用于知识产权领域的自然语言处理系统以及自然语言处理方法。
背景技术
在面临国际技术竞争与冲击的当下,知识产权的发展成为产业升级上极重要的一环。在知识经济的浪潮席卷全球的下,知识产权的重要性与价值已毋庸置疑,但随着新的科技技术出现,也逐渐引发知识产权未来的服务走向。
以往的知识产权需要耗费大量的人力,从技术、法律、商业利益等角度来解析,进而产生对权利人有益的策略与行为。其中,对于如此大量的文件进行分类处理是一个基本但也重要的工作。传统上对于文件的分类处理,大多仅能进行最初揭的判断,容易产生分类错误的问题。若要进行深度的分析判断,就需要耗费大量人力与时间。
因此,有必要藉由现今渐趋成熟的人工智能,来改善知识产权耗费人工、错误与争议大、耗时效率低等问题。
因此,本发明的主要目的在于提供一种利用深度学习以智能处理知识产权数据的自然语言处理系统以及自然语言处理方法,以解决上述问题。
发明内容
本发明的目的在于提供一种自然语言处理(Natural Language Processing;NLP)系统,用于具有特定文本规范的知识产权领域,用以将文本转化产生具有领域适应性的文本标签。此自然语言处理系统包括文意深度学习模块、规范用语数据处理单元以及结合学习单元。文意深度学习模块是用以接收所述文本,以产生文本文意表征。规范用语数据处理单元包括字符串比对模块与神经网络数据处理模块。其中,所述字符串比对模块是用以接收所述文本,并利用预定的知识产权字典库比对所述文本以产生第一输入信息,所述神经网络数据处理模块是用以接收所述第一输入信息,并依据所述第一输入信息产生文本规范表征。结合学习单元包括结合模块与分类器。其中,所述结合模块是用以结合所述文本文意表征与所述文本规范表征,以产生一第二输入信息,所述分类器是用以接收所述第二输入信息,以产生所述文本标签。
为达所述优点至少其中的一或其他优点,本发明的一实施例提出一种自然语言处理系统,其特征在于,其中所述文本是一训练文本,所述训练文本具有既定的比对标签,所述自然语言处理系统更包括训练模块,所述训练模块是用以撷取所述比对标签,并依据所述文本标签与所述比对标签间的损失函数(loss function)修正所述文意深度学习模块的第一参数、所述神经网络数据处理模块的第二参数与所述分类器的第三参数。其中所述损失函数是均方误差(Mean square error,MSE)或平均绝对值误差(Mean absolute error,MAE)。
为达所述优点至少其中的一或其他优点,本发明的一实施例提出一种自然语言处理系统,其特征在于,其中所述文意深度学习模块是选自于由BERT、RoBERTa、或ALBERT所组成的卷积神经网络(Convolutional Neural Network;CNN)族群中的至少一个。
为达所述优点至少其中的一或其他优点,本发明的一实施例提出一种自然语言处理系统,其特征在于,其中所述神经网络数据处理模块是利用独热编码(One Hot Encode)产生所述文本规范表征。
为达所述优点至少其中的一或其他优点,本发明的一实施例提出一种自然语言处理系统,其特征在于,其中所述分类器是Softmax分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荷盛崧钜智财顾问股份有限公司,未经荷盛崧钜智财顾问股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010194795.X/2.html,转载请声明来源钻瓜专利网。