[发明专利]一种基于机器学习和深度学习的中文自然语言处理工具系统在审
申请号: | 201910867399.6 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110705296A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 魏巍;陈志毅;李恒;杨佳鑫;王赞博;徐晨维;热克甫;王振海 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F40/289;G06F40/216;G06K9/62;G06N3/04;G06N3/08;G06N20/20 |
代理公司: | 42102 湖北武汉永嘉专利代理有限公司 | 代理人: | 李丹 |
地址: | 430074 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于机器学习和深度学习的中文自然语言处理工具系统,包括:数据处理模块,用于获取待处理中文文本和处理任务类型,并根据处理任务类型将接收的中文文本转换为计算机可读的数据格式;任务应用模块,用于根据数据处理模块获取的数据和自然语言处理需求,使用统一接口调用算法模型库,完成全流程模型训练;并根据保存的自然语言处理模型,对外提供规范统一的任务调用接口,以完成相应自然语言处理任务;算法模型库,用于保存自然语言处理任务的算法及根据算法训练得到的模型。本发明构造了合理的系统架构,通过所有功能训练接口统一、训练流程统一、调用接口统一、调用流程统一,作为自然语言处理工具使用更加简单高效。 | ||
搜索关键词: | 自然语言处理 数据处理模块 任务类型 算法模型 中文文本 调用 中文自然语言处理 自然语言处理工具 调用接口统一 计算机可读 工具系统 功能训练 基于机器 接口统一 模型训练 任务调用 任务应用 数据格式 算法训练 统一接口 系统架构 全流程 保存 算法 统一 学习 转换 | ||
【主权项】:
1.一种基于机器学习和深度学习的中文自然语言处理工具系统,其特征在于,包括:/n数据处理模块,用于获取待处理中文文本和处理任务类型,并根据处理任务类型将接收的中文文本转换为计算机可读的数据格式;/n任务应用模块,用于根据数据处理模块获取的数据和自然语言处理需求,使用统一接口调用算法模型库,完成全流程模型训练;并根据保存的自然语言处理模型,对外提供规范统一的任务调用接口,以完成相应自然语言处理任务;/n算法模型库,用于保存自然语言处理任务的算法及根据算法训练得到的模型;/n算法模型库包含的算法有基于深度学习的文本分类算法,基于机器学习的文本分类算法,基于机器学习的聚类算法,基于深度序列模型的分词、词性标注、命名实体识别算法,基于深度学习和图的句法依存解析和语义依存解析算法,基于概率统计和深度学习的相似度算法,基于规则解析的特殊词组提取算法,基于依存树和句子结构的句子解析算法,基于深度学习的语义槽与意图识别算法。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910867399.6/,转载请声明来源钻瓜专利网。