[发明专利]一种基于区块链架构的语言数据分类存储系统在审
申请号: | 201911419091.1 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111221967A | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 白玉龙 | 申请(专利权)人: | 陕西医链区块链集团有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/903;G06F16/242 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710061 陕西省西安市*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 区块 架构 语言 数据 分类 存储系统 | ||
本发明公开了一种基于区块链架构的语言数据分类存储系统,由语言数据采集模块、标签生成模块、语言数据分类构建模块、语言数据存储模块组成,其中,语言数据采集模块,用于语言数据的采集;标签生成模块,用于对对语言数据进行关键字提取,得到每一数据的关键词并将其作为该数据的标签;语言数据分类构建模块,将标签属于关键词分类表中同一类别的标签对应的语言数据划分为一类并进行构建;本发明的有益效果是:通过设计的处理模块,便于对语言数据的重复数据进行处理;分类存储的语言数据按照时间或节点的编号进行排序,方便快速查找;通过设计的压缩模块,减小语言数据过大导致的系统承载的负荷,降低系统的空间,提高系统的运行效率。
技术领域
本发明属于语言数据分类存储技术领域,具体涉及一种基于区块链架构的语言数据分类存储系统。
背景技术
数据存储对象包括数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。数据以某种格式记录在计算机内部或外部存储介质上。数据存储要命名,这种命名要反映信息特征的组成含义。数据流反映了系统中流动的数据,表现出动态数据的特征;数据存储反映系统中静止的数据,表现出静态数据的特征。
数据语言是数据库管理系统提供的操作数据库的重要方法和工具。数据语言包括两部分:数据描述语言,用于描述或定义数据库的各级模式和特性,又称为数据定义语言;数据操纵语言,用于对数据进行操作或处理。
为了减少语言数据间的重复,提高语言数据分类存储的效率;为此我们提出一种基于区块链架构的语言数据分类存储系统。
发明内容
本发明的目的在于提供一种基于区块链架构的语言数据分类存储系统,减少语言数据间的重复,提高语言数据分类存储的效率。
为实现上述目的,本发明提供如下技术方案:一种基于区块链架构的语言数据分类存储系统,由语言数据采集模块、标签生成模块、语言数据分类构建模块、语言数据存储模块组成,其中,
语言数据采集模块,用于语言数据的采集;
标签生成模块,用于对对语言数据进行关键字提取,得到每一数据的关键词并将其作为该数据的标签;
语言数据分类构建模块,将标签属于关键词分类表中同一类别的标签对应的语言数据划分为一类并进行构建;
语言数据存储模块,用于对构建的语言数据进行分类存储。
作为本发明的一种优选的技术方案,还包括处理模块,该模块用于对语言数据进行处理。
作为本发明的一种优选的技术方案,还包括训练数据生成模块,该模块用于利用关键字识别准确率低于预设值的语言数据作为新的训练数据对处理模块进行训练更新。
作为本发明的一种优选的技术方案,还包括加密模块,该模块用于对语言数据进行加密。
作为本发明的一种优选的技术方案,分类存储的数据按照时间或节点的编号进行排序。
作为本发明的一种优选的技术方案,还包括筛选模块,该模块用于对语言数据进行筛选。
作为本发明的一种优选的技术方案,还包括压缩模块,该模块用于对语言数据进行压缩。
与现有技术相比,本发明的有益效果是:
(1)通过设计的处理模块,便于对语言数据的重复数据进行处理;
(2)分类存储的语言数据按照时间或节点的编号进行排序,方便快速查找;
(3)通过设计的压缩模块,减小语言数据过大导致的系统承载的负荷,降低系统的空间,提高系统的运行效率。
附图说明
图1为本发明的系统图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西医链区块链集团有限公司,未经陕西医链区块链集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911419091.1/2.html,转载请声明来源钻瓜专利网。