[发明专利]一种基于键值库的文件与结构化数据统一存储方法有效

专利信息
申请号: 201110272333.6 申请日: 2011-09-14
公开(公告)号: CN102298641A 公开(公告)日: 2011-12-28
发明(设计)人: 王建民;朱妤晴;李旭嘉;杨义繁;丁贵广 申请(专利权)人: 清华大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 罗文群
地址: 100084*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于键值库的文件与结构化数据统一存储方法,属于计算机数据管理技术领域。本方法通过将文件切分成多个数据块,在键值库符合特定模式的表格中存储文件及文件夹元数据和文件数据块,支持对文件及结构化数据进行统一存储,并支持使用可统一标识文件和结构化数据资源的存储标识符创建、删除、访问文件及结构化数据,通过对存储标识符及用户请求的访问模式进行判断,自动向用户提供对文件及结构化数据的字节数组、流、本地路径等三种上传下载方式。本方法由于基于键值库,保持了键值库提供的高可扩展性、高可伸缩性等海量存储合优越特性,且在形成的用户访问接口及管理模式方面具有简单易用、高可扩充、上传下载速度性能高等优点。
搜索关键词: 一种 基于 键值 文件 结构 数据 统一 存储 方法
【主权项】:
一种基于键值库的文件与结构化数据统一存储方法,其特征在于该方法包括以下步骤:(1)用户初始化键值库,键值库中具有表格、列簇和列三种单元的结构化存储模式,其中,表格包含多个列簇,每个列簇包含一个或多个列,数据按行存入表格中,每行数据在同一表格中用行键识别,数据存储在列中,一行列数据存储在一个或多个列簇中;(2)建成对文件与结构化数据统一进行高效访问的存储接口模块,在键值库中为文件建立元数据表格,在元数据表格中存储文件的属性数据,所述的元数据表格包含元数据和内容数据两个列簇,分别用以表示文件或文件所在的文件夹的属性数据和文件的内容数据;(3)存储接口模块通过将文件拆分成多个数据块存储在键值库中,使用一行元数据和多行内容数据存储一个文件,存储形式如下:文件在所在文件系统中的路径所形成的行键,与该行键相对应的行数据存储在元数据列簇下,该行数据为文件的属性数据,该属性数据包括一列文件名、一列文件所在的父文件夹路径和一列文件内容数据的第一个数据块的行键;文件内容数据被切分成数据块后存储在内容数据列簇中,每个数据块为一行,数据块的行键为即时生成的通用唯一识别码(UUID),所述的内容数据列簇包括一列下一个数据块的行键、一列本数据块的内容,若该数据块为最后一个数据块,则将下一个数据块行键列的内容记为“文件结尾”;(4)存储接口模块用一行元数据存储一个文件夹,存储形式如下:文件夹在所在文件系统中的路径形成行键,与该行键相对应的行数据存储在元数据列簇下,该行数据为文件夹的属性数据,该属性数据包括一列文件夹的名称和一列文件夹所在的父文件夹路径,若该文件夹存在子文件,则属性数据还包括子文件路径,若该文件夹存在子文件夹,则属性数据还包括子文件夹路径;(5)当存储接口模块接到用户的构造命令及相应构造参数时,存储接口模块返回用户所访问资源的存储标识符,该存储标识符标识文件夹、文件、表格、行、列簇和列6种资源,若用户访问的是文件夹或文件,则构造参数为路径,若用户访问的是表格,则构造参数为表格名称或表格名称与一个或多个列簇名称,若用户访问的是行,则构造参数为表格名称和行键,若用户访问的是列簇,则构造参数为表格名称、行键和列簇名称,若用户访问的是列,则构造参数为表格名称、行键、列簇名称和列名称;(6)当存储接口模块接到用户的创建命令及相应的存储标识符时,存储接口模块对存储标识符进行识别:(6‑1)若为文件、行、列簇或列中的任何一种资源,则向用户返回“不支持此资源”信息;(6‑2)若为表格资源,则存储接口模块对键值库进行检查,若键值库中已存在同名的表格,则向用户返回“已存在同名表格”信息,若键值库中不存在同名的表格,则在键值库中创建含指定表格名称的表格,并向用户返回“创建成功”信息;(6‑3)若为文件夹资源,则存储接口模块对指定路径进行判断,若指定路径下已存储同名的文件或文件夹,则向用户返回“已经存在同名资源”信息,若指定路径下未存储同名的文件或文件夹,则对父文件夹进行判断,若不存在父文件夹,则重复步骤(6‑3),创建父文件夹,使得父文件夹存在,若存在父文件夹,则在父文件夹所在行的元数据列簇下插入一个列,列的名称为指定路径名称,并添加特殊前缀,列的数据为指定路径,同时创建本文件夹路径的所在行,行的数据分布在元数据列簇下,在该行元数据列簇下增加两列,其中一列记录本文件夹名称,另一列记录父文件夹路径,向返回用户“成功”信息;若创建父文件夹过程中出现“已存在同名资源”信息,则向用户返回“失败”信息;(7)当存储接口模块接到用户的删除命令及相应的存储标识符时,存储接口模块对存储标识符进行识别:(7‑1)当存储标识符标识的是表格资源时,存储接口模块对表格资源进行判断:(7‑1‑1)若键值库中存在与该表格资源相对应的表格,则从键值库中删除与该表格资源相对应的表格,并向用户返回“成功”信息;(7‑1‑2)若键值库中不存在与该表格资源相对应的表格,则向用户返回“成功”信息;(7‑2)当存储标识符标识的是列资源时,存储接口模块对列资源进行判断:(7‑2‑1)若键值库中存在与该列资源相对应的列,则从键值库中删除与该列资源相对应的列,并向用户返回“成功”信息;(7‑2‑2)若键值库中不存在与该列资源相对应的列,则向用户返回“成功”信息;(7‑3)当存储标识符标识的是列簇资源时,存储接口模块对列簇资源进行判断:(7‑3‑1)若键值库中存在与该列簇资源相对应的列簇,则从键值库中删除与该列簇资源相对应的列簇,并向用户返回“成功”信息;(7‑3‑2)若键值库中不存在与该列簇资源相对应的列簇,则向用户返回“成功”信息;(7‑4)当存储标识符标识的是行资源时,存储接口模块对行资源进行判断:(7‑4‑1)若键值库存在与该行资源相对应的行时,存储接口模块对行中存储了数据的各列簇使用步骤(7‑3)逐一进行删除,并向用户返回“成功”信息;(7‑4‑2)若键值库不存在与该行资源相对应的行时,则向用户返回“成功”信息;(7‑5)当存储标识符标识的是文件资源时,存储接口模块从键值库中的该文件的父文件夹所在元数据行中删除记录该文件路径的列,同时从该文件所在元数据行中获取该文件的首个数据块所在行键,将首个数据块作为当前数据块,从当前数据块所在行中读出下一数据块的行键后,删除当前数据块,再将下一数据块置为当前数据块,重复上述读取和删除的操作,直到读出下一数据块行键为“文件结尾”的数据块,将下一数据块的行键为“文件结尾”的数据块置为当前数据块后,删除当前数据块,同时删除该文件的元数据行,并向用户返回“成功”信息;(7‑6)当存储标识符标识的是文件夹资源时,存储接口模块先从键值库中的该文件夹的父文件夹所在元数据行中删除记录该文件夹路径的列,从该文件夹所在元数据行中获取存储各子文件或子文件夹的路径,并重复步骤(7‑5)或(7‑6),删除各子文件或子文件夹,直到该文件夹不存在子文件或子文件夹,当该文件夹不存在子文件或子文件夹时,删除该文件夹所在的元数据行,并向用户返回“成功”信息;(8)当存储接口模块接到用户的字节上传命令及相应的存储标识符、字节数据、追加选项时,存储接口模块对存储标识符进行识别:(8‑1)若存储标识符标识的是文件夹、表格、行或列簇,则向用户返回“不支持”信息;(8‑2)若存储标识符标识的是列,对追加选项进行识别:(8‑2‑1)当追加选项为假时,存储接口模块对与存储标识符标识的列相关的表格和列簇进行判断,若与存储标识符标识的列相关的表格或列簇存在,则在键值库中将字节数据存储到存储标识符标识的列,并向用户返回“成功”信息,若与存储标识符标识的列相关的表格或列簇不存在,则向用户返回“失败”信息,(8‑2‑2)当追加选项为真时,存储接口模块对存储标识符标识的列进行判断,若存储标识符标识的列存在,则从键值库中读取存储标识符标识的列的数据,并将字节数据追加到存储标识符标识的列的数据,存入存储标识符标识的列中,若存储标识符标识的列不存在,则向用户返回“失败”信息;(8‑3)若存储标识符标识的是文件,则存储接口模块对键值库进行查询:(8‑3‑1)若键值库中不存在存储标识符标识的文件,则对该文件的父文件夹进行判断,若键值库中不存在该文件的父文件夹,则使用步骤(6‑3)创建该文件的父文件夹,使得键值库中存在该文件的文件夹,则进行步骤(8‑3‑1‑1);若键值库中存在该文件的父文件夹,则进行步骤(8‑3‑1‑1);(8‑3‑1‑1)在该文件的父文件夹的元数据行中增加一列记录该文件的路径,创建该文件的元数据行,确定该文件内容的第一个数据块的行键,使用第一个数据块的行键创建内容数据行,再将字节数据写入第一个内容数据行的数据列,最后置下一数据块行键列为“文件结尾”,并向用户返回“成功”信息;(8‑3‑2)若键值库中存在与存储标识符标识的文件同名的文件夹,则向用户返回“同名文件夹存在”信息;(8‑3‑3)若键值库中存在存储标识符标识的文件,则对追加选项进行判断:(8‑3‑3‑1)若追加选项为假,则读取该文件的元数据行,获得文件内容第一个数据块的行键,并将字节数据写入第一个数据块的行键所指示的内容数据行的数据列中,读取第一数据块内容数据行,获得下一数据块的行键,并将第一数据块的下一数据块行键列置为“文件结尾”,同时置下一数据块为当前数据块,读取该当前数据块的下一数据块行键的列,获得下一数据块的行键,并删除该当前数据块的内容数据行,置下一数据块为当前数据块,重复上述读取删除操作,直到当前数据块的下一数据块行键列的值为“文件结尾”,删除当前数据块的内容数据行,向用户返回“成功”信息;(8‑3‑3‑2)若追加选项为真,则读取该文件元数据行,获得文件内容第一个数据块的行键,置第一个数据块为当前数据块,从该当前数据块的行键所指示的内容数据行中读取下一数据块的行键,重复“置数据块为当前数据块,从该当前数据块的行键所指示的内容数据行中读取下一数据块的行键”的操作,直到当前数据块的内容数据行的下一数据块行键列值为“文件结尾”,读出当前数据块的内容数据,并将字节数据追加到当前数据块的内容数据后,得到新的当前数据块内容数据,进行步骤(8‑3‑3‑2‑1);(8‑3‑3‑2‑1)根据用户设定的数据块大小域值判断当前数据块内容数据大小,若当前数据块内容数据大小超过数据块大小域值,则将当前数据块拆分出一块等于数据块大小域值的数据块和最后一块剩余内容数据块,将当前数据块设为大小等于数据块大小域值的数据块后,将当前数据块内容数据写入当前数据块的内容数据行的数据中,构建下一数据块的行键,并在当前数据块的内容数据行中写入下一数据块的行键,并将最后一块剩余内容数据块设为当前数据块,重复步骤(8‑3‑3‑2‑1),直到最后一块剩余内容数据块不超过数据块大小域值,并将最后一块内容数据块写入该数据块行键指定的内容数据行的数据列中,并置下一数据块行键列内容为“文件结尾”,向用户返回“成功”信息;(9)当存储接口模块接到用户的本地路径上传命令及相应的存储标识符、本地文件或本地文件夹路径时,存储接口模块对存储标识符进行识别:(9‑1)若存储标识符标识的是表格、行、列簇或列,则向用户返回“不支持”信息;(9‑2)若存储标识符标识的是文件且本地路径是文件夹,则向用户返回“错误”信息;(9‑3)若存储标识符标识的是文件夹且本地路径是文件,则向用户返回“错误”信息;(9‑4)若存储标识符标识的是文件且本地路径是文件,则存储接口模块使用步骤(6‑3)创建该文件的父文件夹,若步骤(6‑3)返回“失败”信息,则向用户返回“失败”信息,若步骤(6‑3)返回“已经存在同名资源”或“成功”信息,则在该文件所在父文件夹的元数据行中增加“该文件路径”列,同时创建该文件的元数据行,确定该文件内容第一个数据块的行键,置第一个数据块为当前数据块,并置当前文件读取位置为0,从本地路径所指示的文件内容的当前文件读取位置向后读取数据,使读取的数据大小等于数据块大小域值,形成第一个数据块,将该第一个数据块内容写入当前数据块行键所指示的内容数据行的数据列中,同时存储接口模块确定下一个数据块的行键,并将下一个数据块的行键写入当前数据块的内容数据行的下一数据块行键列中,置下一个数据块为当前数据块,将当前文件读取位置加上数据块大小域值,重复上述读取数据块、写入数据块、确定行键、置当前数据块的操作,直至读到本地文件内容的最后一个数据块,将最后一个数据块内容写入该数据块内容数据行的数据列后,在该数据块内容数据行的下一数据块行键列中写入“文件结尾”,向用户返回“成功”信息;(9‑5)若存储标识符标识的是文件夹且本地路径是文件夹,使用步骤(6‑3)创建该文件夹,若步骤(6‑3)返回“已经存在同名资源”或“失败”信息,则向用户返回“已经存在同名资源”或“失败”信息,若步骤(6‑3)返回“成功”信息,则读取本地路径所指示文件夹的一个子文件或子文件夹i(i=1,2,..,n),并使用步骤(9‑3)或(9‑4)对子文件或子文件夹i进行上传后,在存储标识符标识的文件夹的元数据行中添加“子文件路径”或“子文件夹路径”列以及内容为子文件或子文件夹i的元数据行行键的列数据,重复上述上传子文件或子文件夹的步骤,直到将n个子文件或子文件夹上传完成后,向用户返回“成功”信息,当重复过程中出现子文件或子文件夹上传失败,则向用户返回“失败”信息;(10)当存储接口模块接到用户的流上传命令及相应的存储标识符、追加选项时,存储接口模块初始化一个大小等于用户设定的数据块大小域值的本地内存缓存区,并将本地内存缓存区内容置为空,对存储标识符进行识别:(10‑1)若存储标识符标识的是文件夹、表格、行或列簇,则向用户返回“不支持”信息;(10‑2)若存储标识符标识的是列,则对追加选项进行判断:(10‑2‑1)若追加选项为假,则存储接口模块对存储标识符中标识的列所在的表格和列簇进行判断,若存储标识符标识的列所在的表格和列簇不存在,则向用户返回“失败”信息,若存储标识符标识的列所在的表格和列簇存在,则将存储标识符标识的键值库中的列数据置为空,并打开一个输出流,向用户返回该输出流操作对象;(10‑2‑2)若追加选项为真,则存储接口模块对存储标识符中标识的列进行判断,若存储标识符标识的列不存在,则向用户返回“失败”信息,若存储标识符标识的列存在,则将存储标识符标识的键值库中的列数据读到本地内存缓存区中,将存储标识符标识的键值库中的列数据置为空,并打开一个输出流,向用户返回该输出流操作对象;(10‑3)若存储标识符标识的是文件,则存储接口模块对键值库进行查询:(10‑3‑1)若键值库中不存在存储标识符标识的文件,则存储接口模块对该文件的父文件夹进行判断,若键值库中不存在该文件的父文件夹,则使用步骤(6‑3)创建该文件的父文件夹,使得该文件的父文件夹存在,该文件的父文件夹存在后,在该文件的父文件夹的元数据行中增加“该文件路径”列,同时创建该文件的元数据行,确定该文件内容第一个数据块的行键,使用第一个数据块的行键创建内容数据行,将该内容数据行的下一数据块行键列置为“文件结尾”,并打开一个输出流,向用户返回该输出流操作对象;(10‑3‑2)若键值库中存在与存储标识符标识的文件同名的文件夹,则向用户返回“同名文件夹存在”信息;(10‑3‑3)若键值库中存在存储标识符标识的文件,则对追加选项进行判断:(10‑3‑3‑1)若追加选项为假,则存储接口模块读取该文件元数据行,获得文件内容第一个数据块的行键,读取第一数据块的行键所指示的内容数据行,以获得下一数据块的行键,将第一数据块的下一数据块行键列置为“文件结尾”,同时置下一数据块为当前数据块,读取该当前数据块内容数据行,以获得下一数据块的行键,删除当前数据块的内容数据行后置下一数据块为当前数据块,重复上述置当前数据块、获取下一数据块行键、删除当前数据行的操作直到获取当前数据块的下一数据块行键列数据为“文件结尾”,删除当前数据块的内容数据行,打开一个输出流,向用户返回该输出流操作对象;(10‑3‑3‑2)若追加选项为真,则存储接口模块读取该文件元数据行,以获得文件内容第一个数据块的行键,置第一个数据块为当前数据块,读取该当前数据块的行键所指示的内容数据行,以获得下一数据块的行键,重复读取下一数据块行键列查找下一数据块内容数据行的操作,直到当前数据块的内容数据行的下一数据块行键列值为“文件结尾”,将当前数据块内容数据读到本地内存缓存区中,打开一个输出流,向用户返回该输出流操作对象;(10‑4)用户使用上述输出流操作对象,以字节或字节数组的方式向本地内存缓存区写入数据,同时存储接口模块启动一个计时器,若计时器计时超过用户设定的未写超时时间或用户关闭了该输出流操作对象,则存储接口模块关闭计时器,关闭输出流,存储接口模块根据存储标识符进行识别,根据识别结果分别进行步骤(10‑4‑1)或(10‑4‑2),若计时器计时在用户设定的未写超时时间内,且用户写入的数据将本地内存缓存区填满时,存储接口模块对存储标识符进行识别:(10‑4‑1)若存储标识符标识的是列,则存储接口模块从键值库中读取存储标识符标识的列的数据,将本地内存缓存区数据追加到原列数据,形成新的列数据,将该新的列数据写入存储标识符标识的列中,置本地内存缓存区数据为空,重复步骤(10‑4);(10‑4‑2)若存储标识符标识的是文件,则存储接口模块将本地内存缓存区数据写入当前数据块的内容数据行的数据列中,确定下一数据块的行键,将下一数据块的行键写入当前数据块的内容数据行的下一数据块行键列中,将下一数据块置为当前数据块,创建当前数据块行键所指示的内容数据行,将当前数据块的内容数据行的下一数据块行键列置为“文件结尾”,将本地内存缓存区数据置为空,重复步骤(10‑4),(11)当存储接口模块接到用户字节下载命令及相应的存储标识符时,存储接口模块对存储标识符进行识别,若存储标识符标识的是文件、文件夹、表格、行或列簇,则向用户返回“不支持”信息;若存储标识符标识的是列,则存储接口模块对键值库进行查询,若键值库中不存在存储标识符标识的列,则向用户返回一个空字节数组;若键值库中存在存储标识符标识的列,则从键值库中读取存储标识符标识的列数据,并将该列数据存入字节数组中,向用户返回该字节数组;(12)当存储接口模块接到用户本地路径下载命令及相应的存储标识符、本地路径时,存储接口模块对存储标识符进行识别:(12‑1)若存储标识符标识的是表格、行、列簇或列,则向用户返回“不支持”信息;(12‑2)若存储标识符标识的是文件或文件夹,则存储接口模块对存储标识符和本地路径进行识别:(12‑2‑1)若存储标识符标识的是文件,且本地路径指示的是已经存在的文件或文件夹,则向用户返回“本地文件/文件夹已经存在”信息;(12‑2‑2)若存储标识符标识的是文件,且本地路径指示的文件不存在,则根据本地路径创建本地文件,存储接口模块从键值库中读出存储标识符标识的文件元数据行中的第一个数据块的行键,将第一个数据块设为当前数据块,通过当前数据块的行键读取当前数据块的内容数据,并将当前数据块的内容数据追加到本地文件内容中,再读取当前数据块的内容数据行,获得下一个数据块的行键,再将下一个数据块置为当前数据块,重复上述读取数据块内容、追加本地文件内容、读取下一数据块行键、设置当前数据块的操作直到当前数据块的下一数据块行键列数据为“文件结尾”时,向用户返回“成功”信息;(12‑2‑3)若存储标识符标识的是文件夹,且本地路径指示的是已经存在的文件,或存储标识符标识的是文件夹,且本地路径加标识符标识的文件夹名称形成的新路径指示的是已存在的本地文件或文件夹,则向用户返回“本地文件/文件夹已经存在”信息;(12‑2‑4)若存储标识符标识的是文件夹,且不存在本地路径指示的文件或文件夹,则存储接口模块在本地创建本地路径指示的文件夹,并在本地路径指示的文件夹下创建以标识符标识的文件夹名称命名的文件夹,存储接口模块从键值库中读取存储标识符标识的文件夹元数据行的“子文件路径i”或“子文件夹路径i”(i=1,2,..,n)各列数据,并重复步骤(12‑2),下载该文件夹的所有子文件和子文件夹,并向用户返回“成功”信息;(13)当存储接口模块接到流下载命令及相应的存储标识符时,存储接口模块对存储标识符进行识别:(13‑1)若存储标识符标识的是表格,则存储接口模块向用户返回“不支持”信息;(13‑2)若存储标识符标识的是列,则存储接口模块对存储标识符标识的列进行判断,若键值库中不存在存储标识符标识的列,则向用户返回“列不存在”信息,若键值库中存在存储标识符标识的列,则从键值库中将存储标识符标识的列数据下载到本地内存缓存区中,并打开一个输入流,向用户返回该输入流操作对象;(13‑3)若存储标识符标识的是文件,存储接口模块对存储标识符标识的文件进行判断,若键值库中不存在存储标识符标识的文件,则向用户返回“文件不存在”信息,若键值库中存在存储标识符标识的文件,则存储接口模块从键值库中读取该文件元数据行,以获得第一个数据块的内容数据行的行键,将第一个数据块置为当前数据块,使用当前数据块的行键读取其内容数据行的数据列中的数据,存入本地内存缓存区中,并打开一个输入流,向用户返回该输入流操作对象;(13‑4)若存储标识符标识的是文件夹,存储接口模块对存储标识符标识的文件夹进行判断,若键值库中不存在存储标识符标识的文件夹,则向用户返回“文件夹不存在”信息,若键值库中存在存储标识符标识的文件夹,则存储接口模块从键值库中读取该文件夹元数据行的“子文件路径i”或子文件夹路径i”(i=1,2,..,n)各列数据,并存入本地内存缓存区中,打开一个输入流,向用户返回该输入流操作对象;(13‑5)若存储标识符标识的是列簇,存储接口模块对存储标识符标识的列簇进行判断,若键值库中不存在存储标识符标识的列簇,则向用户返回“列簇不存在”信息,若键值库中存在存储标识符标识的列簇,则存储接口模块从键值库中读取列簇的所有列及列数据,并存入本地内存缓存区中,打开一个输入流,向用户返回该输入流操作对象;(13‑6)若存储标识符标识的是行,存储接口模块对存储标识符标识的行进行判断,若键值库中不存在存储标识符标识的行,则向用户返回“行不存在”信息,若键值库中存在存储标识符标识的行,则存储接口模块从键值中读取表格定义的列簇列表,并存入本地内存的缓存区中,依次对上述列簇列表中的每一列簇,重复步骤(13‑5),但在用户使用输入流操作对象时不向用户返回“读取完毕”信息,直到遍历列簇列表中的所有列簇,向用户返回“读取完毕”信息;(13‑7)用户使用输入流操作对象进行读取时,输入流操作对象对存储标识符进行识别:(13‑7‑1)若存储标识符标识的是列,则输入流操作对象以字节或字节数组的方式将数据从本地内存缓存区中读出,输入流的初始读取位置是0,用户每读取一个字节或由n个字节组成的字节数组,读取位置加1或加n,直到读取位置与本地内存缓存区数据字节数相同时,则向用户返回“读取完毕”信息;(13‑7‑2)若存储标识符标识的是文件,则输入流操作对象以字节或字节数组的方式将数据从本地内存缓存区中读出,输入流的初始读取位置是0,用户每读取一个字节或由n个字节组成的字节数组,读取位置加1或加n,直到读取位置与本地内存缓存区数据字节数相同时,读取当前数据块的内容数据行,以获得下一个数据块的行键,将下一个数据块置为当前数据块,使用当前数据块的行键读取其内容数据行的数据列中的数据,存入本地内存缓存区中,重复上述步骤,直到读取当前数据块的内容数据行的下一数据块行键列为“文件结尾”时,向用户返回“读取完毕”信息;(13‑7‑3)若存储标识符标识的是文件夹,则输入流操作对象从本地内存缓存区中读取下一子文件或子文件夹路径,并向用户返回下一子文件或子文件夹路径,当所有子文件或子文件夹路径已经读取完成时,向用户返回“读取完毕”信息;(13‑7‑4)若存储标识符标识的是列簇,则输入流操作对象从本地内存缓存区中读取下一列,并向用户返回下一列的名称及数据,当所有列已经读取完成时,向用户返回“读取完毕”信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110272333.6/,转载请声明来源钻瓜专利网。

同类专利
  • 一种文件数据的展示方法及装置-201710469921.6
  • 马红琴 - 北京国双科技有限公司
  • 2017-06-20 - 2018-12-28 - G06F17/30
  • 本发明公开了一种文件数据的展示方法及装置,涉及计算机技术领域,主要目的在于克服现有技术中文件搜索结果数据展示效果不理想,用户搜索体验较差的问题,本发明的主要技术方案为:获取与文件搜索请求携带的目标文件信息相匹配的目标数据;对所述目标数据进行处理,生成数据对象数组;将所述数据对象数组包装成符合预设数据格式的展示数据,生成文件搜索结果。本发明主要用于文件搜索。
  • 一种信息处理系统及方法-201710470060.3
  • 许家慈;刘育隆;林建廷;萧靖谋 - 新技教育股份有限公司
  • 2017-06-20 - 2018-12-28 - G06F17/30
  • 一种信息处理系统及方法,应用于大数据信息服务环境中,利用本发明的信息处理系统以进行信息处理方法时,在标的物的运算所需的实时和/或非实时的数据输入/汇入后,依照演算逻辑处理条件而对标的物所具有的实时和/或非实时的数据进行一次以上的演算,而得到并标记出标的物在指标意义所构成的一个二维或是三维坐标空间中所在的一个以上的标记位置点,而一个以上的标记位置点对应标的物经数据处理后的数据分析结果,并可针对一个以上的标记位置点进行点选,以具有阶层目录概念的资料数据展现方式,进一步于对应于数据分析结果的次阶层目录的另一个二维或是三维坐标空间中展现出更详尽的数据分析结果,以便进行后续的分析处理。
  • 一种创建组织结构层级关系树的方法及装置-201710470334.9
  • 白涛 - 北京微影时代科技有限公司
  • 2017-06-20 - 2018-12-28 - G06F17/30
  • 本申请提供了一种创建组织结构层级关系树的方法及装置,利用特定的组织结构字符串表示组织结构,该组织结构字符串包括当前要表示的组织及其上级所有组织;每个组织包括层级特征字符和组织名称,且两个不同组织之间利用层级分隔符隔离。获取当前组织结构包含的所有组织结构字符串,根据层级分隔符对每个组织结构字符串进行分割,得到分割结果;然后,根据分割结果中层级特征字符所属的层级,确定各个层级所包含的组织结构,最终得到组织结构层级关系。因为本申请的组织结构字符串可以存储到一个表中,从而降低了一个公司的组织结构所需的存储空间;而且,可以按照该组织结构字符串的规律随意增加上下级组织。
  • 基于可视化的搜索方法及系统-201710470769.3
  • 梁海强 - 聚法科技(长春)有限公司
  • 2017-06-20 - 2018-12-28 - G06F17/30
  • 本发明提供的基于可视化的搜索方法及系统,方法为:获取用户在第一级搜索界面中选择的搜索方式,搜索方式包括可视化搜索方式、案例搜索方式和法规搜索方式;获取用户输入的第一关键词;根据第一关键词,结合选择的搜索方式,进行第一级搜索,得到第一级搜索结果,根据第一级搜索结果,按照预先设定的规则进行多级搜索,得到搜索结果。本发明采用可视化数据搜索方法,将数据分成多个维度进行深层次的搜索,提高了搜索速度和搜索质量,提高了用户体验度。
  • 小文件归档、读取方法及装置、电子设备-201710471483.7
  • 曾凡丽;林鹏;林起芊;汪渭春 - 杭州海康威视数字技术股份有限公司
  • 2017-06-20 - 2018-12-28 - G06F17/30
  • 本发明实施例提供了一种小文件归档、读取方法及装置、电子设备,小文件归档方法包括:当检测到归档指令时,确定归档指令所指示归档的目标小文件的目标文件属性;判断目标文件池中是否存储有第一目标文件的文件信息,第一目标文件的文件属性与目标文件属性相同;如果存储有,生成第一目标文件对应的、且针对于目标小文件的归档任务信息;当检测到第一目标文件符合归档条件时,确定第一目标文件当前所对应的归档任务信息;根据所确定出的归档任务信息所记录的映射关系,将所确定出的归档任务信息所对应的目标小文件写入第一目标文件。应用本发明实施例,减少了海量小文件归档所需的存储空间,并提高了存储海量小文件的存储效率。
  • 数据准确性检测方法、装置、服务器及计算机存储介质-201710471956.3
  • 刘茂才;向春;袁志凯;冯双举 - 中兴通讯股份有限公司
  • 2017-06-20 - 2018-12-28 - G06F17/30
  • 本发明提供一种数据准确性检测方法、装置、服务器及计算机存储介质,通过当前确定的待测对象与预设待测对象与指标模型对应关系表从模型数据库中获取与当前待测对象对应的指标模型,每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、各测量指标对应的指标阈值,根据获取的指标模型提取当前待测对象各测量指标对应的被测数据,分别带入各测量指标对应的计算模型得到各测量指标的指标值,将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定待测对象各测量指标对应的被测数据是否准确,可以实现对各种待测业务的数据进行统一的测量,实用性强,易于推广。
  • 一种企业项目信息获取方法及其系统-201710471965.2
  • 卿春梅;唐义波;唐林波;周占一 - 上海与腾科技有限公司
  • 2017-06-20 - 2018-12-28 - G06F17/30
  • 本发明公开了一种企业项目信息获取系统,包括平台终端和后台服务系统,所述后台服务系统包括以下单元:相关词获取单元,检索单元,信息输出单元;同时本发明也公开了一种企业项目信息获取方法,包括以下步骤:通过平台终端获得用户企业名称和企业注册地;然后根据获取到的企业注册地从预置和/或第三方的项目数据库中检索获取到该企业可能有机会申报的项目信息;最后将获取到的项目信息反馈给平台终端用户。通过本发明提供的一种企业项目信息获取方法及其系统,用户只需输入企业名称和企业注册地即可便捷地为企业获取其可能有机会申报的项目信息。
  • 产品推荐方法、设备以及计算机可读存储介质-201710474485.1
  • 丁家琳 - 平安科技(深圳)有限公司
  • 2017-06-20 - 2018-12-28 - G06F17/30
  • 本发明公开了一种产品推荐方法、设备以及计算机可读存储介质,该方法包括步骤:当侦测到推荐待推荐产品的触发指令时,根据所述触发指令获取已成功购买所述待推荐产品用户的操作数据;根据所述操作数据计算所述用户再次购买所述待推荐产品的预测分数;若所述预测分数大于预设分数,则将所述待推荐产品推荐给所述用户。本发明实现了根据用户的操作数据计算用户再次购买待推荐产品的预测分数,根据预测分数来决定是否将待推荐产品推荐给用户,提高了待推荐产品的购买率;且对于需要续期的产品来说,提高了续期产品的续期率。
  • 数据导入方法及装置-201710476399.4
  • 汤卫群 - 北京国双科技有限公司
  • 2017-06-21 - 2018-12-28 - G06F17/30
  • 本发明公开了一种数据导入方法及装置,在将第二集群的数据导入第一集群之前,第一集群首先将自身当前存储的历史数据中无需逐天累加的第一类数据删除,然后,将从第二集群中获得的待导入数据存储到第一集群中。删除第一集群存储的历史数据中的第一类数据,第一类数据不需要逐天累加,而且,此类数据可能在一段时间内不会发生变化。因此,删掉此类数据不会影响后续的数据处理过程,此外,后续从第二集群导入的数据中可能还包括这个数据。因此,删掉第一集群中的第一类数据后,能够避免从第二集群中导入与所述第一类数据重复的数据,节省了第一集群中的存储空间。
  • 一种电子手册和电子手册的显示方法-201810601228.4
  • 曹炳欣;孙华;王川;何彬;贺婷婷;牟琳 - 中车青岛四方机车车辆股份有限公司
  • 2018-06-12 - 2018-12-28 - G06F17/30
  • 本发明实施例提供一种电子手册和电子手册的显示方法,其中,电子手册包括手册配置页面和若干个结构化文本;手册配置页面包括章节查询信息和属性查询信息;章节查询信息包括若干个章节标签和每一章节标签的关联信息,任一章节标签的关联信息用于映射任一章节标签对应的若干个结构化文本;属性查询信息包括若干个属性标签和每一属性标签的关联信息,任一属性标签的关联信息用于映射任一属性标签对应的若干个章节标签。本发明实施例提供的一种电子手册和电子手册的显示方法,可以通过属性标签和/或章节标签查找结构化文本,在常规电子手册的基础上加入了可交互的索引功能,帮助用户快速查找需要了解的信息,提高信息检索效率和学习效率。
  • 基于大数据的数据自动抽取系统-201810603056.4
  • 陈华;郁东风;吴途;毛晨杰 - 江苏开拓信息与系统有限公司
  • 2018-06-12 - 2018-12-28 - G06F17/30
  • 本发明公开了一种基于大数据的数据自动抽取系统,包括用于存储待抽取数据的数据源服务器;用于提供可视化配置界面的客户端;包括有配置存储模块、全量抽取模块、增量抓取模块、数据对比模块;配置存储模块的数据抽取服务器用于记录在抽取过程中将相关信息以参数的形式传递并记录在日志信息表中的日志存储模;用于存储抽取之后的结果数据的数据存储服务器。采用上述技术方案后,配置存储模块实现了一次配置可以多次使用。日志存储模解决了无法自动记录日志的问题。数据对比模块保证了抽取完成后能够自动验证数据量的准确性。
  • 数据压缩系统、有损数据压缩的方法和数据压缩的方法-201810609379.4
  • 奇亮奭;李勇锡;杰森·马蒂诺 - 三星电子株式会社
  • 2018-06-13 - 2018-12-28 - G06F17/30
  • 一种用于有损数据压缩的方法,所述方法包括:在存储装置处接收原始数据;接收要对旗标进行压缩的请求;存取板载数据压缩算法库,其包含分别与有损数据压缩方案对应的各种数据压缩算法;基于多个参数来选择所述数据压缩算法中的一者;在线运行所选择的所述数据压缩算法,使得当接收到所述原始数据时所述原始数据被所述存储装置压缩,且接着所述原始数据被作为压缩数据存储在所述存储装置上;或者离线运行所选择的所述数据压缩算法,使得所述原始数据存储在所述存储装置处,此后由所述存储装置根据所选择的所述数据压缩算法来压缩所述原始数据,且所述原始数据被作为压缩数据重新保存在所述存储装置处。也提供数据压缩系统和数据压缩的方法。
  • 存储驱动器及其上的压缩系统及压缩其上的数据的方法-201810620352.5
  • 奇亮奭;李勇锡;杰森·马蒂诺 - 三星电子株式会社
  • 2018-06-15 - 2018-12-28 - G06F17/30
  • 本发明提供一种存储驱动器上的压缩系统、压缩存储驱动器上的数据的方法及存储驱动器。本发明的实施例包含一种压缩系统,所述压缩系统包含一或多个可压缩性输入;压缩预测器,配置成基于一或多个可压缩性输入来预测数据的可压缩性;压缩器,配置成压缩数据;以及一或多个压缩输入。压缩预测器或压缩器中的至少一个配置成基于一或多个压缩输入来确定如何压缩数据。一或多个可压缩性输入包括对象扩展名字典、对象签名字典以及熵估算算法库中的至少一个。一或多个压缩输入包括服务质量简档、装置性能简档以及压缩算法性能表中的至少一个。本发明的实施例所描述的预测可压缩性并确定如何压缩数据的方法,可优化存储驱动器的总体性能。
  • 一种基于图像对比识别的医疗图像比对方法-201810630625.4
  • 邱兆文;张健 - 黑龙江拓盟科技有限公司
  • 2018-06-19 - 2018-12-28 - G06F17/30
  • 本发明涉及一种基于图像对比识别的医疗图像比对方法,该方法包括以下步骤:(1)设置内置病例模板图片;(2)对医学影像数据进行特征提取;(3)对提取的特征进行比对,得到一个反应图像间差异的数值用来判定图片相似与否。本发明通过图像特征提取技术可以准确的查询文字无法表述的图片信息,克服普通的查询只能通过字符描述,但医学影像往往不好通过语言表述其特点,照成检索困难的问题,因此该技术在医疗领域的作用尤为突出。
  • 一种区块链勘误方法及装置、存储介质、电子设备-201810636232.4
  • 谭智勇;宋承根;赵微 - 北京欧链科技有限公司
  • 2018-06-20 - 2018-12-28 - G06F17/30
  • 本发明提供了一种区块链勘误方法及装置、存储介质、电子设备,该区块链勘误方法包括:在接收到针对待勘误区块链中的任一目标区块的勘误请求时,利用所述勘误请求携带的勘误数据对所述目标区块进行勘误,生成勘误记录;确定勘误区块头信息;利用所述勘误记录以及所述勘误区块头信息,生成所述目标区块对应的勘误区块;将所述勘误区块连接到预设的勘误区块链上。因此,本发明提供的方案可以降低勘误记录被篡改的概率。
  • 一种海量安全日志信息过滤方法及装置-201810642159.1
  • 亚静;柳厅文;李全刚;张盼盼;时金桥 - 中国科学院信息工程研究所
  • 2018-06-21 - 2018-12-28 - G06F17/30
  • 本发明公开了一种海量安全日志信息过滤方法及装置。本方法为:1)提取安全日志信息的特征序列;2)根据黑白名单对所述特征序列进行标注,利用标注好的特征序列训练向量表示模型;其中,将根据黑白名单无法标注的特征序列称为灰度数据;3)利用训练好的向量表示模型,对所述灰度数据进行向量表示,得到各所述灰度数据对应的向量;4)计算每一所述灰度数据i对应的向量与各标注为白名单的特征序列对应的向量之间的距离d;如果该距离d小于设定阈值,则过滤掉所述灰度数据i对应的安全日志。本发明能够在小规模黑白名单基础上实现大规模正常日志信息的过滤,提升了异常检测的效率。
  • 数据处理方法、数据处理装置及电子设备-201810645503.2
  • 陈全友 - 深圳市买买提信息科技有限公司
  • 2018-06-21 - 2018-12-28 - G06F17/30
  • 本发明适用于服务器技术领域,提供了一种数据处理方法、数据处理装置、电子设备及计算机可读存储介质,所述数据处理方法应用于服务器集群中的服务器,包括:获取待处理数据中用于指示主关键字的关键值数据;生成与所述关键值数据对应的唯一标识;判断缓存数据库中是否存在所述唯一标识;若所述缓存数据库中不存在所述唯一标识,则在所述缓存数据库中创建所述唯一标识;将所述待处理数据写入所述缓存数据库。本发明能够解决集群模式下服务器中的多个进程向数据库中写入数据时可能出现的主键冲突问题,实现集群同步。
  • 检测作弊方法、装置及设备-201810660426.8
  • 林万琪 - 广州爱九游信息技术有限公司
  • 2018-06-25 - 2018-12-28 - G06F17/30
  • 本发明公开一种检测作弊方法、装置及设备。该检测作弊方法,包括:获取用户端设备参数,所述用户端设备参数包括第一参数和第二参数;根据所述第一参数计算用户端设备的物理设备宽度;根据所述第二参数从数据库查询记录的用户端设备的标准物理设备宽度;根据所述计算出的用户端设备的物理设备宽度与所述查询到的用户端设备的标准物理设备宽度不同,判断所述用户端设备作弊。本发明提供的方案,能更简单方便检测出作弊。
  • 一种基于文本规则的自动文档分发方法和装置-201810670929.3
  • 罗奔 - 珠海宏桥高科技有限公司
  • 2018-06-26 - 2018-12-28 - G06F17/30
  • 本申请公开了一种基于文本规则的自动文档分发方法,包括以下步骤:获取待分发文档的使用信息,其中使用信息至少包括的文档标题和文档类型;根据待分发文档的使用信息以及记录已分发文档的标注库,构建训练样本;基于训练样本,建立并训练多层感知分类器以形成分发规则配置文件;以及加载分发规则配置文件,根据分发规则配置文件分发待分发文档。本申请还公开了与上述方法相对应的一种基于文本规则的自动文档分发装置。本申请的有益效果为:通过分析不同的文档被分发方在使用文档的类型和标题上的显著差异,训练文档的多层感知分类器以形成分发规则配置文件,实现了多团队协同工作下的文档自动分发。
  • 一种面向中文专利文本的实体抽取方法和系统-201810694442.9
  • 张力文;程国艮 - 中译语通科技股份有限公司
  • 2018-06-29 - 2018-12-28 - G06F17/30
  • 本发明提供了一种面向中文专利文本的实体抽取方法和系统,包括预处理模块、基于词性模板的候选实体抽取模块、和基于原文匹配的候选实体抽取模块。其中,预处理模块主要是把非结构化的文本转换为半结构化文本以便降低抽取难道,并把切割好的半结构化文本及其相应的词性序列输入到下一模块;基于原文匹配的候选实体抽取模块主要是对基于词性模板的候选实体抽取模块的后处理,主要是针对基于词性模板的候选实体抽取模块输出的非实体词,追溯这些词出现的原文,进行上下文匹配,得到最终实体。该方法和系统依据词性规则模板,无需人工标注便可对专利文本中的实体自动进行提取,克服了现有技术严重依赖大规模标注语料的缺陷,节省了标注的人力成本。
  • 基于社交网络的好友位置信息挖掘推送方法及系统-201810707873.4
  • 童磊 - 湖北衣谷电子商务有限公司
  • 2018-07-02 - 2018-12-28 - G06F17/30
  • 本发明提出基于社交网络的好友位置信息挖掘推送方法及系统,方法包括如下步骤:自我定位、好友定位、距离测定与排序以及推送显示;系统包括爬虫服务器、地理信息位置配置模块、推送显示模块、距离测定模块、地理位置信息调取模块以及数据处理模块。本发明所述的基于社交网络的好友位置信息挖掘推送方法及系统的合理,功能实用,能够使得好友之间在现实生活中更好的互动的优点。
  • 一种基于服务编排技术的快速团体保单保全对接平台-201810711142.7
  • 金超 - 北京众信易保科技有限公司
  • 2018-07-03 - 2018-12-28 - G06F17/30
  • 本发明涉及一种基于服务编排技术的快速团体保单保全对接平台,其包括统一输入验证接口模块,统一输入验证接口模块为保险公司用户提供统一的录入接口;保全服务编排模块用于实现微服务的流程定制性及高可复用性;保险公司协议配置器模块用于快速对接不同保险公司的保全服务对接器;保全微服务消费消息队列MQ中待处理的消息,通过保险公司协议映射配置器模块传送至保险公司系统;统一输出接口模块是保险公司将接收到的数据进行保全处理,保全流程结束后生成保全批单PDF文档,通过邮件发送经纪公司指定邮箱;同时将数据标准报文通过接口传输至保险经纪公司,保险经纪公司对接收到的数据标准报文进行快速保全微服务。本发明能避免重复开发对接保险公司接口。
  • 热力图生成方法、装置、计算设备和可读存储介质-201810712675.7
  • 罗永顺;邬向春;王国彬 - 深圳市彬讯科技有限公司
  • 2018-06-29 - 2018-12-28 - G06F17/30
  • 本申请公开了一种用户网站点击数据的热力图生成方法、装置、计算设备和可读存储介质,方法包括:步骤S110获取用户网站点击数据;步骤S120依据预先设置的网站点击数据的维度指标分类表,将用户网站点击数据进行分类;维度指标分类表包括至少两个维度属性,每一维度属性对应有数据时间更新周期;步骤S130依据每一所述网站点击数据所属的维度分类,确定该网站点击数据对应的更新周期;步骤S140对不同维度的用户网站点击数据,按照其对应的更新周期,定期的调取对应的时间段内的用户点击数据,并生成热力图,进行展示。实现了根据数据维度特点设定更新周期,生成热力图,使生成的热力图更具有实时性,进而使其更具有指导性意义。
  • 基于人机交互的自然语言处理方法、装置、设备和介质-201810712778.3
  • 谢泽颖;凌光;纪友升;陈炳金 - 北京百度网讯科技有限公司
  • 2018-06-29 - 2018-12-28 - G06F17/30
  • 本发明实施例公开了一种基于人机交互的自然语言处理方法、装置、设备和介质,其中,该方法包括对目标自然语言文本进行意图识别,得到目标意图和目标槽位;根据目标意图和预先建立的资源池,匹配得到目标资源列表,其中,资源池中包括具有不同能力的多个资源,目标资源列表中包括能力与目标意图相关的至少一个目标资源;获取依据目标意图和目标槽位从至少一个目标资源中召回的结果集;从结果集中确定出与目标自然语言文本对应的目标应答话术。本发明实施例可以解决现有人机对话系统开发成本高以及系统复用性和扩展性较差的问题,降低人机对话系统的开发成本,提高系统复用性和扩展性。
  • 一种用于电子商务系统的OLAP系统-201810715992.4
  • 李燕 - 嘉兴玖轩电子商务有限公司
  • 2018-07-03 - 2018-12-28 - G06F17/30
  • 一种用于电子商务系统的OLAP系统,包括企业服务器、OLAP服务器和客户机,所述企业服务器、OLAP服务器和客户机构成了OLAP系统的三层结构,所述OLAP系统中还包含基层数据库和数据仓库,企业服务器、OLAP服务器和客户机均与数据仓库进行连接;三层结构将应用逻辑、GUI及DBMS严格区分开来,复杂的应用逻辑不是分布于客户机上,而是集中存放在分析服务器上,由服务器提供高效的数据存取以及分析预处理;WEB和OLAP结合可以节省开发的费用,直接采用WEB Browser不需开发专门的软件,并且跨平台,便于推广,利于企业从集中式的环境向分布式开放环境转变。
  • 一种基于推荐技术的多媒体获取方法及系统-201810744514.6
  • 姜锋;李严;李婧;张洋;王影;李紫薇;姜涛;宁海涛;宋野;夏双成;董会权 - 姜锋
  • 2018-07-09 - 2018-12-28 - G06F17/30
  • 本发明提供一种基于推荐技术的多媒体获取方法及系统,预先建立车辆行驶速度与多媒体推荐类型的映射关系,获取当前行驶车辆的行驶速度,根据获取的当前行驶车辆的行驶速度,结合所述预先建立的行驶车辆速度与多媒体推荐类型的映射关系,获取待推荐的多媒体类型,通过车载多媒体播放设备从互联网获取属于所述待推荐的多媒体类型的多媒体对象,推荐并自动播放所述多媒体对象,并且,当前行驶车辆的行驶速度大于当前车道限速时,将播放所述多媒体对象的声量大小减半,并发出减速提示信息。
  • 用于JAVA平台的数据缓存系统、方法以及计算机终端-201810761640.2
  • 李义华 - 厦门中控智慧信息技术有限公司;中控智慧科技股份有限公司
  • 2018-07-12 - 2018-12-28 - G06F17/30
  • 本发明涉及一种用于JAVA平台的数据缓存系统、方法以及计算机终端。该系统包括缓存,缓存包括堆内内存和堆外内存。堆内内存用于存储key值和堆外内存指示器,key值和堆外内存指示器相对应;堆外内存用于存储待缓存数据。缓存管理单元,根据待缓存数据及数据存储请求生成相互对应的key值和缓存地址信息,缓存地址信息为待缓存数据在堆外内存的存储地址信息;堆外内存指示器,用于存储缓存地址信息。通过实施本发明,实现对缓存的同一高效管理,减少垃圾回收时间;实现进程共享,较少虚拟机间的对象复制;并可实现持久化存储的快速重启。
  • 一种发票核定方法及系统-201810762085.5
  • 高勇;吴乐云;颜士营;张蕾;赵长江;王景珑;赵楠 - 青岛微智慧信息有限公司
  • 2018-07-12 - 2018-12-28 - G06F17/30
  • 本发明公开了一种发票核定方法及系统。该方法包括:获取纳税人的信息;根据信息生成纳税人相关指数;根据纳税人相关指数以及预设条件对纳税人进行筛选,得到满足条件的纳税人以及未满足条件的纳税人;获取满足条件的纳税人的发票领用数据以及发票开具数据;通过满足条件的纳税人、发票领用数据以及发票开具数据,对长短时记忆模型进行训练,得到预测模型;通过预测模型预测满足条件的纳税人在预设期限内的发票金额;根据预测的发票金额给满足条件的纳税人推送核定调整建议。本方法或系统能够对纳税人信息进行综合分析,为税务机关提供合理发票核定的依据,提高发票核定的准确率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top