专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果7个,建议您升级VIP下载更多相关专利
  • [发明专利]基于迁移学习的日志异常检测方法-CN202010813538.X有效
  • 张圣林;李东闻;陈锐;孙永谦;张玉志 - 南开大学;赛尔网络有限公司
  • 2020-08-13 - 2023-09-22 - G06F11/30
  • 本发明涉及网络通信,为能够及时、主动发现服务异常以及时采取应对措施,提高网络中心的稳定性,本发明,基于迁移学习的日志异常检测方法,处理对象为源数据、目标数据:具体包括三部分:1)特征构建部分;形成日志数据的向量序列,作为迁移学习部分的输入;2)迁移学习部分;首先将源数据形成的向量序列输入长短期记忆LSTM网络,对模型参数进行训练;然后将目标数据形成的向量序列输入上一阶段初步训练好参数的模型,并对模型参数进行再次调整3)主动学习部分:迭代地更新数据和模型。本发明主要应用于网络通信日志数据处理场合。
  • 基于迁移学习日志异常检测方法
  • [发明专利]文本数据的筛选方法、装置、电子设备及存储介质-CN202210698401.3在审
  • 孙羽菲;李东闻;钟震宇;王昊天;申峻宇;张玉志 - 南开大学
  • 2022-06-20 - 2022-11-04 - G06F16/33
  • 本申请提供了一种文本数据的筛选方法、装置、电子设备及存储介质,主要技术方案包括:将待处理文本数据通过第一筛选策略进行筛选,第一筛选策略用于根据首位标点及末位标点进行数据筛选;将待处理文本数据通过第二筛选策略进行筛选,第二筛选策略用于对待处理文本数据中的预设控制符进行筛选;将待处理文本数据通过第三筛选策略进行筛选,第三筛选策略用于根据待处理文本数据中出现预设敏感词汇的占比进行筛选;将待处理文本数据通过第四筛选策略进行筛选,第四筛选策略用于根据待处理文本数据的文本总长度进行筛选。与相关技术筛选结果存在误差或导致正常文本数据丢失相比,此方法可以将冗余文本、敏感文本或者过短文本去除,得到高质量的文本。
  • 文本数据筛选方法装置电子设备存储介质
  • [发明专利]大规模文本数据处理系统的构建方法及装置、电子设备-CN202210700365.X在审
  • 张玉志;钟震宇;李东闻;孙羽菲 - 南开大学
  • 2022-06-20 - 2022-11-04 - G06F16/11
  • 本公开公开了大规模文本数据处理系统的构建方法及装置、电子设备和存储介质,涉及数据处理领域,主要技术方案包括:配置多任务并行处理策略,以执行数据处理中对应的不同任务;配置执行不同任务处理的自动化流转;按照预设配置策略配置分时处理不同任务;基于预设数据库对多任务进行管理及纠错,以完成所述数据处理系统的构建。与相关技术相比,本公开实施例提供的数据处理系统进行了各种优化策略的配置,实现多任务并行处理,任务处理自动化流转,分时处理不同任务,以及对存放多任务的文件进行管理及纠错,且本公开实施例提供的各种优化策略同时也可作为数据处理系统性能提升手段与鲁棒的错误处理方法,从而实现了数据处理系统的鲁棒性提升。
  • 大规模文本数据处理系统构建方法装置电子设备
  • [发明专利]大规模文本数据的去重方法及装置、电子设备和存储介质-CN202210700368.3在审
  • 孙羽菲;申峻宇;王昊天;李东闻;张玉志 - 南开大学
  • 2022-06-20 - 2022-11-04 - G06F40/194
  • 本公开公开了大规模文本数据的去重方法及装置、电子设备和存储介质,涉及数据处理领域,主要技术方案包括:将第一待去重数据划分至少两个数据段,每个数据段包含至少两个数据;在第一数据段内,分别针对单个数据执行预设哈希算法,得至少一个哈希分块;对第一数据段内的至少两个数据执行去重计算,得第二待去重数据;依次将第二待去重数据中的哈希分块与预设参考数据库中的哈希分块进行比对;根据比对结果的相似度进行二次去重计算,并继续执行第一待去重数据中剩余的第二数据段内的去重计算。与相关技术相比,本公开实施例将大规模数据拆分成小段数据,然后依次对每段数据进行去重操作,进而实现文本数据去重规模突破设备内存限制。
  • 大规模文本数据方法装置电子设备存储介质
  • [发明专利]海量网络数据处理系统及其的构建方法、装置-CN202210700372.X在审
  • 孙羽菲;张玉志;李东闻;钟震宇;王昊天;申峻宇 - 南开大学
  • 2022-06-20 - 2022-11-04 - G06F16/335
  • 本公开提供了一种海量网络数据处理系统及其的构建方法、装置。数据下载模块基于配置后的下载方式及下载任务的调度进行数据处理;文本提取模块以网络文本的一行为单位进行预设语言类型的文本提取;文本过滤模块基于过滤策略对数据进行过滤,所述过滤策略根据首位标点及末尾标点、控制符、出现预设敏感词汇的占比、文本总长度中的至少一种生成;去重模块基于去重策略对数据进行去重,所述去重策略采用先局部去重,再整体二次去重的方式;数据筛选模块基于筛选策略进行筛选,所述筛选策略根据文本困惑度得到;文本格式处理模块对文本数据格式进行配置。实现了利用海量网络数据进行高质量文本数据系统的构建。
  • 海量网络数据处理系统及其构建方法装置
  • [发明专利]中文文本的提取方法及装置、电子设备和存储介质-CN202210700387.6在审
  • 张玉志;李东闻;孙羽菲;钟震宇 - 南开大学
  • 2022-06-20 - 2022-11-04 - G06F40/289
  • 本公开公开了中文文本的提取方法及装置、电子设备和存储介质,具体涉及数据处理技术领域,对待处理文本数据按照预设分割方法进行处理,得到至少两个文本单元;分别检测每个文本单元中的总字符长度,以及分别检测每个文本单元中的中文字符长度;计算同一文本单元内的所述中文字符长度与所述总字符长度之间的比值;若所述比值超过目标中文占比阈值,则保留当前文本单元内的所有字符。通过以文本数据的行为单位,并根据行中的总字符长度与中文字符长度的比值以及根据行中总字符长度确定的中文占比阈值进行确定是否保留当前行中的全部字符,既有效地提取了中文文本信息,也有效地保留了中文句子中原本包含的其他语言的信息。
  • 中文文本提取方法装置电子设备存储介质
  • [发明专利]一种基于大规模网络的数据分类方法和装置-CN202210306441.9在审
  • 张圣林;李东闻;孙永谦;钟震宇;张玉志 - 南开大学
  • 2022-03-25 - 2022-08-05 - G06K9/62
  • 本发明公开了一种基于大规模网络的数据分类方法和装置,其中,该方法包括:获取待检测数据;其中,待检测数据包括系统级指标和用户级指标;对待检测数据的多变量时间序列进行平滑和归一化的数据预处理得到预处理数据;将预处理数据输入通过离线聚类训练好的一维卷积自动编码器进行数据压缩处理,并使用离线聚类得到的特征索引执行特征选择,根据特征选择的结果进行距离计算,以进行在线数据分类;基于在线数据分类,输出待检测数据的在线分类结果。本发明可以根据系统实例的正常模式对其进行精确且高效聚类并显著减少异常检测训练开销。
  • 一种基于大规模网络数据分类方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top