[发明专利]网页的处理方法及装置、存储介质、电子装置有效

专利信息
申请号: 201810725738.2 申请日: 2018-07-04
公开(公告)号: CN108984694B 公开(公告)日: 2019-07-30
发明(设计)人: 张峰;聂颖;郑权 申请(专利权)人: 龙马智芯(珠海横琴)科技有限公司
主分类号: G06F16/30 分类号: G06F16/30;G06N3/08
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 赵囡囡;董文倩
地址: 519000 广东省珠*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种网页的处理方法及装置、存储介质、电子装置,其中,该方法包括:获取训练样本中存在第一语言的网页的文本属性值;将第一参数值作为感知器神经网络的输入变量以确定用于指示网页是否为以第一语言为主体文本的第三参数值;根据第二参数值和第三参数值确定感知器神经网络中种群个体的适应值;对种群中适应值最优的个体进行解码得到感知器神经网络的连接权值和偏置值;基于连接权值和偏置值确定待处理网页是否以第一语言为主体文本。通过本发明,解决了相关技术中用于提取网页的参数是是根据经验与网页结构的特点事先设置的,因此会由于参数设置的不当导致网页文本的提取的不准确的问题,达到了提高用户体验的效果。
搜索关键词: 网页 感知器神经网络 存储介质 电子装置 主体文本 权值和 偏置 种群 语言 参数值确定 解码 参数设置 输入变量 网页结构 网页文本 文本属性 训练样本 用户体验
【主权项】:
1.一种网页的处理方法,其特征在于,包括:获取训练样本中存在第一语言的网页的文本属性值,其中,所述文本属性值包括:用于指示在所述网页中与所述第一语言对应的第一参数值、用于指示所述网页是否以第一语言为主体文本的第二参数值;将所述第一参数值作为三层感知器神经网络的输入变量以确定用于指示所述网页是否为以第一语言为主体文本的第三参数值;根据所述第二参数值和所述第三参数值确定所述三层感知器神经网络中种群个体的适应值;对所述种群中适应值最优的个体进行解码得到所述三层感知器神经网络的连接权值和偏置值;基于所述连接权值和偏置值确定待处理网页是否以第一语言为主体文本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810725738.2/,转载请声明来源钻瓜专利网。

同类专利
  • 问卷调查题目的更新方法及装置、存储介质、计算机设备-201910470472.6
  • 许剑勇 - 深圳壹账通智能科技有限公司
  • 2019-05-31 - 2019-10-22 - G06F16/30
  • 本发明公开了一种问卷调查题目的更新方法及装置、存储介质、计算机设备,涉及数据处理技术领域,解决现有问卷调查题目更换仅仅是根据用户未做答的题目个数从题库中任意提取题目作为更新题目的问题。包括:通过摄像设备按照所答题目的序号获取所述用户的五官表情信息;将所述五官表情信息与预置微表情进行对比,并按照对比后的差异将所述五官表情信息进行数值化;根据数值化后的数值计算所述五官表情信息的差异值,将所述差异值与预置差异阈值进行对比;若小于所述预置差异阈值,则将进行不可信标记;解析所述题目的特征词,根据所述特征词从题目库中查找替换题目,并将所述替换题目更新至所述问卷调查系统中。
  • 大数据存储管理方法、设备及计算机可读存储介质-201910602096.1
  • 张浩春 - 武汉莱博信息技术有限公司
  • 2019-07-05 - 2019-10-22 - G06F16/30
  • 本发明公开了一种大数据存储管理方法、设备及计算机可读存储介质,该方法包括:当接收到待存储文献资料时,检测数据库中是否存在与所述待存储文献资料一致的已存储文献资料;若数据库中不存在与所述待存储文献资料一致的已存储文献资料,则将所述待存储文献资料存储至数据库中。通过本发明,只有在数据库中不存在与待存储文献资料相同的已存储文献资料时,才将待存储文献资料存储至数据库中,避免了对同一份文献资料重复存储,使得数据库存储空间能被最大化应用。
  • 适用于汽车电子元件老化温度和时间的优化方法-201310720074.8
  • 鲍建波;苟文辉;徐性怡 - 上海大郡动力控制技术有限公司
  • 2013-12-23 - 2019-09-13 - G06F16/30
  • 本发明公开了一种适用于汽车电子元件老化温度和时间的优化方法,即本方法首先设定若干老化温度和时间,分别在每个老化温度下的各老化时间后测量记录电子元件的代表性关键参数;利用PPK长期工序能力指数计算各老化温度下的PPK值,并以不低于等级A确定优化后的温度点,优化老化时间以电子元件老化监控点进入稳定状态的时间点和相邻时间点稳定状态变差最小的两点中较大的时间点相与进行判定,最后从各监控点的优化时间中选择其中最大的时间点为最终的优化老化时间。本方法利用PPK长期工序能力指数对电子元件老化温度和时间进行优化,在保证电子元件质量的前提下,确定尽可能短的老化时间和合适的老化温度,提高老化效果及效率,降低老化成本。
  • 一种用于工业信号源的数据标签建立与检索方法-201511011263.3
  • 汤醒龙;范寅;刘胜军;王晓芳 - 合肥城市云数据中心股份有限公司
  • 2015-12-30 - 2019-08-09 - G06F16/30
  • 本发明涉及一种用于工业信号源的数据标签建立与检索方法,与现有技术相比解决了工业信号源庞大难以进行数据抽取的缺陷。本发明包括以下步骤:定义工业信号源的工业信号属性,对若干个工业信号源的基础属性进行规范化处理;对工业信号源进行标签标记,对工业信号源进行业务标签和特定标签的标记;建立多维标签,将多维标签信息与工业信号源基础属性进行关联处理;多维标签的检索,根据多维标签筛选条件,检索出符合要求的工业信号源。本发明为信号源打上各种标签,方便不同的使用者从各种角度观察数据、分析数据,以实现信号源数据的多维观察与对比分析。
  • 一种实现关键字对匹配的系统及方法-201710033491.3
  • 涂高元;杨其栓;邱志斌;郭永兴;陆云燕;张艳蓉 - 厦门天锐科技股份有限公司
  • 2017-01-16 - 2019-08-02 - G06F16/30
  • 本发明公开一种实现关键字对匹配的系统,包括:从web服务器获取关键字对规则的数据采集模块,以及将数据包与规则进行匹配,返回结果集,根据结果集分析是否匹配触发的数据分析模。本发明还公开一种实现关键字对匹配的方法,步骤是:步骤1,web服务器获取定义好的关键字对形式的规则,并存入数据库中;步骤2,将规则拆分为单个关键字与间距;步骤3,将数据包内容逐词与单个关键字进行匹配判断数据包内容是否为汉字,得到匹配到的关键字末端在文本中所处的字符数,以及关键字在文本中所在的位置,将结果保存到结果集;步骤4,判断间距是否在定义的规则的间距范围内,若是则表示匹配触发,上报结果。此种技术方案可实现多个关键字匹配。
  • 网页的处理方法及装置、存储介质、电子装置-201810725738.2
  • 张峰;聂颖;郑权 - 龙马智芯(珠海横琴)科技有限公司
  • 2018-07-04 - 2019-07-30 - G06F16/30
  • 本发明提供了一种网页的处理方法及装置、存储介质、电子装置,其中,该方法包括:获取训练样本中存在第一语言的网页的文本属性值;将第一参数值作为感知器神经网络的输入变量以确定用于指示网页是否为以第一语言为主体文本的第三参数值;根据第二参数值和第三参数值确定感知器神经网络中种群个体的适应值;对种群中适应值最优的个体进行解码得到感知器神经网络的连接权值和偏置值;基于连接权值和偏置值确定待处理网页是否以第一语言为主体文本。通过本发明,解决了相关技术中用于提取网页的参数是是根据经验与网页结构的特点事先设置的,因此会由于参数设置的不当导致网页文本的提取的不准确的问题,达到了提高用户体验的效果。
  • 一种并行主题挖掘方法及装置-201410062523.9
  • 曾嘉;倪冰;陈嘉 - 华为技术有限公司
  • 2014-02-24 - 2019-07-23 - G06F16/30
  • 本发明实施例提供一种并行主题挖掘方法及装置。该方法包括:并行主题挖掘装置中的第一节点接收第二节点发送的第二单词‑主题子矩阵和第二余数子矩阵;其中,第二余数子矩阵包括余数矩阵中行累加值最大的行以及列累加值最大的列,所述第二单词‑主题子矩阵包括所述余数矩阵中行累加值最大的行的行号在单词‑主题矩阵中对应的行,以及所述余数矩阵中列累加值最大的列的列号在所述单词‑主题矩阵中对应的列;并根据第二单词‑主题子矩阵更新第一单词‑主题子矩阵,根据第二余数子矩阵更新第一余数子矩阵,将更新后的第一单词‑主题子矩阵和第一余数子矩阵发送至第二节点。从而减小主题挖掘过程中的通讯量,提高主题挖掘的速度。
  • 产品信息展示方法和装置-201610790052.2
  • 赵峰;张贺;丁新星 - 徐工集团工程机械有限公司
  • 2016-08-31 - 2019-07-23 - G06F16/30
  • 本发明公开一种产品信息展示方法和装置。该方法包括:根据产品手册信息类型选择产品手册子模块模板;根据产品物料号对应的产品手册信息对选择的产品手册子模块模板进行实例化,生成所述产品物料号的产品手册子模块;将所述产品手册子模块合并生成所述产品物料号的产品手册;展示所述产品物料号的产品手册。本发明可以实现一次构建产品手册子模块模板,生成各种产品型号的实例产品手册子模块,进而完成了实例电子技术手册,由此减少了重复制作,减轻了相关人员的工作强度,提高了相关人员的工作效率,并避免了数据冗余。
  • 一种文档阅读情况的采集方法及装置-201910035032.8
  • 陈潇;王金明 - 阿里巴巴集团控股有限公司
  • 2019-01-15 - 2019-07-19 - G06F16/30
  • 公开了一种文档阅读情况处理方法及装置。一种文档阅读情况处理方法,该方法包括:接收文档展示操作触发,展示该操作触发指定的目标文档;在接收到针对所述目标文档的任意操作触发的情况下,判断所述目标文档当前的状态;如果为阅读状态,则记录所述目标文档当前显示的阅读片段,并统计用户阅读所述阅读片段的片段阅读时长;以及,根据预设的片段阅读时长与阅读辅助策略的对应关系,从预设阅读辅助策略集中确定针对所述阅读片段的阅读辅助策略;如果为翻页状态,则记录所述目标文档中跳过未阅读的未读片段;从所述阅读片段与未读片段的片段内容中,提取若干用户需求特征,并向用户推荐与所提取的用户需求特征匹配的文档。
  • 页面加载方法和装置-201510614363.9
  • 杨凯 - 北京奇虎科技有限公司;奇智软件(北京)有限公司
  • 2015-09-23 - 2019-07-09 - G06F16/30
  • 本发明提供了一种页面加载方法和装置,待加载的页面中包含结构代码、脚本代码,脚本代码中包含用于在页面上展现的第一文件的信息,方法包括:加载结构代码;在结构代码加载完成后加载脚本代码,并在加载脚本代码时,根据脚本代码中包含的第一文件的信息,加载第一文件以在页面上展现。根据本发明的技术方案,由于文件信息记录在脚本代码中,所以结构代码的加载速度较快,则网页的结构也可以更快地显示给用户,使用户可以更早地观看到网页。
  • 软件定义网络的配置-201680039610.X
  • 马克·赖安·伯纳;雷特·史密斯;贾森·A·迪里恩;乔什·鲍尔斯;格兰特·O·布默 - 施瓦哲工程实验有限公司
  • 2016-06-23 - 2019-06-11 - G06F16/30
  • 本公开涉及用于在软件定义网络(“SDN”)中配置通信流的系统和方法。在一个实施例中,系统可操作用于配置在第一主机和第二主机之间的通信流。模式选择子系统被配置为使在网络中连接第一通信主机和第二通信主机的多个网络设备在开放模式和SDN操作模式之间转换。在开放模式下,网络设备可以发现在第一主机和第二主机之间的通信路径。分析子系统可以从多个网络设备信息接收关于发现的路径的信息,并且拓扑发现子系统可以被配置为创建与发现的路径相对应的通信流。通信流可以允许在SDN操作模式下在第一主机和第二主机之间的通信。
  • 一种支付数据的预处理方法和装置-201910005288.4
  • 狄潇然;王志恒;张静;田林;张亚泽 - 中国银行股份有限公司
  • 2019-01-03 - 2019-06-07 - G06F16/30
  • 本发明的实施例公开一种支付数据的预处理方法和装置,涉及数据处理领域,能够提高并行工作能力,提高了数据预处理的效率。该方法包括:在数据仓库中读取数据表,数据表中存储有支付数据,其中每条支付数据关联唯一的识别码;根据数据表的元信息将数据表拆分为至少两个数据子表;将至少两个数据子表存入非关系型数据库;启动至少一个读取线程,在非关系型数据库中分别读取数据子表,每个读取线程对应一个数据子表;启动至少一个预处理线程,对数据子表中的每列数据进行预处理,其中每个预处理线程对应处理数据子表中的一列数据。
  • 基于大数据知识库和用户反馈的机器人交互方法和系统-201610228138.6
  • 朱定局 - 华南师范大学
  • 2016-04-12 - 2019-05-31 - G06F16/30
  • 本发明公开了一种机器人交互方法,包括:获取用户的问题与用户类型;从知识库中的所有问题中检索出与第一问题匹配度最大的问题作为第二问题;根据知识库中第二问题的回答对应的第一用户类型的用户反馈满意度,对知识库中第二问题的回答进行选择,得到的回答作为第一问题的回答,即第一回答;将第一回答发送至所述用户。上述机器人交互方法,将机器人与用户交谈时,从离线或在线语料库或聊天数据库中搜索出与用户问题相关的且用户反馈好的回答,充分利用了不同类型用户对以往同样或类似问题的回答的反馈,实现了机器人对用户喜好的预测,具有较好的体验性与适用性。本发明还公开了一种机器人交互系统。
  • 基于地理位置的事件画廊-201580031616.8
  • N.R.艾伦;R.C.墨菲;E.斯皮格尔 - 快照公司
  • 2015-06-12 - 2019-05-21 - G06F16/30
  • 一种计算机实现方法包括接收消息和用于发送消息的设备的地理位置数据。确定该地理位置数据是否对应于与事件相关联的地理位置围栏。当地理位置数据对应于与事件相关联的地理位置围栏时,该消息被张贴到与事件相关联的事件画廊。响应于来自用户的请求而供应事件画廊。
  • 桩号关联方法及系统-201510822846.8
  • 潘玉利;卢杨;李欢;崔会谦 - 中公高科养护科技股份有限公司
  • 2015-11-24 - 2019-04-16 - G06F16/30
  • 一种桩号关联方法,包括:获取路段中指定位置对应的第一实际桩号;根据所述第一实际桩号,在所述路段的桩号对应表中遍历全部实际桩号,获得第二实际桩号和第三实际桩号,所述第一实际桩号位于所述第二实际桩号和所述第三实际桩号之间;根据所述第二实际桩号在所述桩号对应表中获得与所述第二实际桩号对应的第二基准桩号,根据所述第三实际桩号在所述桩号对应表中获得与所述第三实际桩号对应的第三基准桩号;根据所述第二基准桩号、所述第三基准桩号、所述第二实际桩号和所述第三实际桩号,获得与所述第一实际桩号对应的第一基准桩号。本发明还公开一种桩号关联系统。该方法和系统可使基准桩号与实际桩号关联。
  • 聊天群的舆情分析方法及装置-201811395905.8
  • 黄巍峰;范渊 - 杭州安恒信息技术股份有限公司
  • 2018-11-21 - 2019-03-22 - G06F16/30
  • 本发明提供了一种聊天群的舆情分析方法及装置,涉及舆情风险分析的技术领域。所述方法包括基于web服务器调用聊天群的API接口,获得二维码和相对应的数字签名;基于多个客户端识别并授权所述二维码,获得带有标签的数字签名;基于所述带有标签的数字签名和舆情风险关键词,调用聊天群开放的API接口获得聊天群基本信息,并存储于web服务器的数据库中;基于所述聊天群基本信息获得舆情风险的舆情风险指数。本发明借助聊天群的合法API接口获取聊天群的基本信息,且无需进入聊天群,再创新性的对聊天群的基本信息进行舆情风险分析,提高了聊天群的舆情评估的准确度和效率。
  • 基于反识别渲染的文本内容识别率测试方法及装置-201410549089.7
  • 张翔 - 阿里巴巴集团控股有限公司
  • 2014-10-16 - 2019-03-01 - G06F16/30
  • 本发明提供一种基于反识别渲染的文本内容识别率测试方法及装置,所述方法包括:接收关键词和与所述关键词对应的识别率测试样本,所述识别率测试样本为所述关键词和反识别元素的组合;通过文本内容识别算法计算所述识别率测试样本,以获得所述关键词对应的识别率,其中,所述识别率=成功识别数/识别率测试样本的数量,所述成功识别数为通过所述算法将识别率测试样本识别为所述关键词的数量。本发明的基于反识别渲染的文本内容识别率测试方法及装置,可实时地对文本内容识别的有效性算法进行测试评估,以通过该测试结果对文本内容识别算法进行优化,不仅提升了文本内容识别算法优化的及时性,也大大的节约了人力成本。
  • 标签的管控方法、装置、计算机设备和存储介质-201810956674.7
  • 伍可;陈依云 - 中国平安人寿保险股份有限公司
  • 2018-08-21 - 2019-02-19 - G06F16/30
  • 本申请涉及用户画像领域,提供了一种标签的管控方法、装置、计算机设备和存储介质,包括:获取用户新增的标签,所述标签中携带有所述标签的多种属性信息;将所述标签的属性信息添加至预设的标签因子编码表中;其中,所述标签因子编码表包括多个标题栏字段,所述标签的每一种属性信息添加在对应所述标题栏字段的单元格中;根据所述标签因子编码表中记载的属性信息对所述标签进行管控。本申请中提供的标签的管控方法、装置、计算机设备和存储介质,便于对标签进行统一管理。
  • 一种试题难度的调整方法及装置-201810953018.1
  • 聂波;谢兴旺 - 广州飞硕信息科技股份有限公司
  • 2018-08-21 - 2019-02-15 - G06F16/30
  • 本发明公开了一种试题难度的调整方法,包括如下步骤:读取并识别用户输入的用户信息;根据用户信息的识别结果输出试题,并根据用户信息的识别结果设定试题中每一项题目的答题上限时间;对用户的答题时间进行计时,得到答题计时时间;根据答题计时时间和用户的答题情况进行题目跳转和试题提交。本发明公开的试题难度的调整方法能有效解决现有技术试题库的预存信息较大,题目的利用率低,出题的人工成本高的问题。本发明实施例还公开了一种试题难度的调整装置、设备和存储介质。
  • 融合短语信息的非参数并行化层次狄利克雷过程主题模型系统-201811438180.6
  • 林立晖;饶洋辉 - 中山大学
  • 2018-11-27 - 2019-02-12 - G06F16/30
  • 本发明涉及机器学习中的自然语言处理和人工智能的技术领域,更具体地,涉及融合短语信息的非参数并行化层次狄利克雷过程主题模型系统。融合短语信息的非参数并行化层次狄利克雷过程主题模型系统,其中,分为三部分,第一是并行化机制的设计,第二是实时主题调整,第三是通过Copula函数对短语进行隐含关系建模。本发明提出的模型在加速了HDP计算的同时,对文本中的短语的隐含关系也进行了建模。相比于现有技术,我们在保留了HDP非参数化特性的前提下,实现了并行化,并且弥补了传统主题模型的缺点,融合了短语语义,克服了串行HDP算力要求高,主题信息有所缺失的不足之处,优化了模型的定量和定性表现性能。
  • 一种变更信息处理方法及装置-201710882911.5
  • 胡静;程浩;朱迪;柳超 - 北京金堤科技有限公司
  • 2017-09-26 - 2019-02-05 - G06F16/30
  • 本发明提供一种变更信息处理方法及装置,该方法包括:获取变更信息;对变更信息进行断句处理,得到变更信息对应的句组;在句组中标志出已变更的句子。本发明对变更前信息和变更后信息进行了断句处理,通过添加换行符将变更前信息和变更后信息划分为多个句子,以句组形式来显示变更前信息和变更后信息,对大字符串形式的信息进行句子划分,条理清晰,便于阅读。且对变更前信息和变更后信息中发生变更的句子进行突出标志,对变更内容自动区分,为已变更的句子设置颜色或加粗等样式,或者在已变更的句子开始或结尾处添加“已删除”或“新增加”等字样,如此在展示变更前信息和变更后信息时,用户无需对比变更前后的信息就可以快速区分出变更内容。
  • 搜索交互方法、装置、计算机设备和存储介质-201811124585.2
  • 石晓腾 - 中国平安人寿保险股份有限公司
  • 2018-09-26 - 2019-02-01 - G06F16/30
  • 本申请涉及一种基于语音识别的搜索交互方法、装置、计算机设备和存储介质。涉及智能机器人领域。方法包括:监听第一搜索指令;提取搜索指令中携带的搜索关键字;查找与搜索关键字相匹配的数据内容;在交互页面的数据显示区域中显示数据内容;获取用户对显示的数据内容中可激活字段的触发操作,在拓展的数据显示区域内显示可激活字段链接的跳转页面,其中数据显示区域在交互页面范围内拓展;当监听到第二搜索指令时,调整拓展的数据显示区域,在显示界面中显示出交互页面中的搜索交互区域。采用本方法能够无需跳转出搜索交互页面即可便捷地无限制地查看任意多搜索内容。
  • 一种论文编辑搜索方法-201811197495.6
  • 辛琳琳 - 临沂大学
  • 2018-10-15 - 2019-02-01 - G06F16/30
  • 本发明公开了一种论文编辑搜索方法,包括建立搜索编辑系统及使用搜索编辑系统进行搜索编辑论文,所述搜索编辑系统包括论文集中处理模块、历史论文采集模块、论文内容提取模块、存储模块、数据分享模块,所述论文集中处理模块,用于集中处理论文数据,并将其根据内容、文字、领域进行分类;所述历史论文采集模块,通过互联网下载,或通过手动录入的方式编辑成文档;所述论文内容提取模块,用于将同类型的内容进行提取。本发明通过建立了搜索编辑系统,将其安装于计算机中,专设进行存储论文,并将论文进行分类处理,然后进行数据共享,大大提高了论文的搜索效率,值得推广。
  • 专业性外文书写辅助系统-201811130151.3
  • 吴雅琴;王亮;王凯;张翔;娄振;王闯;李雷 - 中国矿业大学(北京)
  • 2018-09-27 - 2019-01-29 - G06F16/30
  • 本发明提供了一种专业性外文书写辅助系统,其特征在于包括客户端模块、检索模块、专业性语料库、语料库更新模块。针对目前翻译软件存在的问题,本发明重点说明了专业性语料库的建立方法以及客户端界面的设置内容,从源头上保证系统检索到的结果的科学性与专业性以及系统的易用性,为外文基础不是很高的人员书写专业性外文时提供了很好的辅助系统。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top