“信息正文”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果1992174个，建议您升级VIP下载更多相关专利

[发明专利]一种临床试验方案的信息提取方法和装置-CN202111500948.X在审
发明人：赵洪杰 -专利权人：上海妙一生物科技有限公司
申请日： 2021-12-09 - 公布日： 2022-03-11 - 主分类号： G06V30/148 文献下载
摘要：本发明涉及一种临床试验方案的信息提取方法和装置，其中，该方法包括：对临床试验方案文档进行版面分析，识别出页眉、页脚、正文、表格以及图片的位置信息；根据所述位置信息将页眉和页脚部分进行舍弃、对表格部分进行框架主体结构的识别、并对正文部分以及表格部分的文字内容进行OCR识别；将OCR识别后得到的信息与所述图片进行信息整合；对整合后的信息进行信息提取，并将得到的关键信息进行输出。
一种临床试验方案信息提取方法装置

[发明专利]一种知识图谱构建方法、装置和存储介质-CN202110548067.9在审
发明人：吕笑笑;郭宇晨;蒋忠强;张国宏 -专利权人：中移(苏州)软件技术有限公司;中国移动通信集团有限公司
申请日： 2021-05-19 - 公布日： 2022-11-22 - 主分类号： G06F16/28 文献下载
摘要：本申请实施例提供了一种知识图谱构建方法、装置和存储介质，该方法包括：获取待处理制度数据；利用预设识别模型对所述待处理制度数据进行分析，确定制度正文数据和/或制度发文数据；对所述制度正文数据和/或制度发文数据进行知识抽取，确定目标构建信息；对所述目标构建信息进行图谱构建处理，得到目标知识图谱。这样，在制度领域中，通过对待处理制度数据进行分析和知识提取，能够获取目标构建信息(如制度关系信息、制度实体信息和制度属性信息等)，进而利用这些目标构建信息来构建知识图谱，不仅可以提高构建知识图谱的速度和准确性，而且通过知识图谱还能够精准且全面地展示制度信息。
一种知识图谱构建方法装置存储介质

[发明专利]论坛信息的发布和获取系统以及发布和获取方法-CN200910092541.0有效
发明人：黄勇;王军;王冀莲;丁博晋;李兰;李沛;于沧 -专利权人：中国长城工业总公司;北京神舟航天软件技术有限公司
申请日： 2009-09-17 - 公布日： 2011-04-20 - 主分类号： G06F17/30 文献下载
摘要：本发明提供了一种论坛信息的发布和获取系统，包括用户信息存储解析单元、内容读写单元、邮件封装和解封装单元。还提供了一种论坛信息的发布方法，包括步骤：将接收的邮件解封装为邮件正文内容和邮件地址；确定所述邮件中包含的论坛和主题；将解封装后的邮件的正文内容作为帖子内容发布到所述论坛的所述主题下。还提供了论坛信息的获取方法，包括预先确定用户邮件地址和作为信息源的论坛；从所述论坛中读取所要获取的论坛信息；确定出所要发送的邮件地址；将读取的论坛信息和确定出的邮件地址封装为邮件发送出去。使用本发明可以实现用户通过邮件方便快捷的发布和获取论坛信息。
论坛信息发布获取系统以及方法

[发明专利]一种HTTP协议还原中两个会话数据合并的方法-CN201210026647.2有效
发明人：魏伟光 -专利权人：北京锐安科技有限公司
申请日： 2012-02-07 - 公布日： 2012-07-18 - 主分类号： H04L29/08 文献下载
摘要：本方法为：1)协议还原设备从登录数据包中截获用户登陆信息；2)将用户登录信息加入到一登录信息表中；所述登录信息表中每一项包含一个预先设置的指针，用于存储该用户的附件信息；3)收到该用户的正文数据包时，根据该用户登录信息查询所述登录信息表对应指针，若该用户的用于存储附件信息的指针不为空，则将此正文数据与指针指向的附件数据合并起来。
一种 http 协议还原两个会话数据合并方法

[发明专利]用于生成结构化信息的方法和装置-CN201710602034.1有效
发明人：钟辉强;尹存祥;沈剑平;徐国强 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2017-07-21 - 公布日： 2021-03-09 - 主分类号： G06F16/951 文献下载
摘要：本申请实施例公开了用于生成结构化信息的方法和装置。方法的一具体实施方式包括：抓取预定领域的企业网站的所有页面内容；根据页面内容的特征，将页面内容分类至预先构建的企业信息的类别以及其它类别，得到分类页面；将分类页面分为内容页面和表单页面，并将内容页面和表单页面作为标签，标记分类页面；对标记后的分类页面进行以下至少一项抽取，得到抽取的信息：正文块抽取、正文内容结构化抽取、图文块抽取、列表块抽取和预定位置内容结构化；根据抽取的信息，构建结构化信息。该实施方式保证了信息来源的多样性，使得生成的结构化信息所呈现的内容特征丰富且减少了冗余信息。
用于生成结构信息方法装置

[发明专利]利用综合语义语境的信息处理-CN200980133722.1无效
发明人：斯蒂芬·巴克索;尼克·福西;布鲁斯·斯坎兰;哈施·汉德尔瓦尔 -专利权人：多斯维公司
申请日： 2009-06-30 - 公布日： 2011-07-27 - 主分类号： G06F17/27 文献下载
摘要：用于生成用于多个信息的参照系的系统和方法，多个信息含有由用户通过与一个或者多个信息源交互所获得的文本数据，包括接收所选择的用于分析的信息，该信息包括文本数据并且识别文本数据的多个逻辑单元。识别在逻辑单元的每个中的多个独立正文部，并且计算与每个独立正文部关联的逻辑单元的数量以便在识别模式中使用。基于模式，计算重要性测度并且基于满足预先定义的重要性阈值的重要性测度选择模式。基于选择的模式生成多个信息语境定义并且分配所生成的信息语境定义作为与参照系关联的语义语境的语境界定。多个信息彼此相关并且通过语义语境的生成的语境定义来表示这种关系。
利用综合语义语境信息处理

[发明专利]网页正文内容获取方法、装置、计算机设备及存储介质-CN201910568687.1在审
发明人：王涛;朱葛 -专利权人：平安科技(深圳)有限公司
申请日： 2019-06-27 - 公布日： 2020-01-14 - 主分类号： G06F16/951 文献下载
摘要：本申请涉及数据采集领域，具体使用了数据爬取技术，采用网络爬虫的方式进行爬取，并公开了一种网页正文内容获取方法、装置、计算机设备及存储介质，对爬取的待处理网页进行空白部分和文字部分的保留处理以得到预留contentBlock块，对所述第一Block块进行空白、转义字符的去除处理以得到多个第二Block块，从所述多个第二Block块中爬取网页标题，并提取位于所述网页标题预设范围内的周围文本，根据预设规则提取目标的正文内容本申请利用网页标题及相关内容的特点，能够实现快速定位正文内容并进行爬取，避免遗漏正文重点信息，提高了爬取的精确度，还减少人工参与的工作量。
网页标题正文内容预留数据采集领域网页正文内容计算机设备存储介质合并处理快速定位人工参与网络爬虫预设规则重点信息转义字符预设去除申请遗漏工作量网页文本保留

[发明专利]一种网页文章标题和正文的自动识别方法及装置-CN202310211865.1在审
发明人：张凯 -专利权人：北京粉笔蓝天科技有限公司
申请日： 2023-03-07 - 公布日： 2023-06-30 - 主分类号： G06F40/205 文献下载
摘要：本发明提出一种网页文章标题和正文的自动识别方法及装置，属于特征识别与数据处理技术领域。方法包括将网页中的所有元素解析成DOM树、逐个对DOM树中的所有元素进行广度优先遍历、将查找到的父元素添加到哈希记录表中，并将其对应的网页文章正文根元素的权重值加1、对网页内容进行反向广度优先遍历，查找文章的当前标题元素、结合网页文章正文根元素与文章标题元素，获得当前网页的完整文章内容等步骤。本发明提出了一种在不对网页内容进行预处理的情况下，可以方便提取网页文章信息的技术方案，可以精确获取到文章的标题和正文，对下一步的数据分析和训练提供了良好的半结构化数据。
一种网页文章标题正文自动识别方法装置

[发明专利]基于静态资源分离的文章详情页加载方法及其相关设备-CN202211568714.3在审
发明人：张龙 -专利权人：中国平安财产保险股份有限公司
申请日： 2022-12-08 - 公布日： 2023-05-05 - 主分类号： G06F9/445 文献下载
摘要：本申请实施例属于金融科技技术领域，应用于金融APP中信息资讯发布领域中，涉及一种基于静态资源分离的文章详情页加载方法及其相关设备，包括获取文章文本内容；识别文本内容中的头部部分、正文部分和尾部部分；采用预设的原生加载方式将所述头部部分和尾部部分加载至目标页面，完成所述头部部分和尾部部分的页面渲染；根据预设判断条件选择预设的加载方式将所述正文部分加载至目标页面，完成整个文章详情页加载。本申请通过在初始化时对正文内需进行用户交互的部分、头部和尾部部分采用原生加载的方式，对正文内无需进行用户交互的部分采用H5加载的方式，进行不同类型加载，在一定程度上提升文章详情页的加载速度，保证用户体验
基于静态资源分离文章详情加载方法及其相关设备

[发明专利]一种提取网页正文的方法-CN201510047773.X有效
发明人：赵亮 -专利权人：湖南蚁坊软件有限公司
申请日： 2015-01-30 - 公布日： 2018-07-24 - 主分类号： G06F17/30 文献下载
摘要：本发明涉及网页文字信息处理领域，特别是一种提取网页正文的方法，包括以下步骤：步骤S101：网页源代码获取，获取html的页面源代码；步骤S102：解析并遍历标签，通过html解析器解析页面源代码获得标签并遍历每个标签；步骤S103：标签内容长度判断，对每个标签的内容长度进行判断，遍历标签内容长度后，确定标签内容长度最长的标签；步骤S104：提取标签内容，取出标签最长的标签内容，取出的内容就是需要提取的正文内容。采用上述方法后，由于网页的正文是由多个标签包含的，通过遍历每个标签，将相同标签的内容长度相加，再跟其他单个标签的长度相比较，最长的标签便是需要提取的正文内容，本发明既能保证处理速度，提取的准确率也高。
一种提取网页正文方法

[发明专利]一种图书自动排版方法及系统-CN201110084529.2有效
发明人：王续文;胡建武;任朔 -专利权人：数字时代出版设计有限公司
申请日： 2011-04-02 - 公布日： 2011-08-10 - 主分类号： G06F17/25 文献下载
摘要：包括预先创建一个Word文档作为排版模版；定义所述模版中的样式与书稿内容样式映射表；创建一个空白Word文档，同时打开所述排版模版，将所述排版模版中的所有样式复制到所述空白Word文档中；以段落为单位，按顺序将书稿正文复制至所述空白Word文档的正文中，直至所有正文文档内容被复制到所述空白Word文档的正文中；查找封面、扉页和版权页处的内容控制组件，并将当前书稿的真实信息设置给封面、扉页和版权页处的内容控制组件，得到排版结果文档；
一种图书自动排版方法系统

[发明专利]网页内容的处理方法和装置-CN201610807127.3有效
发明人：邵睿;徐国强;尹存祥;骆彬;钟辉强;沈剑平 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2016-09-07 - 公布日： 2019-10-18 - 主分类号： G06F16/957 文献下载
摘要：所述方法包括：读取与待处理网页对应的HTML结构正文数据；以段落为单位，对所述HTML结构正文数据进行结构划分，生成段落列表；根据所述段落列表中各段落中具有标题属性的内容，将所述段落列表中的各段落转化为标题文本对本发明实施例的技术方案在识别出网页正文各段落中包括的标题以及段落正文，并将其整理归纳到一起生成标题文本对后，可以实现使用识别出的标题文本对中的标题来进一步描述网页内容，扩充网页内容的描述信息的技术效果，
网页内容处理方法装置

[发明专利]一种基于结算模型的售电合同生成方法及系统-CN201911227869.9有效
发明人：帅小冲;刘敏 -专利权人：远光软件股份有限公司;远光能源互联网产业发展（横琴）有限公司
申请日： 2019-12-04 - 公布日： 2023-08-15 - 主分类号： G06F40/186 文献下载
摘要：获取合同正文信息，在合同正文中的合同元数据位置处添加对应合同元数据占位符的标识，得到售电合同模板；根据售电合同模板中的合同元数据动态生成输入表单和结算录入模块；通过输入表单获取用户输入的合同数据；通过结算录入模块获得对应的结算模型；基于对应的结算模型生成结算数据输入框，获取用户输入的结算数据；以所述合同数据替换合同模板正文中对应的元数据占位符；解析所述结算数据和录入所述合同数据的售电合同模板，获得售电合同正文。
一种基于结算模型合同生成方法系统

[发明专利]一种文档处理方法、装置、计算机设备及可读存储介质-CN201911311963.2在审
发明人：李喆;李丹 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-12-18 - 公布日： 2020-04-24 - 主分类号： G06F40/169 文献下载
摘要：本申请实施例公开了一种文档处理方法，包括：在文档的正文区域中显示正文内容；响应针对正文内容中目标字符的备注操作，创建目标字符关联的备注框；根据所述目标字符在所述文档中的排版位置，在所述正文区域内显示所述备注框，根据所述备注框对所述正文区域内所显示的所述正文内容进行排版调整。采用本申请，实现了在文档的正文区域内显示备注框，使得备注内容与被备注的对象的关联关系更为直观，提高文档备注的可阅读性，并提高正文内容与备注内容间的关联性。
一种文档处理方法装置计算机设备可读存储介质

[发明专利]网页正文获取方法、装置、存储介质及电子设备-CN202111509751.2在审
发明人：薛秋雨;陈祖德;潘仕江;李天与;柳超 -专利权人：北京金堤科技有限公司
申请日： 2021-12-10 - 公布日： 2022-03-18 - 主分类号： G06F16/955 文献下载
摘要：本公开提供了一种网页正文获取方法、装置、存储介质及电子设备，涉及互联网技术领域。该方法包括：获取目标网页的网页源码；根据网页源码构建对应的DOM树；根据DOM树中各个子节点的文本密度，生成对应的节点列表；针对目标网页中包含的至少一个标题中的每个标题，在节点列表中存在与当前标题匹配的正文节点的情况下，至少根据正文节点对应的正文内容与正文节点对应的正文标题在目标网页中的位置关系，定位正文内容在目标网页中的位置并获取正文内容。
网页正文获取方法装置存储介质电子设备