[发明专利]一种含格式的html富文本数据的跨标签处理方法及系统有效

申请号：	201310545888.2	申请日：	2013-11-06
公开（公告）号：	CN103530430A	公开（公告）日：	2014-01-22
发明（设计）人：	邢世康	申请（专利权）人：	焦点科技股份有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	南京知识律师事务所 32207	代理人：	张苏沛
地址：	210061 江苏省南***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种含格式的html富文本数据的跨标签处理方法及系统，根据接收的含格式的html富文本数据，把它转换成不含格式的纯文本，然后通过业务处理，消除文本中的攻击代码、不规范的书写、以及敏感词等不合法、违禁的不安全因素，然后把处理后的纯文本按照相似度匹配最佳效果的方式重新恢复到原有的格式，转换成正确并安全的含格式的html富文本数据，在网站上展示，提高了网站的安全性和内容的质量。
搜索关键词：	一种格式 html 文本数据标签处理方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种含格式的html富文本数据的跨标签处理方法，其特征在于包括以下步骤：步骤一、采用parse机制，将html富文本数据作为parse分析器的输入，转换为类似DOM的树结构对象，html富文本数据中的纯文本数据将填写到树结构对象节点中，形成了多个节点纯字符串片段；步骤二、在树结构对象中，根据各个节点中包含的纯字符串片段，按顺序拼接这些文本数据，与parse分析器的输入（即html富文本）对应，形成不包含格式标签的纯文本字符串数据。步骤三、对该纯文本字符串数据进行校验、具体业务处理，生成修正后的纯文本字符串数据；步骤四、将修正后的纯文本字符串数据与树结构对象中各个节点的纯字符串片段进行相似度匹配计算，逐个计算出纯文本字符串数据中单词与节点中纯字符片段内容之间的距离；步骤五、将所有的节点纯字符串片段与修正后的字符串数据匹配完成后，形成了新的树结构对象，再对新的树结构对象进行转换处理，通过parse逆向形成完整的html富文本数据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司，未经焦点科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310545888.2/，转载请声明来源钻瓜专利网。

上一篇：一种新型双串并联双三效吸收式热泵
下一篇：基于对象关联映射的Android终端访问远程数据库代码生成系统和方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种含格式的html富文本数据的跨标签处理方法及系统有效

专利文献下载