[发明专利]针对文本数据的基于语义理解的规范短语识别方法与系统在审
申请号: | 202310451086.9 | 申请日: | 2023-04-25 |
公开(公告)号: | CN116894437A | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 陈锋情;胡日葵;杨忠燎;商圣芳;潘海鑫;李振兴;游花香 | 申请(专利权)人: | 福州市联创智云信息科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/951;G06F40/216;G06F16/955;G06F40/166;G06F40/242;G06F18/22;G06F16/9535;G06F16/9538 |
代理公司: | 福州旭辰知识产权代理事务所(普通合伙) 35233 | 代理人: | 程勇 |
地址: | 350000 福建省福州市鼓楼区工*** | 国省代码: | 福建;35 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明涉及针对文本数据的基于语义理解的规范短语识别方法与系统,模型首先,将发明所涉及文本类型的官方网站地址列表U,通过爬虫进行获取文本数据,并通过分词统计高频短语,得到标准规范短语数据集P;然后,将规范短语数据集P按规则加工生成正则表达式,得到能够进行匹配的正则表达式词集合R;进一步地,将需要进行规范词识别的文本T,按段落A句子S分别读取,得到待识别句子S;最后,将待识别句子S与正则式词集合R进行匹配,当发现与规范词短语不相符时,给出不规范语句的位置与规范语建议,能针对文本信息进行规范短语识别。 | ||
搜索关键词: | 针对 文本 数据 基于 语义 理解 规范 短语 识别 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州市联创智云信息科技有限公司,未经福州市联创智云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310451086.9/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置