[发明专利]一种机构名称识别方法、装置、设备以及存储介质在审
申请号: | 201910947346.5 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110688841A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 冯彩彩;成国华;李国文;蔡志;冯景峰 | 申请(专利权)人: | 广州准星信息科技有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/295 |
代理公司: | 44202 广州三环专利商标代理有限公司 | 代理人: | 郭浩辉;麦小婵 |
地址: | 510000 广东省广州市海珠区怡乐路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种机构名称识别方法,所述方法包括:将原始文档转换为标准化文档;按照第一预设窗口值对所述标准化文档进行切分,获取搜索空间;对所述搜索空间进行语句分析,去除不符合预设过滤规则的若干个搜索空间;对过滤之后的所述搜索空间进行正则匹配,若匹配成功,则所述搜索空间为机构名称。本发明还公开了一种机构名称识别装置,采用本发明,可以快速且准确的识别文档中的机构名称。 | ||
搜索关键词: | 搜索空间 文档 名称识别 预设 标准化 过滤规则 匹配成功 语句分析 原始文档 去除 匹配 过滤 转换 | ||
【主权项】:
1.一种机构名称识别方法,其特征在于,包括:/n将原始文档转换为标准化文档;/n按照第一预设窗口值对所述标准化文档进行切分,获取搜索空间;/n对所述搜索空间进行语句分析,去除不符合预设过滤规则的若干个搜索空间;/n对过滤之后的所述搜索空间进行正则匹配,若匹配成功,则所述搜索空间为机构名称。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州准星信息科技有限公司,未经广州准星信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910947346.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种文本转换方法及装置
- 下一篇:一种文档标题层级的分析方法、装置及服务器
- 同类专利
- 语料识别方法、装置、设备及计算机可读存储介质-201910999338.5
- 方文其;徐为恺;杨杨;江旻 - 深圳前海微众银行股份有限公司
- 2019-10-18 - 2020-02-04 - G06F40/253
- 本发明公开了一种语料识别方法、装置、设备及计算机可读存储介质,涉及金融科技领域,该方法包括步骤:当获取到待识别语料后,检测所述待识别语料中是否存在预设情感文本库中的文本;若检测到所述待识别语料中未存在所述情感文本库中的文本,则对所述待识别语料进行预处理,得到所述待识别语料的语料分词;对所述语料分词进行向量化,得到所述语料分词对应的待识别特征向量;将所述待识别特征向量输入至预存的语料分类模型中,得到所述待识别语料的识别结果。本发明提高了观点句识别的准确率和识别效率。
- 一种英文网页的中文机器注释方法-201911020239.4
- 不公告发明人 - 吕海港
- 2019-10-25 - 2020-01-31 - G06F40/253
- 为了使读者能够快速准确阅读英文网页,本发明提供一种英文网页的中文机器注释方法,它把中文句子按照语法分割为5‑15个单词的语义块,机器翻译各个语义块,并把译文用<ruby>标签分散放在各个英语单词上方,生成双语对照的英文网页。这种网页可以帮助中国读者流畅地阅读英文网页,更准确地理解英文意思。
- 一种基于试卷的英语作文自动评阅的方法-201910591423.8
- 邱英秋;刘航;陈家海;叶家鸣;吴波 - 安徽七天教育科技有限公司
- 2019-07-02 - 2020-01-14 - G06F40/253
- 本发明公开了一种基于试卷的英语作文自动评阅的方法,是人工智能AI相关技术在教育领域,尤其是教学考试和学生个性化学习的研究和应用。通过利用stanfordcorenlp和nltk解析英语作文,然后采用机器学习算法XGBoost逐句进行特征提取和分类,最后检测出语法错误点和一些推荐表达。其优势在于帮助发掘学生的英语作文的存在的一些语法错误,以及学生们在英语表达方面的不足,以便于促进提升学生的写作水平。英语作文的自动评阅过程主要包括以下几步:作文输入、作文自动评阅、生成批阅报告。本发明方法设计合理、使用方便、效果良好。
- 一种机构名称识别方法、装置、设备以及存储介质-201910947346.5
- 冯彩彩;成国华;李国文;蔡志;冯景峰 - 广州准星信息科技有限公司
- 2019-09-30 - 2020-01-14 - G06F40/253
- 本发明公开了一种机构名称识别方法,所述方法包括:将原始文档转换为标准化文档;按照第一预设窗口值对所述标准化文档进行切分,获取搜索空间;对所述搜索空间进行语句分析,去除不符合预设过滤规则的若干个搜索空间;对过滤之后的所述搜索空间进行正则匹配,若匹配成功,则所述搜索空间为机构名称。本发明还公开了一种机构名称识别装置,采用本发明,可以快速且准确的识别文档中的机构名称。
- 专利分类