[发明专利]融合规则和统计特征的中文专业术语抽取方法和系统在审
申请号: | 202310973797.2 | 申请日: | 2023-08-04 |
公开(公告)号: | CN116702786A | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 孙宇清;李成;龚斌 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/216;G06F40/242;G06F40/253;G06F40/268;G06F40/30;G06F16/35;G06F16/36 |
代理公司: | 山东竹森智壤知识产权代理有限公司 37382 | 代理人: | 吕利敏 |
地址: | 250100 山*** | 国省代码: | 山东;37 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 一种融合规则和统计特征的中文专业术语抽取方法和系统,属于自然语言处理的技术领域,包括:在专业术语发现部分,采用自然语言处理领域通用的包含词频统计词典和概率算法的分词工具。在专业术语筛选阶段,提出了基于统计的词频、词条数、点互信息、词汇自由度、信息量差异比等专业术语抽取指标和抽取技术,将分词结果中的专业术语从通用词汇或概念中提取出来。在评估优化阶段,提出基于专业术语在专业文本和通用文本中的信息量差异的评价指标和优化技术,从语用规律和上下文两个角度对候选结果进行评价和优化提取。 | ||
搜索关键词: | 融合 规则 统计 特征 中文 专业术语 抽取 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310973797.2/,转载请声明来源钻瓜专利网。
- 上一篇:事件驱动的时钟生成方法及装置、芯片及电子设备
- 下一篇:行星排的组装工艺