[发明专利]文本的处理方法、装置和计算机可读存储介质在审
申请号: | 202211481636.3 | 申请日: | 2022-11-24 |
公开(公告)号: | CN115859981A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 董智明;陈雨;靖冠军;郑然;李明达 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 李昊 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本的处理方法、装置和计算机可读存储介质,涉及自然语言处理领域。文本的处理方法包括:从文本数据集中提取包括职务或职务变更词中的至少一种的文本,作为增强的文本数据集;将来自增强的文本数据集的、分词后的待测的文本输入到特征提取模型中,获得文本特征向量;对文本特征向量进行解码,获得对待测的文本的初步标注结果,其中,初步标注结果包括对待测的文本中的人名和人称代词的标注;将初步标注结果输入到指代消解模型中,以确定人称代词所对应的人名;根据指代消解模型的输出,确定更新的文本及其标注结果,其中,在更新的文本中,人称代词被替换为对应的人名。本发明的实施例能够解决人称代词指代不明、有效数据占比低等问题,提高了人名提取的准确率。 | ||
搜索关键词: | 文本 处理 方法 装置 计算机 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211481636.3/,转载请声明来源钻瓜专利网。
- 上一篇:星地协同引导的星簇成像方法和系统
- 下一篇:一种低GI功能面包及其制备方法