[发明专利]基于实体识别技术的中医药语句分词方法在审
申请号: | 201910967537.8 | 申请日: | 2019-10-12 |
公开(公告)号: | CN110879831A | 公开(公告)日: | 2020-03-13 |
发明(设计)人: | 崔智颖;佘莉;黄剑平 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/205;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 311121 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于实体识别技术的中医药语句分词方法,包括步骤:采集中医药语句作为语料库;从语料库内提取出常用词组组成词库W;对词库W进行分类,根据分类结果对语料库每个序列的每个元素进行序列标注;采用Bert语言模型对语料库进行预训练并获得词向量;构建具有条件随机场的时间循环神经网络模型,基于标注数据集进行模型训练;向训练好的时间循环神经网络模型输入测试语句,得到实体列表;根据实体列表,对输入语句进行第一次切分,切分出实体列表中所含元素;基于前缀词典扫描剩余待切分句子,生成句子中汉字所有可能成词情况,构成有向无环图;对有向无环图进行动态规划查找最大概率路径,找出基于词频的最大切分组合。 | ||
搜索关键词: | 基于 实体 识别 技术 中医药 语句 分词 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910967537.8/,转载请声明来源钻瓜专利网。