[发明专利]一种基于种子句子的句子模板召回的方法和设备有效
申请号: | 201610950727.5 | 申请日: | 2016-11-02 |
公开(公告)号: | CN106502987B | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 姚佳 | 申请(专利权)人: | 广东惠禾科技发展有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 张海洋 |
地址: | 518054 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于种子句子的句子模板召回的方法和设备,具体的,该方法包括:获取数量超过一定数值的与种子句子相关的语料,并确定语料中每个句子的依存句法树;根据依存句法树的结构相似度,基于种子句子的依存句法树的树形结构对语料中每个句子进行召回,确定召回后的句子;对召回后的句子与种子句子进行相关度计算,确定各召回后的句子与种子句子的相关度;基于相关度选取召回的句子作为句子模板。以此使得本发明至少具有以下一个特点:召回句子类型的高丰富度;召回句子基本不存在语法错误;召回句子的组成成分的高丰富度;召回句子的语义偏差很小;召回句子的自带模板化,不需要人工模板化。 | ||
搜索关键词: | 一种 基于 种子 句子 模板 召回 方法 设备 | ||
【主权项】:
1.一种基于种子句子的句子模板召回的方法,其特征在于,包括:获取数量超过一定数值的与种子句子相关的语料,并确定所述语料中每个句子的依存句法树;根据依存句法树的结构相似度,基于所述种子句子的依存句法树的树形结构对所述语料中每个句子进行召回,将召回的句子设置为初始句子模板;对各所述初始句子模板进行与所述种子句子的相关度计算,确定各所述初始句子模板与所述种子句子的相关度,所述相关度包括:结构相关度、语义相关度、词性相关度;基于所述相关度选取初始句子模板作为句子模板;所述对各所述初始句子模板进行与所述种子句子的相关度计算,确定各所述初始句子模板与所述种子句子的相关度,包括:对各所述初始句子模板进行与所述种子句子的结构相关度计算,确定各所述初始句子模板与所述种子句子的结构相关度;对所述初始句子模板进行与所述种子句子的语义相关度计算,确定各所述初始句子模板与所述种子句子的语义相关度;对所述初始句子模板进行与所述种子句子的词性相关度计算,确定各所述初始句子模板与所述种子句子的词性相关度;所述基于所述相关度选取初始句子模板作为句子模板,包括:针对各初始句子模板,判断与所述种子句子的结构相关度、语义相关度、词性相关度的数值总和是否大于设置的阈值;若判断结果为是,选取所述召回的初始句子模板作为句子模板;若判断结果为否,则直接丢弃。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东惠禾科技发展有限公司,未经广东惠禾科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610950727.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种大麦花药分化培养基配方
- 下一篇:一种细菌性基腐病抗性粳稻育种方法