|
钻瓜专利网为您找到相关结果 336795个,建议您 升级VIP下载更多相关专利
- [发明专利]基于事件的中文指代语料库构建方法-CN201710020573.4有效
-
张亚军;刘宗田;李强;周文;刘炜
-
上海大学
-
2017-01-12
-
2021-02-23
-
G06F16/36
- 本发明涉及一种基于事件的中文指代语料库构建方法。本方法主要包括以下几个步骤:(1)选择CEC2.0语料库作为构建基础,(2)确定指代标注的目标以及标注方式,(3)根据具体的指代目标制定相应的标注规范,(4)CEC2.0语料文本预处理,(5)自动标注事件要素以及事件指代,(6)通过人工标注进一步优化标注结果,(7)设定一致性检验步骤,确保语料标注的质量。本发明克服了现有的指代消解语料库的缺陷。该方法不但可以覆盖语料库中的所有事件,而且是建立在中文句法分析和语义分析基础之上的,符合中文的特点,该方法还能够对标注后的语料进行一致性检查,以保证语料标注质量。
- 基于事件中文指代语料库构建方法
- [发明专利]一种农业语料库的构建方法及装置-CN202110463202.X有效
-
姜京池;王玲;王勃然;刘劼;黄鹤翔;宋锦文
-
哈尔滨工业大学
-
2021-04-23
-
2023-03-28
-
G06F16/33
- 本发明提供了一种农业语料库的构建方法及装置,该方法包括:基于农业语料库的标注体系确定标注工具;基于随机选择的农业样本数据进行第一标注培训,得到机器学习模型;基于主动学习选择的农业样本数据进行第二标注培训,得到训练更新的机器学习模型,并得到更新的标注工具;基于主动学习选择的农业样本数据进行正式标注,得到标注数据;基于农业样本数据及其标注数据构建农业语料库。本发明通过主动学习和标注一致性分析,提升了数据标注的成效,并获得大量规范有效的农业标注数据,解决了当前农业语料库数据混乱的问题。同时,以较少的样本集使机器学习模型训练达到较佳效果,减少了数据标注的消耗,并提升了农业语料库构建的成效。
- 一种农业语料库构建方法装置
|