[发明专利]一种基于词嵌入的书面语篇多层次差异分析方法在审
申请号: | 201910236193.3 | 申请日: | 2019-03-27 |
公开(公告)号: | CN109977407A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 吕学强;周强;游新冬;董志安;张学敬 | 申请(专利权)人: | 北京信息科技大学;清华大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于词嵌入的书面语篇多层次差异分析方法,包括:步骤1)对独白语篇与对话语篇进行差异分析;步骤2)分析不同字/词嵌入与语篇用词之间的关联性。所述步骤1)包括:结构差异分析、关系差异分析、用语差异分析。所述步骤2)包括:对比独白语篇和对话语篇中出现的字/词与各个数据集字/词嵌入的重合情况;使用字/词嵌入的目的是对字词用特定维度的向量进行表示,进行模型的训练。本发明通过统计分析方法对独白语篇和对话语篇进行多层次、多角度的差异分析,找出了在独白语篇和对话语篇中存在从结构到具体功能分布之间的差异,从篇章结构以及句长、词汇用法等层面对这些差异加以表现,可以很好地满足实际应用的需要。 | ||
搜索关键词: | 差异分析 嵌入的 话语 结构差异 篇章结构 统计分析 关联性 数据集 重合 维度 向量 嵌入 词汇 分析 应用 表现 | ||
【主权项】:
1.一种基于词嵌入的书面语篇多层次差异分析方法,其特征在于,包括:对独白语篇与对话语篇进行差异分析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学;清华大学,未经北京信息科技大学;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910236193.3/,转载请声明来源钻瓜专利网。