[发明专利]基于计算机可识别自然语言描述的语义匹配方法及系统有效
申请号: | 201711460123.3 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108170679B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 杨学红 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/247 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;罗瑞芝 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 计算机 识别 自然语言 描述 语义 匹配 方法 系统 | ||
本发明属于编程技术领域,具体涉及基于计算机可识别自然语言描述的语义匹配方法及其相应的语义匹配系统。该基于计算机可识别自然语言描述的语义匹配方法包括步骤:步骤S1):以目标语言的语法规则限定的逻辑和步骤作为参考,将自然语言需求描述约束为具备逻辑的步骤的结构;步骤S2):对约束后的自然语言需求描述中固定的句式,获得包括自然语言需求描述中的词根的候选词语集合;步骤S3):对目标语言中的消息名/操作名进行分词,获得包括消息名/操作名中的词根的备用词语集合;步骤S4):计算候选词语集合和备用词语集合的匹配度。该语义匹配方法及语义匹配系统,能协调用户和开发人员对于自然语言应用上的分歧,实现机器语言的自动编程。
技术领域
本发明属于编程技术领域,具体涉及一种基于计算机可识别自然语言描述的语义匹配方法及其相应的基于计算机可识别自然语言描述的语义匹配系统。
背景技术
自然语言仍然是目前软件需求文档的描述语言。从自然语言描述的功能需求到流程的自动生成不仅能帮助用户和开发人员能够快速地在需求上达成共识,还能加快流程的开发。
但是,由于用户和开发人员的关注点不同,他们对需求的描述也往往不一样。用户和开发人员在用自然语言描述功能需求的过程中,用户关心的是软件所能提供的功能以及所能达到的性能水平等,开发人员则可能从技术的角度去刻画软件的需求;而且,他们并不知道开发语言所使用的具体的消息和操作的命名规则,他们对需求的描述所用到的实词并不一定和开发语言中的消息名和操作名中使用的词语完全一样。另外,在大多数情况下,用户并不熟悉那些专业的术语和技术问题。
但目前的软件需求文档大部分还是用自然语言撰写,这其中有两方面原因:一是因为用户和开发人员大多没有形式化描述需求的能力;二是因为自然语言词汇丰富,表达能力强大。但是,自然语言也不可避免的存在缺点,包括模糊性、二义性和不一致性。
为了弥补自然语言的不足,需要一种能将自然语言表达的流程需求描述进行约束和形式化的方法,使得计算机能够理解需求。如何协调用户和开发人员对于自然语言应用上的分歧,成为目前亟待解决的技术问题。
发明内容
本发明所要解决的技术问题是针对现有技术中上述不足,提供一种基于计算机可识别自然语言描述的语义匹配方法及其相应的基于计算机可识别自然语言描述的语义匹配系统,能有效消除用户和开发人员对于自然语言应用上的分歧,实现机器语言的自动编程。
解决本发明技术问题所采用的技术方案是该基于计算机可识别自然语言描述的语义匹配方法,包括步骤:
步骤S1):以目标语言的语法规则限定的逻辑和步骤作为参考,将自然语言需求描述约束为具备逻辑的步骤的结构;
步骤S2):对约束后的自然语言需求描述中固定的句式,获得包括自然语言需求描述中的词根的候选词语集合;
步骤S3):对目标语言中的消息名/操作名进行分词,获得包括消息名/操作名中的词根的备用词语集合;
步骤S4):计算候选词语集合和备用词语集合的匹配度。
优选的是,步骤S2)包括:
步骤S21):根据设定的限定词,获取自然语言描述的需求语句,将需求语句分词后形成初级词语集合;
步骤S22):移除初级词语集合中的停用词,形成适用词语集合;
步骤S23):对适用词语集合中的各词语进行同义词扩展;
步骤S24):对扩展词语集合进行词根还原,获得包括自然语言需求描述中的词根的候选词语集合。
优选的是,步骤S21)中,对于需求语句转为目标语言设定的限定词以前缀作为标识;
步骤S22)中,将助词、介词、连词类作为停用词预存作为停用词词库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711460123.3/2.html,转载请声明来源钻瓜专利网。