[发明专利]一种语义理解方法及装置有效
申请号: | 201710905504.1 | 申请日: | 2017-09-29 |
公开(公告)号: | CN107704559B | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 叶毓平;曾启文;王虹超 | 申请(专利权)人: | 北京软通智城科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 理解 方法 装置 | ||
本发明公开了一种语义理解方法及装置,所述方法包括:获取待分析的语义文本,基于意象图式构建语义文本的语义网,获取语义网的向量空间与本体数据库中的各标准文本的向量空间的距离差,并根据距离差确定与语义文本对应的标准文本。本发明实施例提供的方案,无需针对同一语义预先存储多种表达形式,且也不需要预先为不同的场景配置不同的模板,语义理解效率高。
技术领域
本发明涉及智慧城市技术领域,特别是涉及一种语义理解方法及装置。
背景技术
智慧城市的建设离不开人机的深入交互,更离不开语义理解系统的支撑。智慧城市应用的智慧性对语义理解提出了更高的要求。
目前常见的语义理解方法主要有两种,一种为基于人理解的统计方法,具体地,预先统计并存储同一种语义的多种说法,当具有待分析的语义文本时,将语义文本与预先存储的多种说法进行比对,以确定待分析的语义文本所表达的真实语义;另一种方法基于模板规则配置实现,具体地,为不同的场景设置不同的模板,当具有待分析的语义文本时,将语义文本与各模板匹配,直至确定符合该语义文本的模板,并根据确定的模板确定待分析的语义文本所表达的真实语义。例如,待分析的语义文本为“我要买去长沙的火车票”,配置的场景模板可以为,第一个词为主语,间隔“买”为动作,第五个词开始一般为“目的地”地名等,当待分析的语义文本与各模板匹配后,确定与上述场景模板匹配,所以可确定待分析的语义文本所所表达的真实语义为购买目的地为长沙的火车票。
发明人在对现有技术的研究过程中发现,第一种语义理解方法需要预先存储多种说法,然而由于地域和生活习惯的不同,不可能做到穷举一个意思的所有说法,所以,该语义理解方法的准确度较低;而第二种语义理解方法,,需要预先为不同的场景配置不同的模板,语义理解效率较低。
发明内容
为解决上述技术问题,本发明实施例提供了一种方法及装置,以解决现有技术中在线编程时间长的问题,技术方案如下:
一种语义理解方法,包括:
获取待分析的语义文本;
基于意向图式构建所述语义文本的语义网;
获取所述语义网的向量空间与本体数据库中的各标准文本的向量空间的距离差;
根据所述距离差确定与所述语义文本对应的标准文本。
优选地,基于意向图构建所述语义文本的语义网之前,还包括:
按照所述本体数据库中对单个本体的定义规则,对所述语义文本进行分词,以获得多个语义子文本;
分别标注所述多个语义子文本的词性;
相应地,基于意向图构建所述语义文本的语义网,包括:
根据所述多个语义子文本和所述词性,基于意向图构建所述语义文本的语义网。
优选地,根据所述距离差确定与所述语义文本对应的标准文本,包括:
从所述距离差中确定最小距离差;
将与所述最小距离差对应的标准文本作为与所述语义文本对应的标准文本。
优选地,还包括:
输出与确定的标准文本对应的答案。
优选地,还包括:
预先通过网络节点上的自动爬虫从各网站抓取文本信息;
将所述文本信息转换为符合所述定义规则的本体;
将所述本体存储至所述本体数据库中。
一种语义理解装置,包括:
获取待分析的语义文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京软通智城科技有限公司,未经北京软通智城科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710905504.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:汽油割灌机(DY431)
- 下一篇:手动搅拌机