[发明专利]文字数据“了”的语法功能机器软件分析技术无效
| 申请号: | 201010127004.8 | 申请日: | 2010-03-18 |
| 公开(公告)号: | CN102193911A | 公开(公告)日: | 2011-09-21 |
| 发明(设计)人: | 孙军堂 | 申请(专利权)人: | 孙军堂 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 222534 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文字 数据 语法 功能 机器 软件 分析 技术 | ||
技术领域:
本技术涉及一种基于中文文字数据“了”的流程分析算法,实现判断其表达的句子时态逻辑、应用语法属性及其应用词汇数据等功能,该算法通过语法逻辑分析,实现对此数据在实际应用中的时态逻辑功能分析和词汇筛选。
背景技术:
目前,语言翻译行业内基于机器对词汇数据的语法分析没有形成系统的突破,尚无成形的可应用技术。尤其是对“了”在语言应用中独有的逻辑表达功能以及它在语言翻译中客观存在的专用词汇没有明确的认识。目前的技术更多的是从抽象的、繁琐的语料训练等技术角度筛选词汇,不能有效地分析出词汇在使用时的语法成分,无法把词汇数据中尤其是中文词汇数据中一词多义和多词一义的情况识别清楚,也不能合理地体现句子中存在的时态逻辑对句子逻辑理解的重要性,无法有效地体现自然语法学的逻辑性和技术性等科学特征。
发明内容:
本技术通过计算机运行程序控制语法分析模块的分析流程,针对词汇数据“了”在应用数据流中不同的情况有针对性地自动分析出数据“了”在句子中所属的语法成分,并判断句子的时态逻辑。通过数据“了”对“给”、“经特殊标注的姓氏”等文字数据的动词性语法属性影响以及对“副词”文字数据的助词性语法属性影响采用优先判断,进而实现相应的词汇筛选。
本发明的技术方案是:
建立一个基于PC机软件开发环境下的中英文词汇数据库,以作为应用程序运行的基础;
然后利用分词技术并通过查表的方式从词汇数据库中读取相关数据相应的各类属性。
根据语言类别1的要求,由语法属性分析模块流程管理程序分析程序查询数据的属性情况决定是否调用判断模块运算数据的属性。判断模块根据数据的具体使用情况,查询算法内部的条件表达式,分析出相关数据的语法属性。
根据语言类别2的要求和已判断出的语法属性数据值查询数据库,并转换出相应的中文或英文词汇数据。
附图说明:
图1为处理器的流程控制程序;它包含:
1-1为开始;
1-2为语言类别1判断;
1-3为句子分词判断;
1-4为语法属性判断模块管理程序;
1-5为数据“了”判断模块;
1-6为查询数据库;
1-7为语言类别2判断;
1-8为输出显示;
1-9为结束;
图2为数据1-5“了”判断模块的实现程序;它包含下列子模块:
2-1为数据“了”对于部分词汇数据优先的语法属性判断;
2-2为数据“了”的时态逻辑属性判断;
2-3为数据“了”针对代词作为宾语时的宾格属性判断的部分条件功能;
模块4为数据“了”的词汇形式筛选模块。
采用本技术显著的效果是:能够分析出数据“了”在文字数据中所体现的对句子时态逻辑的表达功能,及其对部分文字数据的语法属性的特殊影响,进而实现优先判断,并筛选出符合其特征的词汇,有利于机器在文字翻译中系统地实现对句子的动作逻辑和时态逻辑的理解和表达,提高文字翻译的准确率。
具体实施方式:
本发明通过在数据库中对“了”以及与其有相关运算的词汇数据的属性标注,经分词后把分词时所读取的相关词汇数据的属性,调用“了”判断模块。该模块通过一定的流程管理和设计的逻辑算法,判断出“了”的语法属性;由所判断的属性查询数据库,并根据语言类别2的要求输出结果。
本发明在实施时,首先要建立一个语言类别1判断的模块,以便于运行相关语言的分词程序。分词的目的是把语句切割为多个词汇,以便于数据库与程序之间的数据查询和数据交换。分词时同时读取相关词汇数据的属性,当语法属性分析模块流程管理程序查询到有“了”的属性时,运行“了”的语法判断程序。
“了”的语法判断模块程序按照设定的流程顺序运算数据“了”在应用句子中的语法属性。它包含四个子模块,具体实现方式为:
模块1:“了”对于部分词汇数据优先的语法属性判断,此模块应用于语法分析时,由管理程序优先置于控制流程的首部运行,以分析“给、动词1、动词2、去、副词、经特殊标注的姓氏”等数据在客观应用时优先作为动词的语法属性。
模块1的技术原理为:以A数据的属性1对比B数据的属性1,并赋于B数据的新属性。实现方式为:如果查询到句子中有“了”存在,则继续查询直接位于它前面的数据属性1,如果那些数据的属性1为:
1、“给”时,则此数据的新属性为动词;
2、“副词或形容词”时,且句子中没有动词时,则此数据的新属性为助词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于孙军堂,未经孙军堂许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010127004.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





