[发明专利]一种基于TSS编码的态势文本消息语义压缩编码方法有效
申请号: | 202210116917.2 | 申请日: | 2022-02-08 |
公开(公告)号: | CN114139499B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 耿虎军;张文宝;楚博策;王梅瑞;韩长兴;高晓倩;孟楠;姜岩松;高峰;陈勇 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/30 |
代理公司: | 河北东尚律师事务所 13124 | 代理人: | 王文庆;曲佳颖 |
地址: | 050081 河北省石家庄市桥西区中山*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 tss 编码 态势 文本 消息 语义 压缩 方法 | ||
1.一种基于TSS编码的态势文本消息语义压缩编码方法,其特征在于,包括以下过程:
首先针对输入的语义文本消息,构建语义消息内容要素提取框架,对语义文本消息的语义内涵要素进行分解;其中,语义内涵要素包括时间要素、空间要素和态势语义要素;
针对语义文本消息中的时间要素,构建时间基准编码与时间差值编码两级编码策略,将时间信息按照原始时间信息表示尺度编码成指定位数的时间整数;
针对语义文本消息中的空间要素,基于预期空间区域内的地形地势和重要战略目标的空间分布,构建多层级空间地址语义体系,将以经纬度区间表示的空间范围、以口语地名表示的地理区域和以相对位置表示的空间区域进行空间映射,将同一区域的不同形式的空间信息编码到同一区段,并按照原始信息表示形式编码成不同类型;
针对语义文本消息中应用领域的态势语义要素,利用先验专家知识将当前文本消息与应用领域以及对应的编码策略进行标注关联,构建文本信息编码方案贝叶斯语义推理模型,依据文本消息的应用领域,选择对应的词组编码方案,将各类态势语义字段在同一应用语义层次中进行压缩;
针对语义文本消息中的各类虚词,结合词性、词组长度和使用频率进行编码。
2.根据权利要求1所述的一种基于TSS编码的态势文本消息语义压缩编码方法,其特征在于,针对语义文本消息中的时间要素进行编码,包括如下步骤:
(201)将语义文本消息中的时间信息分为两个层级:日期部分和时间部分,其中,时间部分特指一天中的具体时间,日期部分包含年、月、日;日期部分和时间部分的表示方式与语义文本消息中的表达方式保持一致;
(202)对于包含多个时间节点的语义文本消息,选定时间中位数的节点作为时间基准,分别计算其它时间点与时间基准的差值,并对时间基准和时间差值分别进行编码;
(203)对于时间基准编码与时间差值编码,首先根据输入的语义文本消息中的各时间的描述尺度确定编码长度,然后将日期部分与时间部分按照格林威治时间的不同时间粒度转化为指定位数的编码;最后将原始位置的时间信息的表述方式加入到编码序列中;其中,表述方式包括数字字母组合形式、中文文本形式和UTC标准形式。
3.根据权利要求1所述的一种基于TSS编码的态势文本消息语义压缩编码方法,其特征在于,针对语义文本消息中的空间要素进行编码,包括如下步骤:
(301)基于地形地势、山川植被、城市结构以及重要固定设施的分布,对目标空间区域的自然或人文地理实体的时空属性和战略属性进行分级标识,构建多层级空间地址语义体系,并作为语义文本消息中的空间信息映射基准;
(302)针对以经纬度区间描述的空间范围,依据描述的空间区域范围在多层级空间地址语义体系中对应层级描述粒度的下一级尺度,对目标区域编码;
针对以口语地名表示的地理区域,依据对应地名在多层级空间地址语义体系中的行政隶属关系和地名对应历史沿用语义体系进行编码,同时去除异地同名数据造成的歧义;
针对以相对位置表示的空间区域,基于原始表述形式选择经纬度或者口语地名的编码策略,之后添加空间相对方位信息的编码。
4.根据权利要求1所述的一种基于TSS编码的态势文本消息语义压缩编码方法,其特征在于,针对语义文本消息中的应用领域的态势要素进行编码,包括如下步骤:
(401)采用统计建模方法与字典建模方法相融合的方式,首先分析各应用领域内不同类型文本在用词、造句和章节方面上的格式化文本结构、行文逻辑以及语义规范,统计各领域内各类词组的使用频度,并进行哈夫曼变长编码;然后融合各应用领域语义要素编码策略,得到语义要素编码方案库;
(402)基于专家先验知识,将语义文本消息的类别属性和时空属性采用符号化聚合近似方法进行语义化离散编码,并进行贝叶斯语义推理,从语义要素编码方案库中选择适用于当前文本消息的语义要素编码策略;其中,类别属性包含消息类型、消息用途、应用领域和消息主体,时空属性包含目标速度、目标人数和目标空间范围。
5.根据权利要求4所述的一种基于TSS编码的态势文本消息语义压缩编码方法,其特征在于,步骤(401)中在对各领域内各类词组进行哈夫曼变长编码时,对于包含多字的复合词组,基于中文语义语用规则,将复合词组拆解成多个简单词组语义层次上的“组合运算”;之后,将复合词组的编码以各简单词组的编码进行表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所,未经中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210116917.2/1.html,转载请声明来源钻瓜专利网。