[发明专利]用于根据词之间的不确定性而对词间隔进行不对称格式化的系统和方法有效
| 申请号: | 201680027497.3 | 申请日: | 2016-03-08 |
| 公开(公告)号: | CN107615268B | 公开(公告)日: | 2021-08-24 |
| 发明(设计)人: | C·D·尼古拉斯;K·R·布朗菲尔德 | 申请(专利权)人: | 非对称实验室公司 |
| 主分类号: | G06F40/103 | 分类号: | G06F40/103;G06F40/14;G06F40/163;G06F40/117;G06F40/114;G06F40/106;G06F40/211;G06F40/284 |
| 代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;李够生 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 根据 之间 不确定性 对词 间隔 进行 不对称 格式化 系统 方法 | ||
1.一种用于确定跨越文本中的词间隔的不确定性的方法,其包括以下步骤:
a)提供文本输入;
b)提供功能词的数据库,所述功能词表示语法或句法关系,其中所述功能词中的每一者具有以下项中的至少一项:词汇身份、词位、词汇类别;
d)检查所述文本输入的多个词;
e)将所述多个词中的每一者识别为所述功能词的数据库中的所述功能词或不在所述功能词的数据库中的内容词中的任一者;
f)为每一独特的伪句法混合生成n字母组频率计数,其中所述独特的伪句法混合中的每一者是n字母组,所述n字母组由两个或两个以上词组成:所述功能词中的一者以及不在所述功能词的数据库中的所述内容词中的一者;
h)对于接下来的多个词重复步骤d-f直到到达末尾文本输入为止;以及
g)使用所述n字母组频率计数来计算所述文本输入内的所述独特的伪句法混合中的每一者的不确定性;
h)根据所述不确定性不对称地格式化所述文本中的所述词间隔的宽度;
其中所述词汇身份是词,所述词位是词可采用的形式的集合,所述词汇类别是所述词的词性,且所述内容词是缺乏句法信息的开放类词。
2.如权利要求1所述的方法,其中所述文本输入是含有文本的文档。
3.如权利要求1所述的方法,其中所述文本输入是从语料库生成的所述n字母组频率计数。
4.一种用于确定跨越文本中的词间隔的不确定性的系统,其包括:
功能词的数据库,所述功能词表示语法或句法关系,其中所述功能词中的每一者具有以下项中的至少一项:词汇身份、词位、词汇类别;
计数器,其用于为所述文本中的每一独特的伪句法混合生成频率计数,其中所述独特的伪句法混合中的每一者由两个或两个以上词组成,所述两个或两个以上词包括所述功能词以及不在所述功能词的数据库中的内容词中的至少一者;以及
过滤器,其用于使用所述频率计数来计算跨越伪句法混合的词间隔的词汇不确定性;
根据所述不确定性不对称地格式化所述文本输入中的词间间隔的宽度;
其中所述词汇身份是词,所述词位是词可采用的形式的集合,所述词汇类别是所述词的词性,且所述内容词是词项的开放类状态是缺乏句法信息的内容词。
5.如权利要求4所述的系统,其中计算所述不确定性导致提供键和值的输入映射,所述键中的每一者指示至少一个伪句法混合,且所述值指示跨越与所述键相邻的所述词间隔的所述不确定性。
6.一种用于格式化文本的方法,其包括:
提供文本输入;
提供键和值的映射输入,所述键各自指示至少一个独特的伪句法混合,且所述值指示跨越与所述键相邻的词间隔的不确定性;以及
检查所述文本输入以在所述映射输入中查找所述键并基于所述检查的结果而格式化所述文本输入的与所述键相邻的所述间隔的宽度,其中所述格式化所述文本输入的与所述键相邻的所述间隔的所述宽度是通过指示跨越与所述键相邻的所述词间隔的所述不确定性的所述值来确定;
其中所述独特的伪句法混合是由两个或两个以上词组成的n字母组,所述两个或两个以上词包括功能词或内容词,所述功能词表示语法或句法关系并存储在功能词的数据库中且所述内容词是不在所述功能词的数据库中的开放类词。
7.如权利要求6所述的方法,其中通过改变间隔字符、前一字符或后一字符的以下字符属性中的至少一项来调整所述相邻间隔的所述宽度:字母间距、水平缩放、字距调整、水平偏移、填充、左边距或右边距。
8.如权利要求6所述的方法,其中通过在HTML文档内插入HTML标签来调整所述相邻间隔的所述宽度。
9.如权利要求6所述的方法,其中通过在XML文档内插入XML标签来调整所述相邻间隔的所述宽度。
10.如权利要求6所述的方法,其中通过在XHTML文档内插入XHTML标签来调整所述相邻间隔的所述宽度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于非对称实验室公司,未经非对称实验室公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680027497.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于捕获分层屏幕内容的方法
- 下一篇:用于媒体回放的虚拟助理





