[发明专利]含有四字节编码字符的桌面文本管理检索系统无效
申请号: | 200510134226.1 | 申请日: | 2005-12-14 |
公开(公告)号: | CN1804837A | 公开(公告)日: | 2006-07-19 |
发明(设计)人: | 钱则侃;王宏源;赵锋 | 申请(专利权)人: | 王宏源 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100020北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种处理四字节文本的桌面管理检索系统。拥有建立索引库、全文浏览和全文查询的功能。该方法包括:建立索引时,原始数据通过建立索引模块以添加的方式进入数据库;浏览时,用户控制模块直接从数据库中按一定的顺序读取数据,并返回给界面显示模块显示其全文内容;查询时,全文检索模块根据查询内容访问数据库,并把查询结果返回给界面显示模块显示。本发明解决了生僻汉字的数字化的难题,使得包含大量四字节汉字的内容也可以像普通文本一样进行浏览和查询。由于采用了对包含四字节字符内容的自然语言切分技术,使得本发明在四字节和二字节内容的查询和浏览上都有优秀的表现。 | ||
搜索关键词: | 含有 字节 编码 字符 桌面 文本 管理 检索系统 | ||
【主权项】:
1.一种处理包含四字节Unicode文本的桌面管理检索系统,包括用户界面模块和查询引擎,用户界面模块和查询引擎之间链接一控制模块。系统拥有建立索引库、全文浏览和全文查询的功能。具体包括:在建立索引时,首先对原始数据进行分析处理,将每个四字节字作为索引单元加入倒排索引;对于二字节字通过检索引擎常规的分词方式确定关键词并加入倒排索引。用户浏览时,按一定的顺序从数据库中读取数据,并进行显示。用户查询时,对用户输入的内容进行切词操作,得到切分后的关键词并进行搜索。对查询后的结果进行显示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王宏源,未经王宏源许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200510134226.1/,转载请声明来源钻瓜专利网。
- 上一篇:微型真空吸铁接触式继电器
- 下一篇:筷子冲坯机