[发明专利]中文辞典建置装置和方法无效
申请号: | 200810179551.3 | 申请日: | 2008-12-04 |
公开(公告)号: | CN101751377A | 公开(公告)日: | 2010-06-23 |
发明(设计)人: | 王文男;张俊盛;谢文泰;谷圳;吴鉴城;陈郁儒 | 申请(专利权)人: | 财团法人资讯工业策进会 |
主分类号: | G06F17/20 | 分类号: | G06F17/20;G06F17/27;G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻 |
地址: | 中国台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 辞典 建置 装置 方法 | ||
1.一种中文辞典建置方法,其特征在于,所述方法包括:
根据一最大熵法判断一动词的一名物化机率,其中所述动词具有一动词词性;
当所述名物化机率大于一既定值时,修正所述动词词性为一正确词性;以及
存储所述动词于一存储装置。
2.如权利要求1所述的中文辞典建置方法,其特征在于,还包括根据所修正的所述正确词性找出对应于所述动词的至少一搭配词。
3.如权利要求2所述的中文辞典建置方法,其特征在于,还包括存储所述搭配词于一数据库。
4.如权利要求2所述的中文辞典建置方法,其特征在于,还包括根据多个中文句子中所述动词与所述搭配词之间的字元间距来找出所述搭配词。
5.如权利要求2所述的中文辞典建置方法,其特征在于,还包括根据多个中文句子中所述动词与所述搭配词同时出现的频率来找出所述搭配词。
6.如权利要求4所述的中文辞典建置方法,其特征在于,还包括根据所述中文句子中所述动词与所述搭配词同时出现的频率来找出所述搭配词。
7.如权利要求1所述的中文辞典建置方法,其特征在于,还包括收集至少一中文字串,其中所述中文字串依序包括相邻于所述动词的一前词、所述动词以及相邻于所述动词的一后词,且所述前词、所述动词和所述后词分别对应至一前词词性、所述动词词性以及一后词词性。
8.如权利要求7所述的中文辞典建置方法,其特征在于,还包括根据所述前词、所述前词词性、所述动词、所述动词词性、所述后词以及所述后词词性判断所述名物化机率。
9.一种中文辞典建置装置,其特征在于,所述的中文辞典建置装置包括:
一名物化判断模块,根据一最大熵法判断一动词的一名物化机率,其中所述动词具有一动词词性;以及
一词性修正模块,当所述名物化机率大于一既定值时,修正所述动词词性为一正确词性。
10.如权利要求9所述的中文辞典建置装置,其特征在于,还包括一搭配词产生模块,根据所修正的所述正确词性找出对应于所述动词的至少一搭配词。
11.如权利要求10所述的中文辞典建置装置,其特征在于,还包括一数据库,用以存储所述搭配词。
12.如权利要求10所述的中文辞典建置装置,其特征在于,所述搭配词产生模块是根据多个中文句子中所述动词与所述搭配词之间的字元间距来找出所述搭配词。
13.如权利要求10所述的中文辞典建置装置,其特征在于,所述搭配词产生模块是根据多个中文句子中所述动词与所述搭配词同时出现的频率来找出所述搭配词。
14.如权利要求12所述的中文辞典建置装置,其特征在于,所述搭配词产生模块更根据所述中文句子中所述动词与所述搭配词同时出现的频率来找出所述搭配词。
15.如权利要求9所述的中文辞典建置装置,其特征在于,还包括一中文字串收集模块,用以收集至少一中文字串,其中所述中文字串依序包括相邻于所述动词的一前词、所述动词以及相邻于所述动词的一后词,且所述前词、所述动词和所述后词分别对应至一前词词性、所述动词词性以及一后词词性。
16.如权利要求15所述的中文辞典建置装置,其特征在于,所述名物化判断模块是根据所述前词、所述前词词性、所述动词、所述动词词性、所述后词以及所述后词词性判断所述名物化机率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人资讯工业策进会,未经财团法人资讯工业策进会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810179551.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:便携式骑行、健身两用车
- 下一篇:全挂车