[发明专利]字符串识别方法及装置有效
申请号: | 201410579684.5 | 申请日: | 2014-10-24 |
公开(公告)号: | CN104462058B | 公开(公告)日: | 2018-10-02 |
发明(设计)人: | 戴强;刘骁 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G10L13/08 |
代理公司: | 上海波拓知识产权代理有限公司 31264 | 代理人: | 韩绍君 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种字符串识别方法及装置,在一个实施例中所述方法包括以下步骤:获取字符串,所述字符串由多种类型子字符串组成;将所述字符串根据所述多种类型子字符串及其组合的子字符串类型进行分词,将所述字符串分成至少一个子字符串;判断所述至少一个子字符串是否为单词汇,所述单词汇为所述子字符串所属语种中有唯一含义的词汇;若判断所述子字符串不是单词汇,则将所述至少一个子字符串进行识别处理;以及将识别后的所有子字符串合成连贯语音。根据本发明实施例的方法及装置,可以准确识别字符串的含义。 | ||
搜索关键词: | 字符串 识别 方法 装置 | ||
【主权项】:
1.一种字符串识别方法,其特征在于,所述方法包括以下步骤:获取字符串,所述字符串由多种类型子字符串组成,所述多种类型子字符串包括:英语类型、数字类型、符号类型、汉字类型及其组合,所述多种类型子字符串对应匹配相应配置文件,所述配置文件用于标记预存的字符串类型对应确定目标类型;将所述字符串根据所述多种类型子字符串及其组合的子字符串类型进行分词,将所述字符串分成至少一个子字符串,在进行分词时将各子字符串标注词性,所述词性用于表示各子字符串的类型;判断所述至少一个子字符串是否为单词汇,所述单词汇为所述子字符串所属语种中有唯一含义的词汇;若判断所述子字符串不是单词汇,则将所述至少一个子字符串进行识别处理;以及将识别后的所有子字符串合成连贯语音;所述将所述子字符串进行识别具体包括:根据前后字符串信息建立字符串匹配模型,根据所述匹配模型识别所述子字符串的含义,选择所述匹配模型的处理结果作为识别结果;将识别后的所述子字符串合成语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410579684.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种文本反垃圾的方法
- 下一篇:一种名称相似度获取方法及装置