[发明专利]提取文本以转换成音频有效
申请号: | 201210013614.4 | 申请日: | 2012-01-17 |
公开(公告)号: | CN102622333A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 王莼栋;P·洛博;R·周 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F3/16 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 罗婷婷 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及提取文本以转换成音频。公开了涉及将标记内容转换成音频输出的各实施例。例如,所公开的一个实施例提供在计算设备中的包括如下各项的方法:将标记文档分成多个内容面板;以及通过基于每一个面板相对于标记文档的总体组织的几何准则和/或基于位置的准则来对所述多个内容面板进行过滤以形成内容面板的子集。该方法还包括:确定内容面板的该子集中的每一个内容面板的文档对象模型(DOM)分析值;通过基于内容面板的该子集中的每一个内容面板的DOM分析值来对内容面板的该子集进行过滤以标识出被确定为包含文本正文内容的内容面板的集合;以及,将在被确定为包含文本正文内容的所选内容面板中的文本转换成音频输出。 | ||
搜索关键词: | 提取 文本 转换 音频 | ||
【主权项】:
一种在计算设备中从标记文档提取文本以供音频输出的方法,所述方法包括:将所述标记文档分(202)成多个内容面板;通过基于每一个面板相对于所述标记文档的总体组织的几何准则和/或基于位置的准则来对所述多个内容面板进行过滤(204)以形成内容面板的子集;确定(208)内容面板的所述子集中的每一个内容面板的文档对象模型(DOM)分析值;通过基于内容面板的所述子集中的每一个内容面板的DOM分析值来对内容面板的所述子集进行过滤以标识出(218)被确定为包含文本正文内容的内容面板的集合;以及将被确定为包含文本正文内容的所选的内容面板中的文本转换(220)成音频输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210013614.4/,转载请声明来源钻瓜专利网。