[发明专利]利用计算机系统进行的电视新闻标引方法有效
申请号: | 200910030960.1 | 申请日: | 2009-04-17 |
公开(公告)号: | CN101539929A | 公开(公告)日: | 2009-09-23 |
发明(设计)人: | 陈一宏;尹逊钰;吴鹏 | 申请(专利权)人: | 无锡天脉聚源传媒科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/32;G10L15/00 |
代理公司: | 南京经纬专利商标代理有限公司 | 代理人: | 任 益 |
地址: | 214028江苏省无锡市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种电视新闻智能标引的方法,将语音识别、图像识别等人工智能方法引入到传统的电视新闻标引工作中,包括如下步骤:(1)视频采集和分段;(2)视频预处理;(3)连续语音识别;(4)图像文字识别;(5)文本纠错与分词;(6)有人监督的校对,本发明重新定义了电视新闻节目的标引流程和方式,解决了旧有方法中工作效率低、标引不充分、信息挖掘不足等问题。 | ||
搜索关键词: | 利用 计算机系统 进行 电视新闻 标引 方法 | ||
【主权项】:
1、一种利用计算机系统进行的电视新闻标引方法,其特征在于,包括如下步骤:(1)、视频采集和分段:将电视节目信号导入带有视频采集卡的计算机,生成数字化的可进行非线性处理的视频文件,电视信号经采集处理,转换为视频文件存储于大容量存储器中;(2)、视频预处理:进入存储器中的视频文件进入大容量存储器的“待处理素材区”工作,通过信道分离方法,将声音和画面进行分离,源视频文件将会根据视频画面转换特征和声学特征进行切分,每个切分单元包括分离的波形语音和连续画面;(3)、连续语音识别:通过将步骤(2)产生的内容颗粒通过以太网接口读入内存,对步骤(2)生成的切分单元中的波形语音进行处理和识别,包括降噪、剔除非语音信号、语言识别、说话人识别等前期处理,然后选择适用的声学模型和语言模型,将波形语音信号转换为文本;(4)、图像文字识别:通过以太网接口读入内存,然后取出内容颗粒中已经切分好的图像文件,并放置在缓存区;逐一读取图像文件作为输入,以字符特征作为比较,检查图像中是否包含有字幕等文本信息,对步骤(2)生成的切分单元中的连续画面进行处理和识别,包括画面切分、画面特征分析、画面文字信息发现,然后对发现的文字信息进行识别转换;(5)、文本纠错与分词:以上(3)和(4)步骤获取的文本信息作为原始素材送入纠错分词服务器中运行进行二次处理,发现原始素材中的文字错误并自动更正,然后对连续的文字从语义角度进行分词和提取关键词,形成视频节目的标引信息;(6)、有人监督的校对:经步骤(5)二次处理生成的标引信息进行有人监督的校对,校对引擎将标引信息文件读取显示在显示器上,同时根据时间点信息同步播放对应的媒体文件,如果编辑人员发现标引有错误,则通过键盘或鼠标操作计算机系统,使播放暂停,然后修改为正确的标引值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡天脉聚源传媒科技有限公司,未经无锡天脉聚源传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910030960.1/,转载请声明来源钻瓜专利网。