[发明专利]基于AI人工智能技术的元宇宙虚拟人图书自动播报方法在审

申请号：	202211440070.X	申请日：	2022-11-17
公开（公告）号：	CN116129860A	公开（公告）日：	2023-05-16
发明（设计）人：	邵丹;孙明	申请（专利权）人：	中图云创智能科技（北京）有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/08;G06V30/18;G06V30/413;G06V30/10;G06F16/732;G06F16/738;G06F16/78;G06T13/40;G06F16/35;G06F40/30
代理公司：	四川恒靠谱知识产权代理事务所(特殊普通合伙) 51335	代理人：	杨丹
地址：	100020 北京市朝阳***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 ai 人工智能技术宇宙虚拟图书自动播报方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了基于AI人工智能技术的元宇宙虚拟人图书自动播报方法，包括以下步骤，S1.图书对象识别：按照图书的页面，通过摄像头选取图书中的完整页面或某一章节的篇幅，摄像头所拍摄的图像和文字信息传输至计算机，将图书中选取的图像和文字进行识别，且计算机连接大数据库，图书还包括电子书；S2.文字语音转换：经计算机中的光学字符识别技术识别图书中文字，得到的文字文本通过文字语音转换技术转成语音信息，而电子书中的文字文本直接通过文字语音转换技术转成语音信息，本发明通过AI人工智能技术将图书中的图像和文字信息识别、处理和转换，结合元宇宙虚拟人物作出表情和文字的播报，使图书自动播报的过程中更赋有情感。

技术领域

本发明涉及图书播报技术领域，具体涉及基于AI人工智能技术的元宇宙虚拟人图书自动播报方法。

背景技术

图书是用来记录一切成就的主要工具，也是交融感情、取得知识和传承经验的重要媒介，一直以来对于图书总是给予最高的肯定与特别的关怀，图书播报通常是通过广播等传播介质来完成的，而随着社会经济的发展，元宇宙虚拟人的出现为图书播报提供另一种播报形式，元宇宙通过虚拟增强的物理现实，呈现收敛性和物理持久性特征的，基于未来互联网，具有链接感知和共享特征的3D虚拟空间展现出构建与传统物理世界平行的全息数字世界的可能性，虚拟人是元宇宙的重要组成部分，虚拟人指由CG技术构建、以代码形式运行的拟人化形象，人工智能技术简写为AI。是科学研究、开发设计用以仿真模拟、拓宽和拓展人的智能化的基本知识、方式、专业能力及系统的一门新的专业能力科学研究，人工智能技术技术性专业性能够对人的意识、逻辑思维的信息内容全部全过程的仿真模拟。

如授权公告号为CN201910342941.6，授权公告日为20190726的一种电子书语音播报设备及方法，该电子书语音播报设备包括指示装置、处理装置和扬声器，指示装置和扬声器分别与处理装置连接，指示装置用于获取待播报电子书的指示信息，并将指示信息发送至处理装置，处理装置用于获得与指示信息对应的文本数据，将文本数据转换为音频数据，并发送至扬声器，扬声器用于将音频数据转换为声音信号，并对声音信号进行播报。

图书上的文字内容需要进行播报时，图书中的图像和文字转换，并通过播放器等设备播出，但是通过播放器等设备播报，其播报内容死板不够赋有情感，并且播报时所传达的表情信息也不易接收到，智能化程度较低，因此，亟需设计基于AI人工智能技术的元宇宙虚拟人图书自动播报方法来解决上述问题。

发明内容

本发明的目的是提供基于AI人工智能技术的元宇宙虚拟人图书自动播报方法，以解决现有技术中的上述不足之处。

为了实现上述目的，本发明提供如下技术方案：

基于AI人工智能技术的元宇宙虚拟人图书自动播报方法，包括以下步骤：

S1.图书对象识别：按照图书的页面，通过摄像头选取图书中的完整页面或某一章节的篇幅，摄像头所拍摄的图像和文字信息传输至计算机，将图书中选取的图像和文字进行识别，且计算机连接大数据库，图书还包括电子书；

S2.文字语音转换：经计算机中的光学字符识别技术识别图书中文字，得到的文字文本通过文字语音转换技术转成语音信息，而电子书中的文字文本直接通过文字语音转换技术转成语音信息；

S3.语音信息处理：文字转换后得到的语音信息数据传输到计算机的处理器，计算机的处理器将语音信息数据按照特定情绪的词条处理划分；

S4.图像情感拾取：图像拾取后依据图书中内容在适当的时候播放，并在虚拟空间中进行展示；

S5.元宇宙虚拟人物形象建立：通过模型重建方法，虚拟人会通过扫描生成和三维建模的方式制作生成，得到虚拟人物模型；

S6.对照待播报内容：人脸面部信息尤其是情绪信息预先设置好并放在虚拟人表情动画库中，图书中的文字通过AI引擎识别情绪并分类，然后和表情动画库中的预设情绪动画做匹配；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中图云创智能科技（北京）有限公司，未经中图云创智能科技（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211440070.X/2.html，转载请声明来源钻瓜专利网。

上一篇：用于检测多种生殖道微生态菌群的实时荧光定量PCR引物、试剂盒及检测方法
下一篇：一种智能牙刷机器人

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于AI人工智能技术的元宇宙虚拟人图书自动播报方法在审

专利文献下载