黑科技应用爆发式增长

近年来,随着科技发展,越来越多数字技术相关的服务和产品得以精准落地。AI数字人的智能服务成为数实融合的“连接器”,实时3D数字建模技术让文化遗产得到“数字永生”,文化消费的空间更加丰富多维,从社会消费端向生产端延伸,广泛发挥“以数促实”的价值。这些数字技术的发展不仅支撑文化产业升级,也以丰富的数字化场景促进社会高效协作、实体产业转型,助力企业降本、增效、提质并最终走向全真互联。

生成式AI技术为AIGC注入新动能

近年来,随着生成式AI(Generative AI)技术的快速发展创新,尤其是AI大模型和多模态AI技术的融合发展,以生成式AI为代表的AIGC技术的通用化能力和工业化水平快速提升,AIGC迎来“物种大爆发”,从语言文字快速扩展到图像、音视频、3D场景等各类数字内容。2022年,AIGC在技术进展、商业应用等层面都进入新阶段,其对数字内容和社会各行各业的影响在未来几年将持续彰显。

《2022文化科技十大前沿应用趋势》(下称报告)指出,OpenAI的DALL-E 2、Stable Diffusion、MidJourney等可以生成图片的AIGC模型引爆了AI作画领域,让AIGC加速进入公众视野,各主流互联网公司也纷纷推出自己的图片、视频生成模型。2022年11月OpenAI推出的ChatGPT模型,发布后不到一周就获得了100万用户。ChatGPT作为一个通用性的对话机器人,在与用户交互过程中可以完成各式各样的文本任务,包括写代码、作诗、写文章、提供专业知识等等。

随着生成式AI模型的软件开源、API接口开放等,越来越多的“大众式”AI内容生产工具不断出现,让普通大众可以通过AIGC参与文化艺术创作,这种创作力的大爆发将推动创作主体格局改变,使文化艺术的生产与消费进一步走向大众化,助力文化艺术的创新发展与普及传承。

报告认为,在这一趋势下,要更加关注并妥善解决AICG可能带来的信息内容安全、知识产权保护、算法歧视和社会伦理等问题,建立生成式AI和AIGC应用的伦理指南,通过技术手段识别、标记AI生成、合成内容,打造安全、可控、可信的AIGC应用。

数字孪生技术应用于国际赛事制播

近年来,国际重大文体活动成为文化科技创新的“孵化器”,数字孪生技术屡屡成为赛场“黑科技”。

一是通过虚拟仿真技术搭建文化遗产、景区、体育馆等场景的“副本”,既能够支持观众进行虚拟游览,也能对场景进行可视化、实时动态的监测与管理。2022年卡塔尔世界杯通过数字孪生方案,为每个体育场都构建了一个“3D数字孪生”,将八大赛事场馆连接为一体,并从约4万个物联网设备获取实时数据。基于这套技术方案,数字孪生统一指挥中心能够实现对赛场的实时可视化监控、远程指挥控制,以更高的效率解决问题、保障体育赛事的运营安全。

二是支持文化创意在仿真场景中进行预演,推动演出、赛事等内容的制播更加高效、精准。2022年,北京冬奥会首次以数字孪生的方式搭建了“VSS虚拟场馆仿真系统”,支持媒体完成“线上彩排”,谷爱凌在北京首钢滑雪大跳台比赛时,位于裁判塔的转播机位完美记录了她的夺冠瞬间,最终转播实时呈现的效果,与转播导演团队借助仿真系统设计好的效果高度一致。

虚拟制作技术应用提速

2022年,工信部发布《虚拟现实与行业应用融合发展行动计划(2022—2026年)》,提出要搭建常态化的虚拟现实线上演播摄制播出环境,支持沉浸式业态体验落地推广。

相关技术和政策环境的日益成熟,推动虚拟制作技术应用提速,为视听节目制作带来深远影响。

一方面,虚拟制作技术拓展了现实舞台场景,丰富了视听节目的表达空间。2022年,虚拟制作被越来越多地应用于电视台和网络节目制作中,呈现出多样化的视听设计。2022年,河南卫视“奇妙游”系列节目通过“5G+XR”技术实现舞台与虚拟场景特效的结合,将河南历史文化中最耀眼的元素与精彩的歌舞、戏曲、武术等艺术表演结合起来;央视推出的《中国考古大会》节目,借助XR技术模拟考古探险地面实景和空中虚拟景观共同构成的“魔幻场景”,实现“现实—考古进行时—历史事件发生时”三重时态的舞台转换,以创造性表达的方式向观众还原考古探险场景。

另一方面,虚拟制作技术增强了实时交互体验,塑造了“虚拟化在场+实时互动”的内容直播效果。2022北京冬奥会赛事直播中,咪咕公司基于“5G+XR”技术打造了虚实结合的多赛同看三维直播空间,在技术上突破了传统的演播厅模式,同时支持三场比赛直播,实现360度全方位自由布局与实时互动。

“数字人含量”实现爆发式增长

2022年,社会生活与服务场景下的“数字人含量”实现爆发式增长。根据市场分析机构预测,到2026年中国AI数字人市场规模将达102.4亿元。

伴随数字人生产效能的提升,2022年高保真数字人、超写实数字人、AI数字人在多方向的应用进一步成熟,为行业效率提升、服务升级提供人性化的工具,引发了数字人社会应用的新爆发:一方面,高保真数字人、超写实数字人提升了信息交互的沉浸感,为新闻报道、直播、综艺等领域提供了创新业务形态、吸引年轻人的突破口。例如,新华社联手腾讯公司NExT Studios打造的全球首位数字航天员小诤,作为超写实数字人实现了逼真、细腻的外形塑造,在航天新闻报道、知识科普等领域和年轻人群建立沟通,成为数字人助力媒体融合的典型案例。

另一方面,AI驱动的数字人能够在各类场景提供接近真人的服务,成为传媒、文旅、金融等行业数字化转型的“加速器”。例如,央视频3D智能语音助手“央小云”首次将数字人的技术能力应用于新闻热点问答;在企业服务领域,结合行业知识图谱,数字人能够通过不断的自学习、自适应提升服务能力,助力企业数字化转型力,越来越多的“数字员工”开始走进千行百业。

报告指出,未来,行业也需要探索建立数字人领域的知识产权保护措施,加强对知识产权、人文伦理等风险的研究和关注。

3D数字建模高精度还原文化遗产

随着扫描建模技术、引擎渲染技术、PCG(Procedural Content Generation,程序化内容生成)等技术的进步,文化遗产的3D还原走向更加精细、逼真、具有沉浸感。

2022年,3D数字建模技术为文化遗产的保护与传承提供了创新路径,进一步拉近大众与文化遗产之间的距离。例如,故宫和腾讯联合主办的“纹”以载道——故宫腾讯沉浸式数字体验展,向大众展示了“故宫最大裸眼3D文物”,让文物实现22倍高清放大,使用户体验到实物展也难以感受的丰富细节,同时打破物理空间限制,将故宫文物展览“搬运”到距离故宫博物院两千余公里外的广东深圳,实现了“文化+科技”的创新融合发展,以数字技术助力文化遗产焕发新的活力。

目前通过3D建模助力文化遗产数字化的方式,主要归为两种:一是将现实世界中的文化遗产,通过激光或者照扫的方式,制作为数字模型。目前在对精妙珍稀的小型文物进行数字化扫描时,通常使用16K高精度照扫模型制作。16K代表贴图分辨率,数值越高,照扫出来的模型精度就越细腻。二是在3D建模软件中建构模型,让已经消失的文化遗产在数字世界中“复生”。借助Houdini、ZBrush、Adobe Substance等三维内容制作软件制作场景,同时可以通过PCG(程序化内容生成)工具,利用算法来自动生成相应的内容。

3D数字建模高精度超写实还原文化遗产,其成果可以广泛应用于影视、游戏、艺术设计、工业设计、广告等领域,让观众以更加立体和沉浸式的方式感受文化遗产,贴近与历史和文化的距离,并助力文化遗产实现“数字永生”。

游戏引擎助力实体领域

报告指出,以游戏引擎为代表的数字交互引擎,不仅能够支持游戏创意落地,也能助力实体经济领域进行测试、演练,实现“以数促实”,正在成为建筑设计、汽车制造、航空航天等实体领域的“新型工业软件”,为“超级数字场景”的构建提供底层技术支撑。

2022年,游戏产业在硬件和软件突破的加持下,向实现更大规模、更流畅、更逼真的实时3D体验进发。硬件层面,英伟达、AMD、Intel三家芯片巨头均发布新一代显卡产品,图形芯片算力加速发展;软件层面,Epic发布最新虚幻5游戏引擎,使实时3D画面接近真实世界;终端层面,Meta等公司带来新一代XR设备,带动消费级XR产品销量提升,更多用户在虚拟世界中体验沉浸式视频、直播、娱乐、社交生活。

文保场景中,敦煌研究院联合腾讯推出“数字敦煌”项目,通过数字照扫、游戏引擎、云游戏等游戏技术,毫米级高精度复现了敦煌藏经洞及其百年前室藏6万余卷珍贵文物的盛况,生动演绎藏经洞及文物背后的千年文化故事。

未来,各行各业的数字化转型将产生更多对实时3D场景、沉浸式人机协作与交互的需求。以游戏引擎为代表的数字交互引擎,有望在新型终端、云边协同等领域实现广泛应用,成为更多社会需求的创新解决方案,助力构建一个具有丰富价值与可能的“超级数字场景”。

远程实时操控跑出“加速度”

随着实时音视频技术(Real-time Communication,RTC)在稳定性和流畅性方面实现提升,音视频技术融入会议、教育、电商直播等广泛场景。2022年,以RTC技术为核心的远程实时操控类应用发展迅速,并广泛落地于生产作业、专业服务、大众消费体验等各类场景。

当前在远程操控场景下,音视频技术可以跨界应用于多种场合:第一类是生产作业类场景。在高危和环境恶劣的作业场景下,5G和RTC技术的结合,能够以远程操作的方式替代工作人员“在场作业”,将工作人员从艰苦的作业环境中解放出来,转移到安全舒适的远程端,实现少人化和安全作业。

第二类是专业服务类场景。传统的实时音视频主要是支持人与人的线上交互,而远程操控为“线上人力向线下服务”带来了全新可能。在远程医疗领域,5G和RTC技术的结合能够支持实时影像的高清、流畅传输,让处于线上的医生如同“在场”一般对病人进行检查、诊断与手术。

第三类是大众消费体验类场景。在5G和RTC技术的支持下,远程操控使“线上用户体验线下资源”成为可能。例如在“无人机云旅游”场景下,用户通过操控无人机,在家就可以自由观赏风景、获得旅游体验。

当前技术融合的速度明显加快,实时音视频技术和5G、VR/AR等技术的深入融合,将使人与人、人与物、物与物实现更深层次、更逼真的连接,为社会协作、实时交互提供更加顺畅便捷的渠道,愈发成为打破时空局限、推动“在线”转向“在场”的桥梁。

© 版权声明
THE END
喜欢就支持一下吧
分享