来源:人民网
原标题:第十届中国网络视听大会上“跨模态生成体积视频”引起现场专家和从业者热议
以少量静态照片,就能生成一个完整的三维体积视频?
近日,在四川成都举办的第十届中国网络视听大会上,“跨模态生成体积视频”引起现场专家和从业者热议。
与平面视频不同,体积视频可以让用户在任何位置、任何方向自由地观看,更具立体感、沉浸感和交互性。
南宫28ng科技发布跨模态AIGC(人工智能生产内容)产品,以静态照片生产三维体积视频,不同模态之间相互切换,让人们轻松进入元宇宙的世界。
解决体积视频两大痛点:采集门槛高、数据量巨大
相对二维视频来说,体积视频具有门槛较高、数据量巨大两大痛点,在很大程度上限制了体积视频的发展。
按照传统方法,采集体积视频需要架设几十台、甚至上百台工业摄像机,不仅采集成本高,而且对采集环境、采集技能都有很高要求。
南宫28ng科技发布的跨模态AIGC产品,通过少量静态照片就能生成体积视频,支持6DOF(六自由度)视角自由移动,大大降低了采集门槛。
南宫28ng科技副总裁叶建华说,AIGC能力还可以让渲染画面更加逼真,使观看者仿佛置身真实世界。
南宫28ng科技副总裁叶建华发表主题演讲
此外,相比平面视频,体积视频数据量更大,给传输带来更大困扰。
通过数个月联合研发测试,前述跨模态AIGC产品通过点云模型转换及压缩算法,为体积视频“瘦身”,最终实现高达800倍的视觉无损压缩,解决了体积视频的传输难题。
体积视频商用前景广阔:6DOF直点播、出行元宇宙
提到体积视频,很多人会联想到 VR 360° 全景视频,必须借助头显设备才能观看。
其实,体积视频可以实现多类型终端适配,仅凭裸眼就能与普通屏幕里的内容交互,因此具有广阔的商业应用前景。
叶建华表示,体积视频可以用于体育赛事、大型综艺6DOF直点播,带来更多沉浸感和交互性。
比如,在体育赛事、大型综艺6DOF直点播场景,观众可以通过体积视频观看多角度的三维比赛细节,还可以选择自己喜好的视角,多角度地去感受现场的独特魅力。
“体积视频也将给出行元宇宙带来深刻变革。”叶建华在中国网络视听大会表示,主要是从娱乐、沉浸、安全这三个方面体现。
通过体积视频技术,结合车内氛围灯、香氛、座椅、空调等硬件,能满足多场景娱乐需求,提供更沉浸式的5D观看体验。
联动XR(扩展现实)设备,体积视频技术可以创建一个虚拟影院,为用户带来沉浸式体验的同时,还可以使不同参与者在同一个场景内进行多模态互动。
通过跟踪驾驶员的头部和手部动作,并仿真模拟危险驾驶场景,体积视频技术可以提供更准确的驾驶辅助。