计算机视觉技术主要涉及哪些内容
计算机视觉技术主要涉及哪些内容?从George Melies著名的《月球之旅》开始,技术发展深刻影响艺术表现,今天小编就来聊一聊关于计算机视觉技术主要涉及哪些内容?接下来我们就一起去研究一下吧!
从George Melies著名的《月球之旅》开始,技术发展深刻影响艺术表现。
据Filmmaker IQ发布的《2020年娱乐应用技术趋势》显示,近十年来,计算机视觉技术获得好莱坞的全面运用,其技术应用标准化是关键原因之一,当下已经渗透包括新闻报道、体育、戏剧和喜剧节目、游戏和广告、广播和播客、以及电视和电影、出版业等全媒体娱乐矩阵。与此同时,2019年的传媒娱乐业正承受着转型压力,大环境推动电视、DVD、CD-ROM向流媒体、播客、游戏和在线服务等分销渠道转变,导致受众分散,因此需要经济有效地解决小目标组需求。
在技术革新上,计算机视觉技术使内容交互性达到新水平,随处可见的降低成本举措,这些趋势变化引起了计算机视觉技术多层面的需求推导和使用演进。德勤最近发布的《2020年科技、媒体和电信预测》佐证了这一趋势:跨种类技术之间变得越来越紧密和相互依存,随着AI、5G和机器人相互连接,流媒体和传统电视相互影响变得更为频繁。
毫无疑问的是,计算机视觉技术工程师正在加大AI技术替代现有传媒与娱乐技术的步伐,包括从AI软件(图像信号处理、模式识别、视觉控制、对象识别、场景重建、场景理解)和AI硬件(传感器、平台等)两大层面,实现从声音、色彩、到计算机动画,以及高清和数字广播的创新——从应用跨度上看,实现了技术与艺术表现、技术与用户体验、技术与应用创新三个维度:从技术特性上看,实现多个高质量彩色图像流的高带宽;从实时性看,这需要低延迟(最多几个帧)以及对故障的高可靠性和鲁棒性要求。
事实上,计算机视觉技术已经实际成效渗透各环节、阶段,包括娱乐产品(内容)的智能化生产、及成品的个性化交付(分发和传输)。
内容生产阶段:计算机视觉已成为产业通用技术,2020年将突破规模化桎梏
在图像采集方面,高质量的硬件与边缘计算视觉算法集成度进一步提高,以提供满足预处理要求(伽玛和颜色矩阵)的增强稳定性,降噪和消除缺陷的能力。其中,计算机视觉的主要任务就是对采集的图片或视频进行处理,以获得相应场景的三维信息、关键帧抽取、关联帧关联,这些应用已广泛应用于综艺节目、体育赛事、流媒体内容制作中。当前计算机视觉技术应用领先者包括国内的虹软科技Arcsoft、影谱科技Moviebook,英国的Vinten、A&C、Radamec、MRMC,及德国的Panther等。
在数据采集方面,除获取图像数据以外,还可以完成从任意图像序列中提取概念信息(例如速度和距离以及3D形状),大部分参与调研的企业数据显示,使用3D数据采集系统来为实时节目编程和视频游戏中的动画创建模型已成为流行。如:运动扑捉系统以制作视频游戏动画;交互式注释系统实现对运动员和球的自动跟踪,距离和速度估计,通过视图组合进行全景重建,越位检查,命名等;轨迹和速度信息获取系统以跟踪体育赛事或综艺节目的关注对象,实现运动轨迹估算等。这些已被用于足球、冰球、网球、篮球和田径比赛、场外综艺节目中,以回放评论。例如德国的X-IST可以基于面部运动进行动画处理,影谱科技MCVS动作捕捉系统可实现自动跟踪、距离和速度估计、全景重建等。
在数据合成方面,实时合成背景图像并将其与摄像机的观看参数(如位置、缩放和景深)进行匹配,允许更为复杂的视频集,包括角色与合成对象之间存在相互作用的视频集,这一产业需求在技术上已经变得可行。当前,可以通过两种方式之一获取此信息:使用安装摄像机上的光学或机械传感器;使用视频中的图案识别并以此来确定位置。
在内容编目方面,后期制作工作站将受益于更加自动化和自适应的方法。如多个图像源之间进行混合,包括动画或合成序列;将一个图像变形或扭曲到另一个图像上;跟踪对象以进行运动补偿,图像稳定和剪辑对齐;删除或添加运动模糊;采样、建模和匹配;自动分割及跟踪视频运动对象等。随着工作台向智能化转变,许多编辑工作逐渐由智能生产工作站来代替,例如来自英国的Quantel、加拿大的Discreet LogicAlias和Wavefront、中国的影谱科技等提供的系统,大量引入3D重建、关键帧抽取、过滤、自然语义理解、智能分段和插入等,操作员以接近实时的方式监督整个序列运行过程,调整参数以获得令人满意的结果。