2020传媒技术预测:计算机视觉技术将渗透传媒各

作者: admin 来源: 未知 发布时间:2020-01-11 22:58

  从George Melies著名的《月球之旅》开始,技术发展深刻影响艺术表现。

  据Filmmaker IQ发布的《2020年娱乐应用技术趋势》显示,近十年来,计算机视觉技术获得好莱坞的全面运用,其技术应用标准化是关键原因之一,当下已经渗透包括新闻报道、体育、戏剧和喜剧节目、游戏和广告、广播和播客、以及电视和电影、出版业等全媒体娱乐矩阵。与此同时,2019年的传媒娱乐业正承受着转型压力,大环境推动电视、DVD、CD-ROM向流媒体、播客、游戏和在线服务等分销渠道转变,导致受众分散,因此需要经济有效地解决小目标组需求。

  在技术革新上,计算机视觉技术使内容交互性达到新水平,随处可见的降低成本举措,这些趋势变化引起了计算机视觉技术多层面的需求推导和使用演进。德勤最近发布的《2020年科技、媒体和电信预测》佐证了这一趋势:跨种类技术之间变得越来越紧密和相互依存,随着AI、5G和机器人相互连接,流媒体和传统电视相互影响变得更为频繁。

  毫无疑问的是,计算机视觉技术工程师正在加大AI技术替代现有传媒与娱乐技术的步伐,包括从AI软件(图像信号处理、模式识别、视觉控制、对象识别、场景重建、场景理解)和AI硬件(传感器、平台等)两大层面,实现从声音、色彩、到计算机动画,以及高清和数字广播的创新——从应用跨度上看,实现了技术与艺术表现、技术与用户体验、技术与应用创新三个维度:从技术特性上看,实现多个高质量彩色图像流的高带宽;从实时性看,这需要低延迟(最多几个帧)以及对故障的高可靠性和鲁棒性要求。

  事实上,计算机视觉技术已经实际成效渗透各环节、阶段,包括娱乐产品(内容)的智能化生产、及成品的个性化交付(分发和传输)。

  在图像采集方面,高质量的硬件与边缘计算视觉算法集成度进一步提高,以提供满足预处理要求(伽玛和颜色矩阵)的增强稳定性,降噪和消除缺陷的能力。其中,计算机视觉的主要任务就是对采集的图片或视频进行处理,以获得相应场景的三维信息、关键帧抽取、关联帧关联,这些应用已广泛应用于综艺节目、体育赛事、流媒体内容制作中。当前计算机视觉技术应用领先者包括国内的虹软科技Arcsoft、影谱科技Moviebook,英国的Vinten、A&C、Radamec、MRMC,及德国的Panther等。

  在数据采集方面,除获取图像数据以外,还可以完成从任意图像序列中提取概念信息(例如速度和距离以及3D形状),大部分参与调研的企业数据显示,使用3D数据采集系统来为实时节目编程和视频游戏中的动画创建模型已成为流行。如:运动扑捉系统以制作视频游戏动画;交互式注释系统实现对运动员和球的自动跟踪,距离和速度估计,通过视图组合进行全景重建,越位检查,命名等;轨迹和速度信息获取系统以跟踪体育赛事或综艺节目的关注对象,实现运动轨迹估算等。这些已被用于足球、冰球、网球、篮球和田径比赛、场外综艺节目中,以回放评论。例如德国的X-IST可以基于面部运动进行动画处理,影谱科技MCVS动作捕捉系统可实现自动跟踪、距离和速度估计、全景重建等。

  在数据合成方面,实时合成背景图像并将其与摄像机的观看参数(如位置、缩放和景深)进行匹配,允许更为复杂的视频集,包括角色与合成对象之间存在相互作用的视频集,这一产业需求在技术上已经变得可行。当前,可以通过两种方式之一获取此信息:使用安装摄像机上的光学或机械传感器;使用视频中的图案识别并以此来确定位置。

  在内容编目方面,后期制作工作站将受益于更加自动化和自适应的方法。如多个图像源之间进行混合,包括动画或合成序列;将一个图像变形或扭曲到另一个图像上;跟踪对象以进行运动补偿,图像稳定和剪辑对齐;删除或添加运动模糊;采样、建模和匹配;自动分割及跟踪视频运动对象等。随着工作台向智能化转变,许多编辑工作逐渐由智能生产工作站来代替,例如来自英国的Quantel、加拿大的Discreet LogicAlias和Wavefront、中国的影谱科技等提供的系统,大量引入3D重建、关键帧抽取、过滤、自然语义理解、智能分段和插入等,操作员以接近实时的方式监督整个序列运行过程,调整参数以获得令人满意的结果。

  除此之外,“影像资料的有效管理”是广电和文娱内容公司的一个重要课题,通过实地调研,我们可以看到计算机视觉技术在其中发挥无可替代的优势,并得到深度普及,包括:

  内容检索:受益于视频结构自动化标注,操作者可以通过内容、活动或抽象含义来搜索影像内容,包括搜索压缩数据以及混合的音视。IBM媒体系统可以根据颜色、纹理或形状进行内容索引,国内快手及抖音平台根据视频帧标注实内容检索、影谱科技完成视频档案的自动化标注。

  档案恢复:受益于复杂的噪声和降级模型以及自适应过滤方法,低分辨率影像档案的恢复和转换将变得一键化、轻量化。瑞典的DigitalVision、AURORA、爱奇艺等企业正在对低分辨率内容交互式处理,以进行运动补偿、色彩校正、刮擦、污垢、和噪音过滤等。

  3、格式转换:包括压缩格式在内的格式数量不断增加,这意味着格式转换将在相当长的一段时间内伴随着我们,尤其是向前、向后和压缩转码。

  对于内容生产智能化的变化,清华大学自动化系副教授刘烨斌认为,真实世界视觉信息的采集、数字化记录与重建是当前视觉媒体技术发展的核心关键。目前而言,动态场景三维重建主要面临精准性、便捷性和实时性三方面的挑战,而在智能手机、物联网及5G相互作者用下,新增加实时深度探测模块,动态场景三维重建的便捷性得到了极大地提高,视角维度的光场摄像、光谱维度的高光谱视频成像、空间维度的十亿像素视频生成、时间维度的TOF瞬态成像都有可能突破桎梏,得到产业应用。

  人工智能对传媒内容创建的影响无可争议,涉及内容创建到用户个性化体验的全流程。“人工智能将影响媒体价值链的各个方面,帮助创作者更具创造力,帮助内容编辑更高效,帮助用户找到符合他们兴趣和当前情况的内容”,微软Rainer Kellerhals表示。

  IABM的首席研究分析师Lorenzo Zanni对此表示赞同。“传媒机构可以在整个内容供应链中利用人工智能来自动化运营,推动决策制定并个性化用户体验,‘自动元数据标记和提取’是迄今为止人工智能最广泛的应用,AI算法自动创建的元数据可用于推动内容货币化策略”。

  这只是开始。影谱科技表示,“传媒机构也可以使用AI来增强他们的预测和生产能力,例如人工智能技术可用于预测需求以调整资源分配(按需模型)、预测内容中可能出现的中断(例如内容不合规)、预测商业化(例如元数据内的商业化位置标记)或预测内容创建(例如内容被机器自动创建)等,这些用例切实可行降低生产成本”。

  “影谱科技AGC智能影像生产引擎基于视觉人工智能技术,可以更轻松地从视频中提取元数据,包括时间编码的单帧、人物、场景、动作、品牌、关键词和情感等”,国内某流媒体平台技术负责人表示,“与此同时,其用户行为预测功能将通过互动数据,构建用户配置文件,为内容推荐引擎、个性化内容消费、商业化内容定位和自动化生产内容提供信息”。

  格式转换、压缩技术已经变成一键化。程序生产内容有许多不同的格式,因此需要通过技术完成它们之间的转换,适用环境如:将以每秒24帧拍摄的电影图像与每秒60场之间进行插值、重新扫描525线线图像、从一种扫描速率转换为另一种扫描速率时的运动补偿、在一种颜色系统和另一种颜色系统之间转换以及数字化遭受颗粒和划痕损坏的电影。在生产和交付过程中有效使用通信链接和存储介质的重要性意味着图像压缩已引起越来越多的关注。

  在商业表现力上,计算机视觉技术对于广告点位扫码及连续帧的广告插入已经表现成熟。比如在观看足球比赛、赛车或综艺节目之类的赞助活动时,可以完成在视频场景中寻找到合适场景,并与广告流无缝对接。技术领导者如法国的Matra Datavision、以色列的Orad、美国的VDI、国内的影谱科技Moviebook,提供了图像处理实时替换或植入此类工作流的系统,由此产生的额外广告收入已成为电视及流媒体平台的一个重要业务组合。

  互动、个性化技术的普及,让个性化内容的在2019年集中爆发。技术领导者正在探索基于AI和机器学习技术解决方案——超越当下的推荐引擎(内容分发引擎),形成内容体验为核心的高度个性化,如互动剧、AI定向生产的内容场景,甚至是定制生成的角色、虚拟主持人及角色等。如影谱科技推出的虚拟主播技术方案可以实现图像和合成字符交互,在时间、空间上对齐二者并及时进行同步。诸如此类的交互式应用,不仅应用于传媒娱乐业,在教育与VR产业的渗透率更为突出。

TOP