5G时代视觉传播的智能化突破与发展空间
■谭汪洋
【本文提要】5G是移动通信技术发展的重要拐点,撬动了包括VR、智能搜索、精细配置服务等领域视觉传播的新发展,开启了大规模智能视觉的商业运用。人脸识别、图片识别与生成、文字识别、物体监控分析等应用,在智能算法的推动下不断提升,工业和医疗领域关键任务型的视觉传播在5G传输条件下将取得新的突破。本文围绕5G技术推动下的视觉传播变革与智能化突破,针对上述新发展予以分析。
【关键词】5G 智能视觉 应用领域 市场空间
【中图分类号】G201
5G不仅是移动通信技术的新发展,更带动了网络技术应用场景的重大变革。这项技术与云计算、人工智能、虚拟现实等交织在一起,共同驱动了以智能化为标志的新型信息技术革命。在这场革命中,视觉信息传播得到了极为充分的拓展,尤其值得关注。其中,最为突出的是视觉信息的智能化发展,包括图像和视频信息的智能搜索、精细配置、流媒体信息的AI辅助等。5G为讨论多年的智能化娱乐场景提供了真正落地的可能,不仅激发了高质量的视觉信息需求,而且在视觉内容的生产、管理、传播和分发领域带来新的发展机遇。
根据中国互联网络信息中心(CNNIC)发布的第43次《中国互联网络发展状况统计报告》,截至2018年12月,网络视频、网络音乐和网络游戏的用户规模分别为6.12亿、5.76亿和4.84亿,使用率分别为73.9%、69.5%和58.4%。短视频用户规模达6.48亿,用户使用率为78.2%。①这项数据再次显示,在移动通信领域,视觉传播将成为移动互联网未来发展的重点领域。5G技术的出现,恰如其时地解决了原本掣肘增强视频发展的大宽带需求,带动了视觉传播的新一轮红利释放,并将推动视觉传播向生产生活领域的深度渗透。
一、文献综述
全球范围内5G部署以来,关于5G的研究已经成为一个热点议题。鉴于其突出的技术依赖特性,研究大多集中在科学领域,尤以电信技术、信息经济为主,并广泛涉及中医药学、环境科学、生物学、工业制造、计算机、建筑科学、汽车工业等领域。②从CNKI论文的学科分布来看,信息科技领域的论文占到97%,而社会科学领域只占0.5%。对5G的研究集中在技术领域,通过关键词聚类,可以看到其中较为集中的关键词包括“移动通信系统”、“信道容量”、“异构网络”、“多址接入”、“延时要求”、“译码过程”、“下一代移动通信”等。对这一热点的研究分析显示,5G在基础技术研究领域已经引起巨大的关注,但是在人文社科领域还较少得到研究。
在新闻传播的研究方面,关注点集中在5G时代的媒体变革③以及对传统媒体的影响方面,研究者普遍认为5G给传媒业的内容生产带来了新的机遇和挑战,④给主流媒体的融合带来新的可能性,⑤尤其给智慧广电带来新的契机。⑥总体上看,新闻传播领域对5G的关注和研究还较少,且多为单一现象的阐释和简单分析。本文从视觉传播所关联的领域出发,结合具体的技术推进,对5G时代的视觉传播突破与发展予以探讨。
二、5G是移动通信技术发展的重要拐点
相比4G技术来看,5G拥有更高性能的传输能力和更低的运营成本,面向的是增强型移动宽带、海量机器类通信、高可靠低时延通信三类应用场景。⑦这对移动终端流量的供给、音视频内容的场景拓展,以及高清高速低延时的内容体验提供了实现的可能性。有研究认为,未来5G将在三个阶段逐步释放技术红利:第一阶段(2019-2020):以移动视频、虚拟现实/增强现实(AR/VR)、无人机等应用为主,网络需满足大带宽需求。增强视频、AR/VR等创新应用引领5G发展,eMBB成为5G初期首选应用场景。第二阶段(2020-2025):以智能机器人、车联网等应用为主,网络需满足低时延、大带宽需求。第三阶段(2025-):各应用智能化、规模化,网络需满足大连接、低时延、大带宽需求。⑧
从根本上说,5G是以移动带宽的飞跃带动超高流量密度的新型应用和移动特征的场景普及。参照3G和4G时代的互联网发展历程,5G兴起的基本模式为:出现5G统治级平台,带动内容市场的新一轮繁荣;各个移动终端的操作系统升级或者换代,平台生态得以完善;受众追捧的爆款应用出现,开启5G对特定领域的行业重构;以5G为依托的内容与应用继而繁荣。
从平台和软件的发展趋势来看,必须要经历5G系统平台的标准化过程,从而完成统治级系统平台的生态需求,这些平台不仅能够满足既有应用的增速和增量需求,亦能够促进新的产业增长点。在平台所激发的内容大繁荣下,传媒行业也将再次面临重构。
三、5G撬动下的视觉传播新领域
尽管移动性和视觉化已成为网络传播的重要特征,但需要指出的是,在4G之前的网络传输能力下,移动视频并没能做到通畅、无障碍的传播,尤其是对高质量、沉浸式的视觉内容的需求,大多还停留在理念层面。5G网络架构的服务能力,在社会信息化和视觉集成领域起到了积极的作用,撬动了移动VR、体感交互、智能搜索、精细配置、个人辅助AI等领域新的提升。
(一)移动带宽传输能力带动VR新机遇
前几年,VR曾经是一个电子业的热点,受到不少企业的追捧。但VR业务发展至今,仍是以体验为主。尽管市场上充斥了各种VR眼镜等体验设备,但其发展很快就遇到瓶颈,甚至成为一个几乎被市场淘汰的新技术。这其中存在产品质量参差不齐,劣质产品充斥市场的原因,但更多的是网络传输的限制。由于VR具有多感知的表现形式,涉及视觉、听觉、触觉多方面的实现,对网络传输能力的要求也更高。
VR要求画面的真实感,强调全视角的画面,因此分辨率是影响VR体验的最关键因素。并且随着分辨率的提升,图像的色彩饱和度等方面也会影响画面的真实度。市场上流行的VR比较普遍的是全视角的4K,但这是不够的。只有达到8K的分辨率后,才可以达到电视的标清水平。⑨即便是入门级的VR体验,8K的分辨率也是最低的要求。从带宽要求看,全视角传输的入门级要求需在100兆以上,而真正达到VR的体验,则需要300-400兆,极致体验要求更高。因此,VR从4K到8K甚至24K的全视角画面,其传输数据量将是指数级的增长,既有的3G、4G网络无法满足良好视觉体验的需求。
5G网络架构的高宽带和灵活服务能力,使得VR这类原本受限于网络传输瓶颈的业务获得突破,为VR在各行各业的集成应用做了铺垫。5G的核心技术支持移动宽带增强、低功耗大连接和高可靠低时延三类应用场景,其关键性能指标使宽带速率大大提升。5G空口技术支持20Gbit/s的峰值速率和100Mbit/s的用户接入速率,其移动宽带增强场景下支持空口双向还回时延小于8毫秒。像VR这种对宽带传输速率高度依赖的应用,在未来的5G环境下,将获得新一轮的发展。可以预见,在VR出现早期就展现的沉浸式VR观影和游戏设想,在5G环境下将得以实现,更多的VR技术将被应用于影视节目制作,云存储与VR将进一步结合,家庭娱乐的体验感将大大提升。
(二)智能搜索的资源需求得以实现
在互联网信息极大丰富,应用领域多重叠加的今天,计算机信息搜索的效能也迅速提升。在信息时代,搜索功能直接影响到现实世界中人的反馈。正如百度副总裁、AI技术平台体系(AIG)总负责人王海峰所说,“互联网很大程度是真实世界的一个镜像,而搜索引擎又是互联网的一个镜像,所以,搜索引擎很大程度上成了真实世界的镜像”。⑩与早期基于关键词索引的搜索引擎不同,智能搜索不仅能够在获取关键词后去索引库匹配答案,而且能够在了解用户的需求后,进一步提供相关的信息和服务。智能搜索可以根据用户请求,从网络资源中检索出相关的信息,并根据人性化的特征,将最具价值的内容提供给用户。换言之,智能搜索能够集各种搜索引擎的搜索结果于一体,迅速高效地提供给用户。
从涉及领域来看,智能搜索涵盖了智能交互、语义搜索、智能匹配和智能决策,其搜索特性具有交互性、个性化、数据闭环等特点。智能搜索更能够满足精细化、个性化的需求,针对实时计算、在线学习、多目标学习、多场景联合优化、多模信息融合等问题具有更好的性能。5G网络为智能搜索提供了资源,尤其是针对移动信息开展的搜索服务,能够针对移动用户的信息进行实时采集和分析,结合特定的信息获取情境和行为特征,为移动用户提供个性化定制、精准的信息内容和高质量的服务。5G支撑智能搜索潜在需求的信息资源,能够判断用户隐性知识并形成知识交互,在智能算法不断进步的背景下,深层次挖掘多源信息内容,融合成用户需要的高价值信息。
从视觉传播的搜索领域来看,5G技术为图像、图形和视频信息流的智能搜索提供了可能。随着神经网络、深度学习等算法广泛应用于图像识别,计算机对图形和视频的辨识能力得到极大提升,但由于图像和视频本身的特点,针对大量图像、视频的搜索需要耗费很多计算机资源,因而时间效率提升就成为一个技术难题。5G的出现对这部分信息的传输效率产生了突破性的影响,实时图像视频的智能搜索与应用将成为下一阶段的重要社会应用。
(三)5G智慧定位与超快传感技术下的精细配置服务提升
近年来传感技术的迅速发展和广泛应用,促使信息服务朝精细化方向发展。随着大数据的兴起和发展,对用户行为轨迹的记录和相关行为的分析被应用于了解使用者对不同业务类型的偏好、用户社会网络关系等方面。通过大范围采集用户的行为和轨迹数据,进而为网络配置设备提供精细化的指导。5G时代的精细化服务是在4G的基础上,进一步深化,及时反馈移动用户行为并准确上传,从而通过连续性、广泛的信息服务提供和反馈系统,使移动服务端可以根据用户动态及时更新信息资源,完成精细化的配置。
精细化配置服务需要两个基本条件,其一是高传输速率的网络条件,其二是具有强视觉特征的体感交互应用。这项技术不需要借助任何控制设备,能够通过肢体与周围数字设备产生交互环境。从技术依托上说,体感交互包括光学感测、惯性感测和光学联合感测;其应用主要包括:面部识别、手势识别、虹膜识别、动作捕捉等,无论哪一个体感技术,都需要高传输效率的网络条件。5G的超快传输速率恰好能够满足这些需求,通过体感交互技术为用户定制动态标签,实现个性化的定制服务。
可以预见,感测感应技术和网络速率的结合,将推动这些原本需要借助无线传输才能实现的功能得以落地。当可穿戴设备更加成熟之后,借助云端服务器的有效利用,在医疗健康、健身运动、公共安全领域都会迎来大范围的使用。精细配置的一个应用体现是智慧定位。有研究者指出,5G智慧定位服务分为两个方面:一是指通过相应技术手段形成空间定位体系,使移动用户在移动端精准掌握实体资源位置信息,包括定位信息、实体概况、空间向导等;二是指根据用户显性和隐性知识的位置信息,及时准确地给用户提供满足其信息需求的资源位置。智慧定位服务可动态追踪移动用户行为和心理上的位置信息,满足用户行为特征和心理特征的位置需求。[11]与之相应的是计算机视觉、多维建模、体感识别、实时定位等信息服务,当应用了智能算法之后,对GPU、CPU、网络传输速率的要求都更高,各项应用对云服务的需求还将扩大,这些都要求具备5G环境。
(四)5G时代电视直播将全面向互联网转移
5G技术所解决的网络传输速率问题,将一步解决4G时代视频播放不流畅的问题,尤其将带动移动视频的大规模普及。这项服务不仅仅限于抖音等短视频和直播应用,而且将直接推动影视长视频、在线课程学习、在线新闻直播的受众观看行为,再度改变人们的生活方式和学习方式。
传统媒体时代,人们回到家打开电视的生活习惯,创造了新闻联播和晚间电视剧的收视高峰。然而,随着移动互联网的普及,人们对手机和电脑的依赖将电视从生活中逐渐剥离出去,即便曾经辉煌的新闻联播,收视率也大大下降。这一方面是由于互联网上的丰富信息将公众的注意力转移出去,另一方面也因为电视直播观看的便利性不佳,网络播放不流畅、观感体验不好。5G技术完全可以解决这一问题,能够将公众的部分注意力再转回到电视直播节目上,但不再需要电视网。这就意味着5G时代之后的媒体融合,将在信息传输渠道上全面向互联网转移,但传统媒体并不会因此瓦解,原生原创的优质节目需求量更大,5G的发展将为长期以来媒体融合该由谁融合谁的问题指出方向。
四、5G驱动大规模智能视觉的商业应用
从更宽泛的意义上看,5G网络撬动的不仅是视觉传播的新领域,而且对各行各业的产业增值都具有不可忽视的推动作用。仅就5G带宽所带动的网络传输速率提升,亚马逊的网络延迟每增加0.4秒,全年的损失达到16亿,雅虎每增加400毫秒的延迟,就可以增加9%的流量;腾讯每年花20亿租用运营商线路,但链路利用率低于30%。这类实时性需求很高的业务,就需要网络能够根据实际情况,动态、快速调配网络资源。受到4G网络传输速率的限制,在移动信息服务中还很难真正使用机器学习技术,5G之后,机器学习将在移动信息服务中得以融入。
5G网络依托SDN架构,同时引入了大规模天线、高频通信、新型多址接入、新型多载波、增强调制与编码等多种技术,实现了用户面与控制面板的分离,通过“切片”的方式,大大降低了网络延时。谷歌在2009年就开始研究这项技术,2013年解密的B4网络采用SDN架构将链路利用率从30%提高到95%,被视作迄今最成功的SDN案例。5G环境下,智能运算将大规模应用于视觉领域,对视觉内容生产、传播和更多元化的应用产生影响。
(一)智能服务被应用于多维视觉服务
作为人工智能三大领域之一的计算机视觉在最近几年发展迅速,视觉处理的加速发展一方面有赖于计算机性能的大幅度提升,另一方面也离不开能够快速传输的高性能网络。通俗地说,就是研究机器如何“看”的问题,比如用摄像机和电子设备代替人眼对目标进行识别、跟踪和测量,并进一步进行图形和图像的处理、分析、合成等。作为一个以“感知”为目标的应用领域,智能化的需求是促进其通过图形和图像的计算来理解周围世界,从而提升自适应的能力。目前,计算机视觉的主要应用领域包括:三维图像视觉、图片识别分析、人脸识别、文字识别、视频/监控分析、图像及视频编辑、工业视觉检测、医疗影像检测、驾驶辅助等。
智能视觉分析的工作原理是,通过将场景中背景和目标分离进而分析并追踪场景内目标。作为一个新兴领域,智能视觉被广泛看好。在我国,2010年之后,专注于智能视觉的公司逐渐兴起,将图像识别、模态识别、动作捕捉等智能分析应用于体育训练、医疗诊断、虚拟现实以及机器人等领域。在一线大城市,人脸识别、文字识别、人体识别、车辆识别、物体识别、图像处理等技术在金融、移动互联网、安防监控等领域已取得了较为广泛的应用,通过在银联、京东、华为、小米、科大讯飞等行业深度应用,推动产品智能升级和多维视觉服务。
在智能视觉的多维服务应用中,最热门的领域包括:1.人脸识别,其应用场景涵盖人脸属性认知、人脸检测跟踪、人脸对比、人脸搜索、人脸关键点定位等,目前已经具备大规模商业应用的条件,广泛用于司法、公安、边检、政府、金融、教育、医疗、工厂、电力、航天等行业。2.物体监控分析,其应用场景涉及人群密度与车流密度分析、行为跟踪及属性分析、商品智能识别等,尤其在交通控制和安全预警领域有着丰富的应用。3.图片识别与生成,其应用场景包括物体和场景识别、商品属性识别、以图搜图、图像智能创作等,谷歌在2016年举行了一场“人工智能作家”的画展。通过一个叫“DeepDream”的神经网络生成器,利用计算机自动生成艺术作品。此后,基于算法的图像生成受到视觉领域诸多公司的青睐。4.文字识别,针对现实中大量以图片形式存在的文本,OCR技术刷新了互联网领域文字识别的应用场景,在当前的自然语言处理领域,针对图像中文字识别的算法性能不断提升,谷歌、微软、百度等公司亦有专门的研究团队针对这一任务开展研究。
(二)关键任务型的视觉传播
现代社会物联网部署越来越密集,用于农业、物流、智慧城市、智慧家庭等领域的传感器部署非常密集,但对移动性和延时性的要求相对较低。5G技术带来的超低延时性和高可靠性,则满足了车联网、自动工厂、远程医疗等关键任务型应用的视觉传播需求。
比如,在工业视觉检测中,机器视觉能够迅速获取大量信息,并应用于工作流程监看、产品检验和质量控制各个环节的自动化生产过程。其工作原理是摄像机和智能视频处理器可被嵌入工业系统,一旦在目标场景中出现违反预定规则的行为,系统即可发出预警信息。当视觉分析技术植入系统之后,即可对关键任务中的相关场景和系统做出反馈。这项技术可被应用于一些高危工作环境,以及大批量生产过程中仅仅依靠人工难以完成的环节,其应用能够提高工业生产的效率和自动化程度。
又如,在近年来处于发展前沿的医疗影像领域,视觉智能被赋予更高的期待。
医疗数据中有超过 90% 的数据来自医疗影像,该领域有孕育深度学习的海量数据。对这些数据的有效利用将能够帮助医生提高诊疗效率,更重要的是可以突破原本仅靠传统医疗方法无法突破的难题。由于远程医疗对图像传输有着特殊的要求,而目前的4G网络又远远达不到标准,因此其建设和推广并没有得到实质性的进展。最基本地看,远程就诊需要1080P,30FPS以上的实时视频要求,过低的视频质量及图片质量导致医生难以辨清病情。5G的传输速率,让实时影像传输和诊断成为可能,把远程诊疗提升到新的高度。此外,5G与医疗影像技术的结合,还大大提高了急救通讯系统的工作效率。CT、X射线扫描仪等医疗影像仪器,不仅可以被运用到救护车的院前急救中,还可以搭载高速率传输的人工智能系统,辅助医生判断患者病情,能够在一定程度上缓解急救压力。[12]
五、5G驱动下视觉传播的软硬件市场空间
全球范围内各国的5G推进计划显示,2020年预期实现全面的商业化应用。《中国5G产业发展前景预测与产业链投资机会分析报告》数据显示,按2020年5G正式商用算起,中国预期将带动约4840亿元的直接产出和1.2万亿元的间接产出,到2030年5G带动的直接产出和间接产出将分别达到6.3万亿和10.6万亿元。[13]这其中,智能视觉产业将成为重要的市场驱动。
据国外咨询机构Automated Imaging Association研究预测,2016年全球机器视觉市场规模约为46亿美元,渗透率仅为5%,全球智能视觉潜在市场规模可达1200亿美元;预计到2020年全球市场规模将达到125亿美元,2016-2020年全球机器视觉市场规模将以年复合增速9.1%的速度增长,其中中国机器视觉产业发展速度快,2016-2020年中国制造有望促使智能视觉维持20%的增长率,预计到2020年中国市场规模将达到152亿元。[14]5G技术给视觉领域带来的最大贡献是,突破了网络层面对视觉技术的限制,同时智能视觉终端的硬件和配套算法也在不断进步。智能视觉已形成集硬件与算法于一体的产业链,其上游包括GPU、FPGA等芯片硬件、图像采集卡和基础算法,中游是具体从事硬件集成与软件开发的视觉技术提供商,下游则是涵盖了工业应用、安防治理、金融行业等的视觉场景应用层。在我国现有的智能视觉产业结构中,生物特征识别技术、光学字符识别技术、物体与场景识别技术、视频对象提取与分析技术等中游产业占据了市场主体。[15]但有意思的是,上游产业中芯片硬件与基础算法形成了相辅相成的推动关系。一方面,硬件的完善使得基础算法的实现成为可能,另一方面,基础算法也推动芯片技术不断提升和发展。涉及图像识别和处理的智能算法,都需求较高级别的GPU芯片,随着个人层面的算法应用,芯片市场还将进一步拓展。
我国目前排名靠前的智能视觉公司集中于中游的人脸识别方案,落地场景也以安防、广告和金融居多,工业控制和应用领域较少,且业务多集中于硬件和软件系统集成。从现有市场格局来看,除人脸识别之外的无人驾驶、AR/VR、服务机器人都是未来智能视觉下游布局的重点。从数量上看,中国市场上工业视觉企业数量以每年20%左右的数量增加。GGII 2016 年的调研显示,我国工业视觉前20公司营收约占中国整体市场规模的37%左右,其中底层开发是价值量最高的部分,核心软硬件成本占据工业视觉总成本80%。此外,关键任务领域的智能视觉市场增速可观。有数据显示,到2022 年全球车载传感器市场规模预计将达到 23.8 亿美元,年复合增长率 14%,其中视觉传感器市场年复合增长达到24%。
我国制造业种类多样,在5G技术的驱动下,各行业对智能视觉的需求将日益增多,并有着显著的差异化,从市场布局来看,该领域的集成应用还有巨大的市场空间。5G结合大数据和人工智能,将持续推动视觉领域芯片的集成度和专业化、智能视觉系统的云端一体化,以及视觉算法的深度运用。■
①《互联网娱乐进入规范发展轨道,短视频用户使用率近八成》,中国网信网2019年2月28日,http://www.cac.gov.cn/2019-02/28/c_1124172224.htm
②参见2015-2019年以“5G”为关键词的CNKI文献检索结果,检索时间2019年5月6日。
③匡文波:《5G:传媒业变革的催化剂》,《中国报业》2019年第7期;宋美杰:《万物皆媒:5G时代的媒介变革与创新》,《中国报业》2019年第7期
④喻国明:《5G时代传媒发展的机遇和要义》,《新闻与写作》2019年第3期
⑤周文韬、孙志男:《5G背景下主流媒体融合转型的可能性分析》,《新闻战线》2019年第3期
⑥翁之颢:《5G时代的广电业态图景展望》,《视听界》2019年第1期;孙少怡:《广电网络如何应对5 G时代挑战》,《中国有线电视》2018年第12期
⑦黄陈横:《3GPP 5G NR物理层关键技术综述》,《移动通信》2018年第10期
⑧何建、苏小文、陈伟:《5G网络的运营商部署策略探讨》,《移动通信》2019年第9期
⑨包孝东:《VR潜力巨大,但需要更好的网络传输技术去支持》,http://www.sohu.com/a/203539578_99972665
⑩《智能搜索时代:且看知识的力量》, http://baijiahao.baidu.com/s?id=1598439941574842768&wfr=spider&for=pc
[11]储节旺、汪敏:《5G环境下移动信息服务创新初探》,《情报理论与实践》2019年第42期
[12]36Kr:《5G时代,医疗“黑科技”就在身边》,2018年6月14日,https://36kr.com/p/5138858
[13]前瞻产业研究院:《中国5G产业发展前景预测与产业链投资机会分析》,搜狐科技2018年7月1日,http://www.sohu.com/a/238678309_611443
[14]陈运红:《5G时代下的智能视觉机遇之二》,华尔街见闻2019年4月30日,https://wallstreetcn.com/articles/3521632
[15]陈运红:《5G时代下的智能视觉机遇之二》,华尔街见闻2019年4月30日,https://wallstreetcn.com/articles/3521632
谭汪洋系东莞市行政学院副教授、武汉大学新闻与传播学院博士研究生。