2022年注定是体育超级大年,冬奥、亚运会、大运会、世界杯等各类大型体育赛事应接不暇。随之而来便是各类赛事直播,客户对直播服务要求变得越来越高,视频直播技术创新显得格外重要。如何利用直播技术创新降低线下部署导播台的成本、如何提供灵活及场景化的能力、如何确保线上内容传输安全稳定,成为许多企业客户关心的问题。
为更好服务客户,阿里云对视频直播进行了重磅功能升级,打造一站式沉浸体验云上虚拟直播间服务,提供在传输处理云上直播高可靠、冗余设计等端到端一站式的能力,为大型赛事或活动保提供保驾护航的能力。
阿里云视频直播产品服务原理
阿里云视频直播服务是基于领先的内容接入与分发网络和大规模分布式实时视频处理技术打造的音视频直播平台,提供易接入、低延迟、高并发、高清流畅的音视频直播服务。
首先,在直播生产端提供了推流端SDK,再通过边缘节点将流收入到直播中心。阿里云在全球拥有九大直播中心,支持云导播、转码、录制等场景化的功能。同时,在分发侧基于边缘节点可将内容分发到全球以及支持多端多平台的播放器。
阿里云视频直播的主要优势有:
1、低延迟、高并发
依托遍布全球的2800多个CDN节点以及150 TB商用带宽能力,阿里云视频直播服务能够保证赛事画面从源头稳定分发到终端。在分发侧,基于UDP协议的超低延迟直播RTS能够将端到端延时降低在1秒内,精彩直播画面提前获取,同时也支持SRT、LL-HLS等低延时协议,满足不同的场景需求。
2、高清、流畅
基于阿里云自研的窄带高清转码技术,实现视频画质提升,降低传输码率,节省带宽成本,最终提升整体视频画面分发效率。阿里云视频直播服务还提供面向不同场景的转码方案,例如,赛事场景中基于深度学习的智能插帧算法,可提升视频帧率,从而提高整个视频的流畅性。
3、端到端、场景化
提供了直播从生产端到云端管理,再到分发播放的全链路能力。云端丰富的场景化功能,如录制、截图、识别等功能,可满足不同场景下的需求,极大降低了企业开发门槛,助力业务快速上线。
本次发布分为两块内容:
一、虚拟直播间。提供了行业首创全链路云端实景抠像与虚拟背景合成能力,专门为远程互动打造,实现虚拟直播间的沉浸式体验,为远程制作、异地互动直播的场景提供解决方案。
二、直播重保。基于阿里云多年直播最佳实践经验为客户提供全方位技术支持和咨询服务。利用边缘推流、窄带高清转码、云上导播、全域边缘节点分发等技术能力,通过全链路灾备与应急预案等保障手段,为重要活动、体育赛事、演唱会等大型在线直播场景提供高可靠、高品质、低延时的直播服务。
虚拟直播间 让直播服务能力提升
云端互动虚拟演播室为远程采访、异地互动、虚拟实时制作等场景打造富有沉浸感的演播体验,达到专业广电级导播效果,并已成功应用在各类大型赛事直播场景中。通过云端的多路实时实景抠像、虚拟背景生成与实时动态渲染技术,有效解决了主播与嘉宾不在同一空间,以及现场环境受限无法进行专业演播的痛点。将身处在不同地方的人合成到任意演播厅,即便身处千里之外,也能透过虚拟演播技术,体验沉浸于同一空间的互动感。
目前,演播厅常用的抠图技术大多跟绿幕抠图相关。但绿幕抠图存在几个弊端:首先要专门搭建绿幕演播室或者是绿幕设备,应用场景受限;同时,为了保证绿幕抠图的最佳效果,还需要加装灯光设备进行调试,甚至需要有拍摄经验或操作者进行提前的布景。
而阿里云利用AI技术创新对虚拟演播厅的技术方案进行了全面的升级,打磨出了全新实景抠像算法和引擎能力。首次采用了实景预设背景抠像、多机位切换 实时抠像、最高6路抠像源 抠像合成处理等技术方案。为了对标广电级别的节目规格,阿里云视频技术团队还尝试了多种的算法以及工程模型,提升实景抠像的效果以及长时间直播的稳定性能,将实景抠像的效果提升行业领先的水平。因此,在各种采访环境不可控的杂乱背景下,阿里云虚拟演播厅技术均可以处理实现最佳的成像效果。
阿里云还打通了音视频通信RTC以及全球音视频实时传输网络GRTN,将多机位、多视角同步直播的技术能力与RTC实时连麦、异地开播等能力进行结合,为用户提供了简单稳定的连线功能,真正的实现了互动虚拟演播的能力。
从去年至今,互动虚拟演播厅技术方案已被广泛应用到国内各类赛事活动直播中,打造了多场沉浸式的直播报道。而这一新技术的运用也打破了传统的电视台记者的采访形式,即无需要记者再携带摄像团队以及沉重的设备到处奔波,更无需以往一定要把记者与受访者设置于同一环境的固有模式。通过互动虚拟演播厅采访任务仅需要两部手机加一台电脑,即可以随时随地的展开直播与转播,同时也让观众们可以在第一时间体验到了更具有沉浸感的播报视感。
互动虚拟演播厅技术能力升级概括总结如下:
第一,对实景抠像打造出了新的算法引擎和极致的效果,解决了实景扣像边缘粗糙、抖动等问题,并且抠像效果精细到了人物画质真实细腻的效果,也促进了产品的可应用性,打破了行业实景抠像的壁垒;
第二,丰富了业务侧的接入能力,实现了实时互动 导播的完整方案,打造出了实时互动的场景。通过手机APP,既可以简单便捷的开播,让使用门槛大幅度降低;
第三,全面升级了云导播的稳定性,包括超长时间连麦的稳定性、抠像的稳定性、音视频互动、APP性能、全方位的满足异地多人多场景以及超长时间的连麦和直播需求。对于复杂的多场景,比如单人切换、双人远景切换、近景直播中插入电片广告等,实现了无线无缝的切换,真正的达到了广电级级别的节目制作水准。
这一次全面的技术升级,也是将之前的虚拟演播厅升级为具有实时互动、沉浸效果体验的互动虚拟演播厅。产品方案也为各类业务和行业带来了直播报道的全新体验。从实际的应用场景上来看,互动虚拟演播厅不仅高度契合体育竞技国内外赛事类的现场转播,远程直播、多主持人解说模式等场景,还可以应用于各类行业转播。
同时,云导播进行了全面的服务升级和易用性的改造,接入门槛极大的降低。通过轻量化服务的技术方案的实现,大大的拓展了该技术的应用场景。接入方式不仅支持从RTC的服务自动获取直播间在线流,还支持手机、相机、摄像机等多种设备的推流。录制视频,或者直接输入直播UIL等方式,并且通过自动的智能的抠像与背景的合成渲染输出直播流。在直播的过程中,还可以结合直播内容,可以实时的切换场景,切换脚本,插入广告或者VCR小片,添加图文包装效果,并进行监听、监播和调音、混音等操作互动。
虚拟演播厅也提供了多种产品使用方案。在阿里云登录直播控制台,即可以开箱即用可视化的配置和开播,可以实时的制作播出监看,调整直播内容。本地与线上一键同步,无需开发介入,适合各种运营和业务团队的使用。此外,还可以基于完善的API服务,按需调用封装自己的直播业务系统。云导播还提供了带有控制台前端页面的完整web SDK,可以直接嵌套集成,节省开发成本,帮助提供整套直播解决方案。
目前阿里云导播台支持最多12路的输入源,同时六路的抠像合成,支持自定义的背景图,支持对于抠像对象的位置和大小直接进行拖拽设置,支持只保留音频的监听模式,支持布局图层顺序调整,只需要通过简单的两三步配置即可完成快速开播。同时,图文包装、知识、素材样式、位置以及投放逻辑的实时编写和设定实时字幕。结合达摩院的ASR语音转文本和实时翻译的能力,支持多语种的双向实时互译。同时结合上字幕包装的效果,可以很轻松的完美的呈现一场精彩的直播。
专业直播重保 让直播服务更稳
随着直播用户增长,各平台都开始精细化运营,保证百万量级以上并发直播活动的高可靠、高品质、商业化探索是各直播平台急需解决的问题。
首先阿里云的资源储备是非常充足的。阿里云拥有遍布全球2800 CDN节点,150 T带宽,9大直播中心,支持海外业务无缝布局,通过阿里云搭建的全球实时音视频通信网(GRTN),全世界各地的直播流可实现就近接入,通过高速通道快速传输至指定直播中心进行内容分发。
对于客户来说,需要根据自身业务场景选择合适的协议进行推流和播放。以下列举阿里云视频直播支持主要5类直播协议,直播延时由低到高。延时指的是一个能够稳定流畅播放所测出的数据。不同协议的技术成本存在差异,简单讲就是延迟越低成本越高。之前比较流行的直播协议是RTMP、FLV、HLS,现在都慢慢转向RTS和LL-HLS。
在协议选择完成后,还需要对视频参数进行响应选择。推流播放端推流的话,有的是通过客户端推流,就是客户端比较重要。比如说传媒类的,可能是用流媒体服务器作为推流端,或者作为源站进行一个拉流,然后最终的播放可能用系统播放器或者定制播放器。因此需要根据自己的一个实际情况来进行选择。如果是像RTS和LL-HLS这种进阶的协议的话,基本上是要定制的播放器的。
帧率的选择,对于不是很重要的内容的,有些会选择15帧。但最为常见的是25帧,这是通用的一个帧率,能够保证相对的画面流畅。对于体育赛事这种要求要求极致流畅的,可能会采用50帧或60帧。编码格式一般选择是H.264和H.265。分辨率不是越大越好。在码率和成本固定的情况下,分辨率越变越大,整个客观质量有可能会下降。码率越大,也会带来其他问题。比如卡顿率会提升,成本会提升,但是它画质的提升其实存在码率变大后提升效果越来越小的情况。一般720P的话是1到3M左右。画面简单就1M,画面复杂可能就2到3M,根据实际情况可以实测。
阿里云直播重保方案包含全链路稳定方案、全链路防盗链方案、千万级并发调度方案、全链路监控方案、全量链路监控方案。
如果是普通流,左边有个直播源,无论是原站拉流的方式,还是推流推流的方式,到阿里云直播中心处理之后,CDN分发就一路。这是最普通的一个流。对于一个重要的直播活动,为了保证前面推流或者源站的一个高可用稳定,推荐使用两个推流端,分两路推到直播中心,直播中心做一次合成,合成之后再进行处理转码进行分发,避免推流端的单点风险以及推流网络单点风险。如果这个活动是非常重要,不在乎成本的,建议客户这边有两个推流端,同时推到不同直播重心,双中心各自合流形成主备。
视频直播支持访问控制,如Refer UA黑白名单、IP黑白名单等,可以做到基础的防护,但是伪造比较容易。
支持URL防盗链,标准鉴权和自定义算法都是通过算法加密,伪造困难,但是无法防止复制已经加密的URL进行播放,把URL发布到社交平台或者盗链网站,直接能播放。
支持通用二次鉴权和业务方的远程鉴权,前者可以通过限制相同加密url的访问频次来限制复制URL的行为,后者是完全由业务的业务中心来判断请求是否合法,可以更加灵活的控制和分析。
更进一步是视频加密,直播视频加密是云端一体的视频加密解决方案,支持行业通用DRM加密,支持多终端、多平台、全方位进行版权保护。该加密方法拥有独立加密密钥,避免单一密钥泄密引起大范围的安全问题,支持加密转码 解密播放,动态密钥管理更安全地保护视频资源,可有效防止视频泄露和盗链问题。数字水印技术在直播视频中应用,实现大型赛事直播版权视频内容搬运侵权的取证、溯源和追责。
对于这种千万级并发的直播带宽抖动是非常大的。以往年世界杯直播为例,上下半场之间有中场休息时间,画面比较简单,通过阿里云的窄带高清技术在进行传输时带宽只有峰值的三分之一或四分之一,当下半场开始时,大量用户快速涌入直播间,带宽瞬间回到峰值。短短一分钟内,带宽增长几个T或十几个T。这样场景下的调度风险是非常大的。
如何来规避这个风险呢?调度方式有三种:DNS调度、302调度,HTTPDNS调度。从接入的方便性来说的话,DNS调度是最容易的,这是广泛应用于互联网的一种调度,但缺点是反应非常慢。比较快的是302调度,但仅限于HTTP的协议,并且影响首屏。但综合起来最好的是HTTPDNS调度,它反应速度非常快,而且也不存在那个首屏的影响,需要客户端这些做一些接入。同时,阿里云还会提前智能预测需要带宽趋势,提前分配好资源,做好大型活动赛事优先级保障,能够非常有效的防止T级带宽突发带来的风险。
在护航过程中,会有专人在后台提供全程服务保障以及全链路服务监控。从推流开始到最终播放的整个链路的情况,包括帧率、码率以及全网带宽压力情况。针对特别重大活动,阿里云还会定制一个类似右侧一样的大屏。对于每一路直播流,都会用红绿灯的方式去显示它的通断情况,并且把它排在一起看,这样能够迅速的发现哪一路流出现问题。具体某一路流也可以去具体的看帧率、码率以及在线的用户数。全链路上有每一个设备的性能状况,便于直播活动中问题排查。
用户如希望看到一些视频直播数据信息,阿里云可以提供一个新的产品叫做广目系统。广播系统把客户这边直播的几路直播,无论是原始流,或者是转码,流合并成一路监控流进行监控。整个监控可以分成四屏、八屏、十二屏来实现一个盯屏画面。可以实时的在看板数据化的显示它的帧率、码率、音柱这些信息。如果帧率抖动,码率异常,以及音视频的同步异常,卡顿这种情况出现的时候,直接会进行实时的报警。
原文链接:
click.aliyun/m/1000337916/
本文为阿里云原创内容,未经允许不得转载。