(原标题:赋能商业新价值 AI技术在视频直播与远程会议中的应用与创新)
伴随着新冠疫情带来的线上直播热潮,众多线下难以开展的企业营销活动及会议活动纷纷则尝试使用企业直播服务,视频直播与视频会议越来越成为各行各业不可或缺的业务运营基础工具,并逐渐转变为常态化需求。据统计,在疫情期间,超过60%的企业线下活动搬到了线上。
在疫情催化、5G、AI技术等以及平台布局推动下,企业直播服务市场将进入高速发展期。在中国经济发展步入新常态的情况下,数字经济发展速度不断加快,逐渐成为中国经济增长的新动力。企业直播成为在推动企业生产经营活动价值提升、成本控制方面的重要抓手,能够帮助企业实现开源节流诉求并加速推动企业进入数字化转型快车道。
AI技术为驱动企业直播服务的优化升级提供新动能
自去年老罗开启直播带货新生涯并引爆直播圈的同时,频频出现的直播“事故”也饱受诟病。除去“口误”等个人问题不谈,画面的流畅度、链接的时效性、支付的便捷度等技术问题更是影响直播体验的硬伤。此外,平日我们所见的线上发布会、直播培训、大型远程会议等出现的视频卡顿掉线、音画不同步、吊帧不清晰、噪音干扰等“翻车”现场更是屡见不鲜,严重影响直播效果和线上交流互动的效率。
随着企业对直播低延迟性、安全稳定、画质清晰等方面的要求进一步提升,包括保利威在内的众多企业直播服务商不断挖掘各行业客户的业务需求与直播痛点,持续增强自身技术及产品服务能力,为企业提供跨平台、高品质、可定制化的一站式直播解决方案。在保利威看来,AI、大数据等领先技术的发展首先对视频本身的底层逻辑起到了推动作用,比如视频画质的优化,可以使用AI的画面识别方式来提高它某些区域的码域分布,提高感官的感受。
随着AI技术的发展及应用,借助AI的处理能力可以丰富视频会议与直播的内容和形式,实现如超分变率、虚拟绿幕、风格化滤镜、实时翻译等功能。视频直播与远程会议中的关键AI技术应用与创新,集结了AI、云计算、安全等各方面的能力,可为用户打造一个更高效的全视频沟通环境,实现更智能的沟通方式,显示出极高的商业价值。
视频直播中与远程会议中的关键AI应用技术及创新
AI+视频编码压缩技术
直播的清晰度和流畅度对用户的体验至关重要。通过提升视频的码率、分辨率能够确保视频清晰度显著提升,但高质量的视频占用了大量的网络带宽资源,增加直播的带宽成本。如何平衡二者之间的矛盾?业界通常采用的是多码率自适应算法,其本质上是利用AI技术优化编码有效降低视频带宽的消耗,提供低延迟、平滑、流畅的直播多码率体验。
比较有代表性的是业界领先的视频直播服务商保利威采用的AI窄带高清编码技术,保利威通过使用AI技术对视频进行场景分析,建立场景下视频参数与场景的对应关系,实现场景下动态编码参数的切换和功能应用,在同等带宽下也能展现更清晰画质。
保利威是CCTV微视移动端直播唯一视频服务商
另一个比较典型的例子是NVIDIA Maxine视频会议软件方案,其在NVIDIA GPU上运行的基于AI的视频压缩技术,在带宽极低的情况下,用户可以将从语音升级到流畅的视频通话,释放云视频会议潜能,并减少电脑、平板和手机上的数据流。
AI+视音频通信技术
视频作为人沟通的主要方式,带动了实时视音频通信的迅猛发展。视音频通信当今以每年30%复合增长率增长,已经在在线教育、视频会议等行业蓬勃发展。在AI等技术的加持下,视音频通信也发生了革命性的改变。保利威的AI声纹识别技术,能够实现直播实时会议速记。同时,保利威通过AI技术具有多语种识别和词汇自动更新的强大能力,实现了在直播会议中多语言实时字幕呈现,而且具有高识别准确率,人工成本直降90%!
视频沟通场景日益复杂多样,实时通信也不再局限人与人之间,还存在于人与设备之间,实现沟通工具软件与用户的业务有效整合,考验着直播服务商提供实时通信的PaaS能力、SaaS能力。京东推出的实时视音频通信JRTC,在融合+边缘两点形成差异化特色,将实时通信和直播、AI、监控、SIP互通互联,实现数据交换和资源共享。
AI+虚拟现实技术
从用户体验的角度,语音的“听感”和视频的“观感”直接影响远程会议及直播的质量。早期的视频直播中美颜效果处理生硬不自然,道具贴纸在贴合度和灵敏度上差强人意。现如今,借助AI技术能够让数字虚拟生活显得更加真实。NVIDIA Maxine视频会议软件方案通过AI智能视频和语音的处理,能够实现人脸对齐、凝视校正、脸部打光、噪音消除等,让视频会议的感觉更像面对面的交谈。
对于线上授课培训、会议发言等场景,如果需要贴纸和虚拟背景,保利威提供的AI抠像技术与AI虚拟背景应用,能够让授课和发言显得更加专业,学生及聆听者则因获得更加沉浸式的“观感”而提高参与积极性。
由保利威提供直播技术支持的创业邦春季峰会
此外,借助于高性能实时渲染技术和实时通信技术,AI虚拟人合成的客服、“3D超写实数字人”正方兴未艾。基于AI技术的自适应驱动优化,影视级的高精度数字人模型细节精致,表情丰富生动,为视频直播和远程会议增强了更强的新鲜感和科技感。
AI+智能审核与检索技术
对视频直播及远程会议进行数据统计和分析,这是企业的一个非常重要的价值增值点,通过大数据、人工智能(AI)等技术可以实现多维度的后台数据统计、分析,为企业的管理、市场拓展和营销活动提供数据方面的支撑。通过AI技术,保利威不仅能够对海量数据样本库进行智能审核,实时鉴别暴恐、涉政、涉黄等敏感信息,还能对视频内容进行语音、图像识别,将视频内容结构化处理。比如通过AI技术对教学视频内容进行识别,再使用保利威教育特征库,比对将视频的知识点抽出,从而实现基于视频内容的检索服务。
AI+直播,赋能视频直播行业更多新商业价值
据艾瑞咨询调研显示,虽然疫情对企业应用直播有一定催化作用,但部分企业此前已对直播的应用和价值有较高认知,反映出市场对直播服务作为企业数字化转型工具的认可。而AI技术的加持,进一步驱动企业直播服务各环节的优化和升级,让企业直播的效果更加锦上添花,敏感词语过滤、实时字幕生成、人脸表情识别、学习行为分析等一系列AI技术的应用,赋能视频直播行业更多新商业价值。
以企业直播服务引领者保利威为例,保利威深耕企业直播七年,从真实应用场景出发,解决企业级视频应用痛点,打造了稳定、安全、快捷的产品应用及平台核心优势。2021年的春节联欢晚会是世界上首次在8K超高清电视频道进行的重大活动直播,保利威助力央视春晚首次落地VR沉浸声直播,在视觉和听觉上都呈现出三维空间感,为观众打造出犹如真现场的文艺视听盛宴。
保利威春晚VR沉浸声直播,观众可自由操控旋转视角
AI技术赋能视频直播行业更多新商业价值远不止于此,对于专注在视频技术领域的保利威来说,深度结合AI技术应用在各垂直领域以创造新价值。在线上教育领域,通过AI进行人物面部情绪识别,发掘学生的行为特征、性格特点等,通过AI和大数据不断优化课件质量;在线上面试领域,HR可查阅进入直播间的意向候选人情况,配合保利威智能人才大数据报表,生成人才画像分析,为后续招聘投入提供数据支撑......总之来说,AI+直播,能够充分挖掘和发挥视频直播行业新潜力,为各垂直领域创造更多新商业价值。