1999年,当时名为OICQ的社交软件公布了最新版本,语音聊天的功能公布。然后,还加入了视频聊天。18年后的今天,QQ的月活跃客户早已突破8亿。一个更令人震惊的统计数据是,在人数最多的情况下,QQ客户每天的音视频通话时间达到12亿分钟。
在QQ发展趋势的整个过程中,其背后的音视频通信技术也经历了对外开放购买,到成立QQ音视频研究中心,自研模块,再到稳步发展为腾讯音视频实验室,对外开放研发矛音视频模块的全过程。如今,随着全时直播时代的到来,腾讯开发产品,开放了一体化直播解决方案,将腾讯直播SDK应用于宇都、虎牙直播、Aauto快视频等顶级直播服务平台。这背后,技术和工作经验的不断发展和积累,也是腾讯对中国复杂互联网局面的智能化解决方案。日前,腾讯音视频实验室负责人刘晓宇接受了雷锋网的采访。com,谈到了这类难题,并为大家详细介绍了当精细化运营和5G技术到来时,直播上会有哪些新玩法。
(腾讯音视频实验室负责人刘晓宇)
腾讯音视频实验室:不断发展,然后适用于每天12亿分钟的语音通话。
在斯坦福大学长长的校园里,一个深度学习专家授课的场景被监控摄像头捕捉到。按照伺服电机分段推送,按照互联网技术传输到你的电脑。然后可以通过播放软件实时压缩包解压,学习和训练前沿的课程内容。
流媒体技术给互联网技术带来了无穷的魅力,而当场景变成了音视频通信,背后的技术不仅复杂而且翻倍。除了双重反馈,即时通讯的延迟时间越来越高;此外,回声分辨率成为新的问题。“当我听到你的名声时,我也想说话。麦克风一直开着。不解决回声,你的名声又会被收起来,打到你这边来。”
在腾讯商务大厦的腾讯音视频考场,刘晓宇为雷锋做了一个小评分。2005年加入腾讯,承担QQ网络层的架构模型。“除了最底层的公共组件,好友控制面板和信息对话框,包括室内空房间、歌曲、电子邮件等等软件功能,你能看到的QQ页面上显示的项目你都能知道,都是大家开发设计的。”
2011年,腾讯宣布成立音视频管理中心,刘晓宇被任命为负责人。虽然QQ在1999年就有了音视频通话的功能,但在很长一段时间内,腾讯都是依靠腾讯研究院和第三方技术服务商,并没有单独的精英团队来承担音视频通信。
音视频管理中心的成立,是因为腾讯觉得音视频会是未来的一个爆发点,还有一个关键原因。当时从GIPS购买的技术规范(后被谷歌收回)是一个“黑匣子”,出现问题自己也不可能找出原因,GIPS也没有高度重视,这坚定了腾讯在技术研发上的信心。
刘晓宇详细介绍,在音视频通信中,网络问题一直是一个技术难题。测试服务器带宽,平衡视频质量和传输速率,检测网络带宽,解决丢包率和抖动,都需要深厚的技术积累。此外,随着移动互联网的发展趋势,机械设备的泛娱乐化越来越严重,不同机械设备的兼容性成为一个很大的问题。“大家经常要兼容系统软件的问题,有时候会出现很戏剧性的事情。”有一个QQ的版本号,腾讯特意推广了兼容的红米手机,但是版本号还没公布。小米手机发现了问题,它先宣传自己。互相转化,结果有什么问题。
(为了更好的测试QQ在不同互联网下的音视频通话质量,腾讯音视频实验室拉了10多条光纤宽带,包括各运营商、教育信息网等。).
音视频管理中心的稳步发展,推动了QQ音视频通话功能的不断创新。今天,QQ客户每天谈论12亿分钟的音频和视频。2015年11月,腾讯宣布将面向大众开发的矛音视频模块将包括流量控制对策 *** 控云空、安全通道智能系统/多路备份数据系统、分布式系统混响和云混响、混合开发的通信协议设计方案、混合开发手机客户端模块SDK的呈现、预连接设计方案、两人/多人语音通话的平滑转换、语音通话客观质量评估和管理系统等等。
2016年,腾讯音视频实验室宣布成立。最开始只有7个音像管理中心,现在有80多人。除了保证QQ的音视频再次通话,对外开放能力,在公司级销售市场大有作为,成为音视频实验室新的日常任务。
七大领先技术推动音视频通话走向直播:技术和要求必须随人性而变。
2015年,随着4g和智能手机的普及,移动直播刚刚开始成为新的网络热点。其实从技术上来说,直播并不是一个新的项目。早在2008年左右,六间房刚刚开始尝试使用Flash的技术进行网页直播。
从网页直播到移动直播,客户的要求没有变,但是应用的网络空、机器设备、直播自然环境都会变。比如移动直播要处理Wi-Fi和移动互联网的转换问题;但在不同的室内空房间,保证音色和视频流畅,光源平衡,对技术清晰度提出了新的挑战。以刘晓宇雷锋网为例。在音视频通信初期,腾讯从GIPS购买的音视频通话方案经常会遇到举报。其中一个关键原因是中国复杂的网络空,如南北沟通困难,客户数据连接不畅。
(消声实验室,大门关闭安静时,声数只有17,可以保证每次接口测试的一致性)
在解决移动直播的问题时,类似的问题也是存在的,需要移动技术服务商来升级不同的自然环境。其中,弱网的重点改善、网络带宽的抓取能力、手机的性能优化、机型兼容、后台管理的格式转换能力,都会直接危及直播间的稳定性、画质、连续直播的实用性、交流的顺畅性。
此外,根据刘晓宇的详细介绍,由于客户观看直播的微妙习惯,技术对策不得不进行相对调整。比如之前的视频聊天,客户的关键要求是低延迟,所以当网络不稳定时,系统软件会自动降低视频清晰度。然而在直播中,却完全反了过来。“我宁愿要个小卡,延迟时间长一点,不用降低屏幕分辨率”;在科研中,刘晓宇的精英团队还发现,客户在观看直播时非常洒脱,会下意识地滑到下一场直播。这就需要系统软件提前缓存文件接口,以便客户快速切换到直播。
如今,腾讯已经拥有一整套直播技术解决方案。只需要两行代码就可以让公司连接到腾讯的直播控制模块,该模块由腾讯的直播服务提供支持。
这个AVL(Audio Video Live)程序,借助腾讯的矛音视频通讯模块,可以根据腾讯的liveSDK,打造一对多、多对多的混合高清酷炫直播场景。除了能够展现基础超清、秒开、高品质音乐、格式转换、黄色识别等功能外,还具备持续麦直播、即时录像、音频直播、美肤、图片水印、混响、IM等功能。此外,考虑到旁路直播、屏幕共享、面部识别、ps滤镜、小挂件等“不常见”的能力。,所有能力多达17项,是现阶段最流行、能力覆盖最好的直播SDK。其流畅度、音色、低延迟时间、防掉线率均居业界第一,其他关键数据信息也接近业界最佳。
(测试真实语音通话质量,全程各种数据信息会被即时记录)
直播音视频AVL的一个关键应用是连麦直播。现在,宇都、虎牙直播和汽车快视频都应用了这项服务。宇都直播产品策划总监王楚锋也接受了雷锋网的采访。据他详细介绍,成立于2014年的宇都,现在有超过4万个直播间,每天有2000万活跃客户。
2015年,宇都刚刚开始使用腾讯生产的小麦应用直播功能。除了延迟时间低,腾讯还制作了网络主播虚拟穿衣、变声等功能。此外,在歌曲场景上,腾讯还在麦克风FM收音和音色提升上做了深度改进。
垂直场景,语音识别技术,VR,新技术应用下的直播也有了新玩法。
今年春节假期QQ视频聊天中,出现了一款小表情小彩蛋的视频游戏。有人说“我爱你,为什么?”显示屏上出现了小嘴唇表情,那个“春节快乐”“财源滚滚来”还会有匹配惊喜的小表情。
这只是语音识别技术在视频聊天中的基本应用。直播服务平台的市场竞争已经出现了“大鱼吃小鱼3”的趋势。在刘晓宇看来,技术将成为直播服务平台多元化的一个切入点。
2020年,NOWLive刚刚开始检测绿屏直播。当客户在整个直播过程中,自然环境是特定的翠绿色时,可以随意更换手机照片中的照片或视频。这种运用在影视制作中的技术,可以让直播有更多自主创新的玩法。有分析觉得可以应用到二次元题材风格的直播中。接下来,腾讯将把这一能力整合到直播SDK中,并开放给大量的直播服务平台。
(Now直播的绿屏直播)
现在的时装秀游戏直播占了绝大多数,但除此之外,越来越多的垂直场景才刚刚开始出现,比如金融行业、教育的直播。在这样的场景中,除了网络主播和观众,显示屏也参与其中。现在腾讯的直播技术已经可以处理三方的问题,考虑到显示屏的编解码和CPU *** 控。
另外,VR直播之前被长宽比看好,刘晓宇告诉雷锋网。com认为,现阶段VR直播的关键技术障碍在于,要保证更多人观看的互动体验另外,直播源需要传输360度全数据信息,而这个信息量是非常巨大的;此外,在采集全景航拍照片时,对界面的堆积部分进行拼凑和分割,对相机镜头进行校正,还有很长的路要走。
但是,科技行业总是发展得更快。根据工信部和三大运营商的整体规划,中国5G将于2020年宣布商用。刘晓宇说,“相对于4g,5G会是一个恶化,大家会一直关注这里的技术发展趋势。”
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)