凤鸣AI引擎发布,实时音频看起来真的无处不在了

ChatGPT火了之后,Sam Altman的话开始被挖出来,反复咀嚼,奉为圭臬。

他曾有一个很简单的定义一种产品或技术革新是否具备确定性的方法:一小撮最先接触到它的人每天会在这东西上花很长小时,长期沉浸其中,那这东西大概能成;反之,如果一个新事物仍然在哪怕一小撮人都无法上瘾的阶段,那一个新的浪潮就还不是时候。

这位OpenAI创始人重新夸赞了一番iPhone,又踩了一脚VR,然后将ChatGPT推上那个“iPhone时刻”。但这样看起来基于常识又过于理想化的判断思路并不是没有反例,比如曾短暂风靡的Clubhouse。

或许有一种更长尾角度的判断思路。比如当最坚固的诺基亚用户也开始打听乔布斯,那“iPhone时刻”才真的来了;或者当穿着白袍,戴着白巾的保守中东网民开始举着手机社交的时候,世界才确定真的进一步跨越到了一个实时互动的巨大浪潮里。

2016年成立的?Yalla Group是目前语聊房市场中体量最大的公司,它在2020年成为阿联酋第一家在纽交所上市的科技公司。上市三年后,这已经是一个月活用户接近3200万人,付费用户超过1200万人的巨型流量体。

在Yalla的聊天房里,经常可以看到超过1000人同时在场的盛况。在这个上线2000人的音频空间里,很多声音是从沙特阿拉伯、卡塔尔甚至阿联酋传过来的。

这样的事正在发生。

实时互动浪潮

实时互动的浪潮在国内汹涌,无数场线上演唱会的出现佐证着这场实时互动的技术变革。

近年鲜有在公众视线中露面的罗大佑在去年5月完成了自己的首场线上演唱会,他唱了21首歌,4200万人通过微信视频号看了这场演出。而在同一天,孙燕姿在抖音上做了自己的第一场线上“唱聊会”,观看次数(同一账号可重复计入)达到了2.4个亿。

外界将全球范围内音视频产品的兴起归因于疫情的推动,将国内线上演唱会的风潮描述为一场场平台之争,但从技术底层看来,实时音视频传输网络(Real-time Network, RTN)在延时降低、弱网对抗等方面的能力突破,乃至整体上以视听为信息流通方式的实时互动的技术成熟,才是谈论这一切的基础。

2011年WebRTC (Web Real-Time Communications)开源,然后一个完整的十年周期之后,W3C和IETF两大标准制定组织在2021年宣布WebRTC成为官方标准,此后用户无需下载额外组件或单独的应用程序,便可以支持在网络上的实时音视频通信。

“这意味着实时音视频将被带入Web的任何地方,为WebRTC第一代技术的标准化进程划上了完美句号。”声网CEO赵斌在2021年如此总结,他也将WebRTC成为官方标准的时刻看作一个起点,“下一代WebRTC技术、行业、标准进化等方面的探讨也将由此正式提上议事日程”。

(责任编辑:AK007)