直播app开发中增加用户留存率必不可少的技术之一
原创:  云豹直播 2019-02-14

在互联网高速发展的大背景下,如今已经是年轻人的时代和天下,无论是直播领域还是游戏领域,随处都可以看到00后的“足迹”。为了留住年轻的用户群体,在直播app开发过程中就需要不断地更新迭代,增加用户留存率。近几年来,实时音频的混音技术成为直播领域创新玩法的“常青树”,接下来就简单介绍一下相关的知识内容。

5.jpg

1. 什么是混音?

百度百科对于混音是这样解释的:混音常简称为mix,是音乐制作中的一个步骤,常常也会缩写成MIX。是把多种来源的声音,整合为一个立体音轨或单音音轨中。但是在直播类app开发过程中所提到的混音,可以理解成为是将两路或者多路的音频流混合在一起,形成一路音频流。

2. 混音的实现方式有几种?

混音的实现方式分为两种:终端混音和云端混音。

(1)终端混音通常应用于背景配音、音乐伴奏等场景。

(2)云端混音可以属于云端混流的一部分,利用云端的计算能力去做多路音视频流的音画对齐,或者是降低下行带宽成本。当然也可以做纯粹的云端混音,从而实现直播中连麦合唱等场景需求。

3. 直播app中哪些地方会用到混音?

混音技术在直播的应用场景中早已屡见不鲜,像是直播间内的掌声、笑声或者是背景音乐,这些都属于混音技术的应用。在这里举个简单的例子,在主播端采集主播的声音形成音频流,然后再从音频文件中读取音频流,把这两路音频流混合后,就会形成一路音频流,也就是我们在直播间内听到的那些声音。

6.jpg

4.混音之间需要做哪些处理?

虽然说把两路音频流混合在一起形成一路音频流就是混音了,但是并不是任何的两路音频流都能够直接混合的,必须要符合以下条件才可以混合。

(1)格式:要想混合在一起,最重要的就是格式相同,并且解压成为PCM格式。

(2)帧长:帧长一般是由编码格式而决定的,而PCM没有帧长的概念,开发时可以根据需求自行决定帧长。在这里提醒大家一下,为了和主流音频编码格式的帧长保持一致,推荐采用20ms。

(3)采样率:需要转换成为相同的采样率。主流的采样率包括:16kHz、32kHz、44.1kHz和48kHz。

(4)声道数:必须是同样的单声道或者是双声道。

(5)位深/采样格式:即承载每个采样点数据的bit数目要保持一致。

通过以上五种条件,保持一致后两个音频流就可以混合了。但是在混音之前,还需要做噪音抑制、回声消除和静音检测等处理。而回声消除和噪音抑制是属于语音前处理范畴的工作,在编码之前,采集、语音前处理、混音之前的处理、混音之后的处理应该按照顺序进行。

7.jpg

5.混音的基础算法需要考虑什么因素?

在混音算法中,音频采样的数据表征声音的振幅,音频数据的叠加也呈线性,所以在这里需要考虑两个方面的因素。

1)两个音频流对应采样点数据的线性相加可能会造成“溢出”,通常由两个16bit的整数表示,这两个整数相加可能会造成溢出,向上或向下溢出。所以在混音算法中需要具备处理溢出情况的能力。

2) 两个音频流的振幅表示声音的能量水平,需要混合的两个声音可能存在一个声音大一个声音小的情况,站在用户角度考虑的话,会希望两个声音混合之后听起来能够均衡一些。所以需要考虑这两个声音振幅之间的权重,或者是调节两个声音之间的音量。通常,在直播过程中采集到的主播声音相对较小,而文件读取的音频声音反而较大,这个时候就会保持主播的声音音量不变,调节背景音乐音量后再进行混合。

在直播app开发的过程中,混音技术的使用还是十分常见的。但是在直播的场景应用中,混音技术不会作为单独的技术进行使用,通常都会与其他技术一起使用。直播app中各种技术的灵活运用,不仅可以创造出主播和用户都广为喜爱的直播玩法,还可以增强用户留存率,从而提高直播平台的用户活跃度,实现最终流量变现的目的。

本文声明原创,转载请注明出处。

(www.yunbaokj.com)

文本标签: 直播app开发
上一篇:直播app开发中增加用户留存率必不可少的技术之一 下一篇:直播软件系统中的即时通讯开发技术
0.039131s