音频编解码器 - Opus

简介

Opus 是一款完全开放、免版税、功能多样的音频编解码器。它适用于互联网上的交互式语音和音乐传输,但也适用于存储和流媒体应用。

Opus的前身是celt编码器。在当今的有损音频格式争夺上,拥有众多不同编码器的AAC格式打败了同样颇有潜力的Musepack、Vorbis等格式,而在Opus格式诞生后,情况似乎不同了。通过诸多的对比测试,低码率下Opus完胜曾经优势明显的HE AAC,中码率就已经可以媲敌码率高出30%左右的AAC格式,而高码率下更接近原始音频。

Opus可以处理各种音频应用,包括IP语音,视频会议,游戏内聊天,甚至远程现场音乐表演。它可以从低比特率窄带语音扩展到非常高质量的立体声音乐。支持的特性包括:

  • 比特率从 6kb/s 到 510 kb/s
  • 采样率从 8kHz(窄带)到 48kHz(全频段)
  • 帧大小从 2.5ms 到 60ms
  • 支持恒定比特率(CBR)和可变比特率(VBR)
  • 从窄带到全频带的音频带宽
  • 支持语音和音乐
  • 支持单声道和立体声
  • 支持多达255个通道(多流帧)
  • 动态可调比特率,音频带宽和帧大小
  • 良好的稳健性和隐蔽性
  • 浮点和定点实现
  • 可以在 RFC 6716 中阅读完整说明书,包括参考实现。 下载 页面还提供了最新的Opus标准实现。

    编译opus静态库

  • 从GitHub 下载Opus-iOS编译工程
  • 在Opus-iOS编译工程根目录下创建 Opus-iOS/build/src 目录。
  • 下载 opus稳定版 ,得到opus-xx.tar文件。
  • 将opus-xx.tar放到 Opus-iOS/build/src 目录下。
  • 如果你下载的opus版本和 build-libopus.sh 中的opus版本信息不一样,你要修改以下版本信息。
  • VERSION="1.2"       #这是opus版本
    SDKVERSION="11.4"   #这是SDK版本
    MINIOSVERSION="9.0" #这是最低iOS版本
    
  • 在命令行中执行编译:
  • $ ./build-libopus.sh
    
  • 编译完成后在Opus-iOS/dependencies中会看到includelib
  • 关于编译Static LibraryFramework 的详细步骤请看Opus-iOS/README.md

    集成opus到Xcode工程

    用Xcode新建OpusDemo,将includelib一同拷贝到工程中即可。
    这一步就不细说了,新手请自行搜索Xcode集成静态库的方法。
    不想往下看的话请直接看示例OpusDemo

    opus主要接口

  • opus的接口声明在include/opus.h中,下面是四个主要的函数:
  • // 创建编码器
    OpusEncoder *opus_encoder_create(
        opus_int32 Fs,
        int channels,
        int application,
        int *error
    // 修改编码器参数
    int opus_encoder_ctl(
        OpusEncoder *st, 
        int request, ...
    // 创建解码器
    OpusDecoder *opus_decoder_create(
        opus_int32 Fs,
        int channels,
        int *error
    // 将PCM编码成opus
    opus_int32 opus_encode(
        OpusEncoder *st,
        const opus_int16 *pcm,
        int frame_size,
        unsigned char *data,
        opus_int32 max_data_bytes
    // 从opus中译码出PCM
    int opus_decode(
        OpusDecoder *st,
        const unsigned char *data,
        opus_int32 len,
        opus_int16 *pcm,
        int frame_size,
        int decode_fec
    
  • 使用动态码率?
  • 编码器默认使用动态码率,因此需要记录每一个帧编码之后的大小。我的demo使用2字节的头来记录每一块opus数据的大小,具体请看我的demo。

    静态码率需要设置编码器的初始化参数如下,编码后产生固定的大小的opus块。

    opus_encoder_ctl(_encoder, OPUS_SET_VBR(0));  // 0固定码率,1动态码率
    
  • 指定码率?
  • 你可以指定opus编码的码率大小,比特率从 6kb/s 到 510 kb/s,想要压缩比大一些就设置码率小一点,但是相应的也会使声音失真多一些。

    #define BITRATE 16000 
    opus_encoder_ctl(_encoder, OPUS_SET_BITRATE(BITRATE));
    
  • 语音信号优化?
  • 如果你用于语音而不是音乐,那你完全可以设置如下,以使编码器针对语音模式做优化处理。

    opus_encoder_ctl(_encoder, 
    OPUS_SET_APPLICATION(OPUS_APPLICATION_VOIP));
    opus_encoder_ctl(_encoder, OPUS_SET_SIGNAL(OPUS_SIGNAL_VOICE));
    

    一组测试数据

    (以下结果只在本例参数条件下有效)

    15:47:17.948335 WAV => PCM: 39584
    15:47:17.958745 encodedBytes: 97
    15:47:17.961646 encodedBytes: 116
    15:47:17.964055 encodedBytes: 121
    15:47:17.966504 encodedBytes: 112
    15:47:17.969272 encodedBytes: 104
    15:47:17.972323 encodedBytes: 118
    15:47:17.975030 encodedBytes: 116
    15:47:17.977766 encodedBytes: 115
    15:47:17.980185 encodedBytes: 116
    15:47:17.982257 encodedBytes: 101
    15:47:17.984174 encodedBytes: 143
    15:47:17.986285 encodedBytes: 147
    15:47:17.988596 encodedBytes: 134
    15:47:17.990366 encodedBytes: 112
    15:47:17.991779 encodedBytes: 97
    15:47:17.993259 encodedBytes: 93
    15:47:17.994783 encodedBytes: 100
    15:47:17.996292 encodedBytes: 105
    15:47:17.997766 encodedBytes: 110
    15:47:17.999361 encodedBytes: 94
    15:47:17.999390 PCM => OPUS: 2291
    15:47:17.999658 decodedSamples:960
    15:47:17.999843 decodedSamples:960
    15:47:17.999992 decodedSamples:960
    15:47:18.000191 decodedSamples:960
    15:47:18.000347 decodedSamples:960
    15:47:18.000585 decodedSamples:960
    15:47:18.000696 decodedSamples:960
    15:47:18.000807 decodedSamples:960
    15:47:18.000893 decodedSamples:960
    15:47:18.001011 decodedSamples:960
    15:47:18.001111 decodedSamples:960
    15:47:18.001216 decodedSamples:960
    15:47:18.001486 decodedSamples:960
    15:47:18.001615 decodedSamples:960
    15:47:18.002240 decodedSamples:960
    15:47:18.002357 decodedSamples:960
    15:47:18.002445 decodedSamples:960
    15:47:18.002570 decodedSamples:960
    15:47:18.002729 decodedSamples:960
    15:47:18.002813 decodedSamples:960
    15:47:18.002877 OPUS => PCM: 38400

    采样率 16000
    码率 16000
    通道数 1
    帧大小 960