原子能力
WebRTC Audio Processing Module
厂商/来源:
Google
核心功能:
“耳朵的滤网”。在吵闹的工厂里,为什么微信通话很清晰?全靠这个算法模块。
| 适用场景 | 工业对讲机、机器人语音交互、嘈杂环境下的语音识别前处理 |
| 架构支持 | 全架构 (C++ 编写,高度优化) |
| 核心能力 | AEC (回声消除):这是最核心的。当机器人在播放音乐时,你对它说话,它能把音乐声滤掉,只留下你的人声。没有 AEC,语音交互就是废品 NS (噪音抑制):利用统计模型滤除风扇声、电机声等平稳背景噪音。 AGC (自动增益):不管人离麦克风 1米还是 5米,输出音量保持一致。 |
| 交付形态 | C++ 源码 / 也可以通过 PulseAudio 的 module-echo-cancel 间接调用。 |
| 避坑指南 | [硬件延迟对齐] 1. 物理隔离失效:AEC 算法极其依赖“参考信号” (Reference Signal) 的同步。如果你的麦克风和喇叭是通过不同的声卡(比如一个是 USB 麦克风,一个是 HDMI 电视喇叭)连接的,由于时钟不同步,AEC 完全无效。对策:必须使用同一块声卡同时处理录音和播放,或者使用支持硬件 AEC 的麦克风阵列。 |
| 推荐搭配 | [XMOS 麦克风阵列] [ALSA 音频驱动] |