寄生计算架构
寄生计算是一种专利架构,它将数字信号处理算法以“设备驱动程序”的形式应用于特定的音频芯片组。与内置或外置硬件 DSP 模块(意味着更高的成本和功耗)相比,该架构允许主机(手机、PC、平板电脑等)的外围音频配件免费利用主机的资源(存储和计算能力)来处理来自/发往用户层应用程序的下游/上游音频信号。
主机上丰富的资源使得部署代码量更大、计算复杂度更高的算法成为可能。此外,它还支持多个算法并行/串行运行,从而具有提升性能和未来升级的潜力。

音频处理算法
从降噪、语音风格化到声音采集,我们提供多种可选算法,也欢迎与其他算法团队合作,共同打造更便捷的新应用。以下为当前可提供的算法:
1. 定向采集算法(Directional Sound Collecting)
基于波束成形(beam-forming),对固定阵列麦克风的信号进行计算,在保留设定方向范围内声音的同时,衰减/抑制该范围外的声音。
可按需配置衰减强度,最高可达约 40 dB SNRI,效果显著强于单一指向性麦克风,适用于直播、采访等定向录音场景。

演示 1(CES 展示)
在 80+dB 嘈杂环境下,搭载我们方案的手机仍能正确识别用户语音:
演示 2(驾驶场景)
在车内噪声、引擎声、乘客说话声等环境下,使用语音助手往往困难。以下视频展示了我们的方案如何提升车载语音交互的可用性与安全性:
演示 3(多机对比)
我们在约 85 dB 的环境下,对比普通手机麦克风与搭载 kikaGO 降噪产品的效果:
voicepie.AI 手机 vs iPhone+Siri vs Samsung+Google Assistant 效果对比2. 环境降噪(ENC)算法
对非固定阵列的麦克风信号进行计算,保留几何位置上更靠近目标麦克风的声音,同时衰减/抑制四周环境噪声。
可按需定制衰减强度,最高可达约 25 dB SNRI。可用于有线/无线音频配件:一只麦克风对准目标声源,其余辅助麦克风采集环境噪声以提升降噪。

3. 语音风格化算法
除降噪外,我们也研发了多种语音相关处理算法:
- 共鸣(Resonance):为人声加入轻/重共鸣,类似 K 歌美化。
- 变声(Tone Changing):让你的声音像年轻/年长者,甚至卡通声。
- 特效(Special Effects):笑声、掌声等各类音效,可自定义,适合通话/直播增趣。
- 变速(Speed Change):加快或放慢语速。
- ASMR(研发中):让普通耳机更贴近 ASMR 体验。
4. USB 设备多通道同步录音算法
传统手机无法同时录多路声道,通常要依赖调音台或 PC,并在后期对齐各声道。该算法可让 Android 手机直接录制 2 路或多路且同步的音频,便于便携化采集与语音 AI 落地。
该算法已在某客户的设备上用于机械故障检测场景。在 PC 端亦可替代传统调音台,实现多通道同期录制,免去后期对齐。
我们也在用该算法进一步改善“嘈杂环境下语音 AI 识别困难”的行业痛点,相信它是未来语音 AI 的关键基础能力之一。
5. 其他算法
在上述能力之外,我们还可按需集成更多音频处理算法。得益于我们的部署结构,很多能力可以通过软件升级追加,无需更换整套芯片/模组。
降噪/回声抑制(Noise/Echo Cancellation)
- AEC 回声消除(Acoustic Echo Cancellation)
- 串音抑制(Crosstalk Suppression)
- 辅助麦降噪(Auxiliary Mic ENC)
- 麦克风阵列波束成形(Mic Array Beamforming)
- DNN/RNN 等 AI 模型
音频混音(Audio Mixer)
- 背景音乐(Background Sound)
- 气氛/环境音乐(Music Ambiance)
- 背景音量自动调节(Automatic Background Sound Volume Adjustment)
- 罐头音效(Canned Sound Effects)
- 音质修复(Audio Quality Restoration)*
音频水印(Audio Watermark)
- 反欺诈(Anti-Fraud)
- 泄露追踪(Leak Tracing)*
- 认证(Authentication)*
- 声纹签名(Voice Signature)*
- 声纹伪装(Voiceprint Disguise)*
* 标注 * 的功能处于研发阶段