关闭。这个问题需要更多 focused .它目前不接受答案。

Best Answer-推荐答案

一般来说，人声和人声的音频频谱频率范围不能通过滤波来分离，因为人声和乐器的音频频谱频率范围重叠很多。

对于立体声音乐，主要人声在中心位置平移，而器乐平移到一侧或另一侧，可以通过从另一个 channel 中减去一个 channel 来去除混音中的一些人声(比如从右到左)。要执行此减法，您必须将 mp3 转换为原始 PCM 样本的未压缩音频，并使用 C 数据类型。

关于如何实现这一点的学术研究的搜索词是“盲源分离”。

与其说是“算法”，不如说是“技巧”，但它可以在代码中实现自动化。它主要适用于人声居中的立体声轨道。如果人声居中，则它们在两条轨道中均等地表现出来。如果您反转其中一个音轨，然后将它们重新合并在一起，则中心人声的波形会抵消并实际上被消除。您可以使用大多数优秀的音频编辑器(如 Audacity)手动执行此操作。它不会为您提供完美的结果，并且其余的音频也会受到一些影响，但它可以制作出很棒的卡拉 OK 轨道。

关于ios - 在 iOS App 中从音频文件中分离语音和音乐(制作卡拉 OK)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34764034/

欢迎光临 OStack程序员社区-中国程序员成长平台 (https://ostack.cn/) Powered by Discuz! X3.4