关闭。这个问题需要更多
focused .它目前不接受答案。
Best Answer-推荐答案 strong>
一般来说,人声和人声的音频频谱频率范围不能通过滤波来分离,因为人声和乐器的音频频谱频率范围重叠很多。
对于立体声音乐,主要人声在中心位置平移,而器乐平移到一侧或另一侧,可以通过从另一个 channel 中减去一个 channel 来去除混音中的一些人声(比如从右到左)。要执行此减法,您必须将 mp3 转换为原始 PCM 样本的未压缩音频,并使用 C 数据类型。
关于如何实现这一点的学术研究的搜索词是“盲源分离”。
与其说是“算法”,不如说是“技巧”,但它可以在代码中实现自动化。它主要适用于人声居中的立体声轨道。如果人声居中,则它们在两条轨道中均等地表现出来。如果您反转其中一个音轨,然后将它们重新合并在一起,则中心人声的波形会抵消并实际上被消除。您可以使用大多数优秀的音频编辑器(如 Audacity)手动执行此操作。它不会为您提供完美的结果,并且其余的音频也会受到一些影响,但它可以制作出很棒的卡拉 OK 轨道。
关于ios - 在 iOS App 中从音频文件中分离语音和音乐(制作卡拉 OK),我们在Stack Overflow上找到一个类似的问题:
https://stackoverflow.com/questions/34764034/
欢迎光临 OStack程序员社区-中国程序员成长平台 (https://ostack.cn/) |
Powered by Discuz! X3.4 |