使用 Int16 数组作为音频的立体声 channel 生成 .mov 或 .m4a 文件的过程是什么?
我可以轻松地将原始 PCM 数据生成为 [Int16] 从 .mov 文件并将其存储在两个文件中 leftChannel.pcm 和 rightChannel.pcm 并执行一些操作以供以后使用。但我无法从这些文件中重新生成视频。
任何过程,即使用原始 PCM 直接生成视频或使用从 PCM 生成 m4a 的中间步骤都可以工作。
更新:
我想出了如何将 PCM 阵列转换为音频文件。但它不会播放。
private func convertToM4a(leftChannel leftPath : URL, rightChannel rigthPath : URL, converterCallback : ConverterCallback){
let m4aUrl = FileManagerUtil.getTempFileName(parentFolder: FrameExtractor.PCM_ENCODE_FOLDER, fileNameWithExtension: "encodedAudio.m4a")
if FileManager.default.fileExists(atPath: m4aUrl.path) {
try! FileManager.default.removeItem(atPath: m4aUrl.path)
}
do{
let leftBuffer = try NSArray(contentsOf: leftPath, error: ()) as! [Int16]
let rightBuffer = try NSArray(contentsOf: rigthPath, error: ()) as! [Int16]
let sampleRate = 44100
let channels = 2
let frameCapacity = (leftBuffer.count + rightBuffer.count)/2
let outputSettings = [
AVFormatIDKey : NSInteger(kAudioFormatMPEG4AAC),
AVSampleRateKey : NSInteger(sampleRate),
AVNumberOfChannelsKey : NSInteger(channels),
AVAudioFileTypeKey : NSInteger(kAudioFileAAC_ADTSType),
AVLinearPCMIsBigEndianKey : true,
] as [String : Any]
let audioFile = try AVAudioFile(forWriting: m4aUrl, settings: outputSettings, commonFormat: .pcmFormatInt16, interleaved: false)
let format = AVAudioFormat(commonFormat: .pcmFormatInt16, sampleRate: Double(sampleRate), channels: AVAudioChannelCount(channels), interleaved: false)!
let pcmBuffer = AVAudioPCMBuffer(pcmFormat: format, frameCapacity: AVAudioFrameCount(frameCapacity))!
pcmBuffer.frameLength = pcmBuffer.frameCapacity
for i in 0..<leftBuffer.count {
pcmBuffer.int16ChannelData![0][i] = leftBuffer[i]
}
for i in 0..<rightBuffer.count {
pcmBuffer.int16ChannelData![1][i] = rightBuffer[i]
}
try! audioFile.write(from: pcmBuffer)
converterCallback.m4aEncoded(to: m4aUrl)
} catch {
print(error.localizedDescription)
}
}
使用 AVAudioFileTypeKey 作为 m4a type 将其保存为 .m4a 会导致文件格式错误。
使用上述设置将其保存为 .aac 可播放文件,但声音中断。只是原始音频的嗡嗡声带有一些慢动作效果,最初我认为这与采样率的输入和输出有关,但事实并非如此。
我认为输出字典有问题。任何帮助将不胜感激。
Best Answer-推荐答案 strong>
至少使用您显示的代码创建 AAC 文件是可行的。
我写出了两个具有有效 Int16 音频数据的 NSArray,并且您的代码得到了一个有效的结果,例如在 QuickTime Player 中使用(使用后缀 .aac)播放时,听起来与输入相同。
你是如何创建输入的?
嗡嗡声(有很多噪音)例如如果您使用 AVAudioFormat 读取音频数据,例如.pcmFormatInt16 格式,但实际读取的数据是 .pcmFormatFloat32 格式(最常见的默认格式)。如果您尝试这样做,很遗憾没有运行时警告。
如果是这种情况,请尝试使用 .pcmFormatFloat32。如果您在 Int16 中需要它,您可以通过基本上将两个 channel 的 [-1,1] 映射到 [-32768,32767] 来自行转换。
let fac = Float(1 << 15)
for i in 0..<count {
let val = min(max(inBuffer!.floatChannelData![ch][i] * fac, -fac), fac - 1)
xxx[I] = Int16(val)
}
...
关于ios - 使用原始 PCM 生成视频或音频,我们在Stack Overflow上找到一个类似的问题:
https://stackoverflow.com/questions/50368988/
|