我正在开发一个简单的 iOS 网络广播应用程序,具有非常简单的语音/音乐识别功能。主要思想是一个 radio ,它播放来自 url 的信号,同时它检查正在广播的信号类型。当它检测到语音时,它会改变 channel 等等。
我使用 Storyboard和 AVFoundation for Player 编写了一个简单的 iOS 应用程序。我在实现语音检测时遇到问题。我为算法编写了一个 Matlab 代码,但我不确定如何在 Xcode 中执行此操作。
clear all
close all
[s, fs] = audioread('nagranie.wav');
length = length(s)/fs;
lengthofframe20ms = 0.2*fs;
numberofframes20ms = round(length(s)/lengthofframe20ms);
s1 = zeros(lengthofframe20ms*numberofframes20ms,1);
for i=1:1:length(s(:,1))
s1(i,1)=s(i,1);
end
frame20ms=zeros(numberofframes20ms,lengthofframe20ms);
for i=1:1:numberofframes20ms
for j=1:1:lengthofframe20ms
frame20ms(i,j)=s1(j+3200*(i-1),1);
end
end
lengthofframe260ms = 2.6*fs;
numberofframes260ms = round(length(s)/lengthofframe260ms);
s2 = zeros(lengthofframe260ms*numberofframes260ms,1);
for i=1:1:length(s(:,1))
s2(i,1)=s(i,1);
end
frame260ms=zeros(numberofframes260ms,lengthofframe260ms);
for i=1:1:numberofframes260ms
for j=1:1:lengthofframe20ms
frame260ms(i,j)=s1(j+41600*(i-1),1);
end
end
En = zeros(numberofframes20ms,1);
for i=1:1:numberofframes20ms
L=length(frame20ms(i,);
En(i)=(norm(frame20ms(i,)^2)/L;
end
Ek = zeros(numberofframes260ms,1);
for i=1:1:numberofframes260ms
L=length(frame260ms(i,);
Ek(i)=(norm(frame260ms(i,)^2)/L;
end
sumN = 0;
for i=1:1:length(En)
sumN=sumN+En(i);
end
sumK = 0;
for i=1:1:length(Ek)
sumK=sumK+Ek(i);
end
EnP = zeros(numberofframes20ms,1);
for i=1:1:numberofframes20ms
EnP(i)=((En(i))/sumK);
end
treshold = 0.5;
lambda=treshold*sumN;
M=numberofframes20ms/numberofframes260ms;
coff=zeros(numberofframes20ms,1);
for i=1:1:numberofframes20ms
if (En(i)<lambda)
for k=1:1:numberofframes260ms
if (((k-1)*M+1)<i) && (i<k*M)
coff(i)=1;
end
end
end
end
正如你所看到的,首先我们必须将信号分成 20ms 帧和更大的 260ms 帧,然后我们计算每 20ms 帧的能量,做更多的数学运算,最后我们检查条件,当它适合它的语音,当它不帧时被分类为音乐。
我不知道如何开始做辨别部分。我应该使用哪些框架?我认为这并不难,因为我花了大约 20 分钟在 MatLab 中编写它。
这是我的应用播放电台的方式:
{
RadioInfo *sharedRadio = [RadioInfo sharedRadio];
NSString *program = [NSString stringWithFormat"%@",sharedRadio.list[value]];
NSURL *url = [NSURL URLWithString:program];
AVPlayerItem *playerItem = [AVPlayerItem playerItemWithURL:url];
self.playerItem = [AVPlayerItem playerItemWithURL:url];
self.player = [AVPlayer playerWithPlayerItem:playerItem];
self.player = [AVPlayer playerWithURL:url];
[self.player pause];
[self.player play];
}
这是我在这里的第一篇文章,所以请善待。我会感激和帮助。我被困在这部分。
Best Answer-推荐答案 strong>
如果您想获取音频数据并播放它,您可以使用比 AvPlayer 更低级别的 API。 AVPlayer 太高级了,它不能让你访问音频数据。您可以通过 HTTP 检索您的音频,并在分析后使用 AvAudioPLayer 框架播放它。当然,很多事情你必须自己实现。
NSURL *url = [NSURL URLWithString"http://devimages.apple.com/iphone/samples/bipbop/bipbopall.m3u8"];
NSData *soundData = [NSData dataWithContentsOfURL:url];
// analyze sound data here and switch URL if needed
audioPlayer = [[AVAudioPlayer alloc] initWithData:soundData error:NULL];
audioPlayer.delegate = self;
[audioPlayer play];
关于iOS将来自URL的音频分成帧,我们在Stack Overflow上找到一个类似的问题:
https://stackoverflow.com/questions/26761417/
|