ios - 在 iOS 中同时管理文本到语音和语音识别
<p><p>我希望我的 <code>iOS</code> 应用使用文本转语音向用户读取它从服务器接收的一些信息,并且我还希望允许用户停止这样的语音命令。我已经尝试过像 <code>OpenEars</code> 这样的 iOS 语音识别框架,我发现问题在于它正在监听和检测应用程序本身正在“说”的信息,并且它会干扰用户语音命令的识别。</p>
<p>有人在 <code>iOS</code> 中处理过这种情况并找到了解决方案吗?在此先感谢</p></p>
<br><hr><h1><strong>Best Answer-推荐答案</ strong></h1><br>
<p><p>实现起来并不是一件小事。不幸的是,iOS 和其他人记录了通过扬声器播放的声音。您唯一的选择是使用耳机。在这种情况下,语音识别可以继续监听输入。除非插入耳机,否则在 TTS 期间 Openears 中的识别被禁用。</p>
<p>如果您仍然想实现这个称为“介入”的功能,您必须执行以下操作:</p>
<ol>
<li>存储您通过麦克风播放的音频</li>
<li>实现降噪算法,有效地从录音中删除音频。您可以使用互相关在录音中找到适当的偏移量,并使用频谱减法来去除音频。</li>
<li>识别剩余信号中的语音。</li>
</ol>
<p>如果不对 openears 源进行重大修改,就不可能做到这一点。</p>
<p>相关问题是<a href="https://stackoverflow.com/questions/20495397/android-speech-recognition-while-music-is-playing" rel="noreferrer noopener nofollow">Android Speech Recognition while music is playing</a> </p></p>
<p style="font-size: 20px;">关于ios - 在 iOS 中同时管理文本到语音和语音识别,我们在Stack Overflow上找到一个类似的问题:
<a href="https://stackoverflow.com/questions/37066457/" rel="noreferrer noopener nofollow" style="color: red;">
https://stackoverflow.com/questions/37066457/
</a>
</p>
页:
[1]