OStack程序员社区-中国程序员成长平台

标题: ios - 在 iOS 中同时管理文本到语音和语音识别 [打印本页]

作者: 菜鸟教程小白 时间: 2022-12-13 16:13
标题: ios - 在 iOS 中同时管理文本到语音和语音识别

我希望我的 iOS 应用使用文本转语音向用户读取它从服务器接收的一些信息，并且我还希望允许用户停止这样的语音命令。我已经尝试过像 OpenEars 这样的 iOS 语音识别框架，我发现问题在于它正在监听和检测应用程序本身正在“说”的信息，并且它会干扰用户语音命令的识别。

有人在 iOS 中处理过这种情况并找到了解决方案吗？在此先感谢

Best Answer-推荐答案

实现起来并不是一件小事。不幸的是，iOS 和其他人记录了通过扬声器播放的声音。您唯一的选择是使用耳机。在这种情况下，语音识别可以继续监听输入。除非插入耳机，否则在 TTS 期间 Openears 中的识别被禁用。

如果您仍然想实现这个称为“介入”的功能，您必须执行以下操作:

存储您通过麦克风播放的音频

实现降噪算法，有效地从录音中删除音频。您可以使用互相关在录音中找到适当的偏移量，并使用频谱减法来去除音频。

识别剩余信号中的语音。

如果不对 openears 源进行重大修改，就不可能做到这一点。

相关问题是Android Speech Recognition while music is playing

关于ios - 在 iOS 中同时管理文本到语音和语音识别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37066457/

欢迎光临 OStack程序员社区-中国程序员成长平台 (https://ostack.cn/) Powered by Discuz! X3.4