我正在做一个 OCR 项目。我的第一个任务是从 iPhone 相机拍摄图像,然后在图像上找到特定的单词。
下面是我的设备拍摄的示例图像,现在我想找到单词“STATIONERY”的位置,并在图像上用黄色矩形突出显示它。
我该怎么做?我需要先为此使用 OCR SDK(如 ABBYY)还是可以这样做?
Best Answer-推荐答案 strong>
如果需要获取特定单词的坐标,当然需要先进行OCR。请记住,由于它的底部,您可能会对您附加的那个小图像有一些困难。 OCR 会在具有简单相似背景的情况下做得很好。
关于 OCR SDK - 试试 ABBYY Cloud OCR SDK ,它是 ABBYY 最近推出的基于云的 OCR SDK。它处于测试阶段,所以现在它完全免费使用,并且有一个随时可用的 iOS code samples .
它具有 xml 格式的内置坐标提取功能,我已经裁剪了图像的底部以使背景清晰,并将其发送到 SDK,这是我得到的响应:
<charParams l="35" t="39" r="73" b="83" charConfidence="100">S</charParams>
<charParams l="77" t="39" r="117" b="83" charConfidence="100">T</charParams>
<charParams l="120" t="40" r="164" b="83" charConfidence="100">A</charParams>
<charParams l="165" t="40" r="204" b="83" charConfidence="100">T</charParams>
<charParams l="211" t="40" r="225" b="83" charConfidence="100">I</charParams>
<charParams l="231" t="40" r="276" b="84" charConfidence="100">O</charParams>
<charParams l="285" t="41" r="325" b="84" charConfidence="100">N</charParams>
<charParams l="334" t="42" r="370" b="84" charConfidence="100">E</charParams>
<charParams l="377" t="42" r="419" b="85" charConfidence="100">R</charParams>
<charParams l="428" t="42" r="469" b="84" charConfidence="100">Y</charParams>
这些“l”、“t”、“r”、“b”参数代表左、上、右和下,它们描述了每个字符的左上角和右下角的矩形。我相信这正是您想要的。
关于ios - 如何在相机 View 拍摄的图像上突出显示一大块文本,我们在Stack Overflow上找到一个类似的问题:
https://stackoverflow.com/questions/8653770/
|