我开发了具有 OCR 扫描功能的 iphone 应用程序。
使用 Tesseract api,从拍摄的图像中获取文本。
但现在我需要将每个文本与姓名、地址、电子邮件、电话号码等分开。
由于名片结构/格式不具体,因此有点难以假设。
但是很少有事情假设
1) "@"包含的字符串主要是电子邮件 ID。
2)所有带大括号或+号的数字大多是电话号码..
但仍然有很多很多的可能性。
Best Answer-推荐答案 strong>
您需要NSLInguisticTagger 的帮助class .. 这是您最好的选择,否则您将不得不为每个部分创建类似的逻辑,如上所述。
关于iphone - 名片解析器。如何从名片识别文本中提取相关信息?,我们在Stack Overflow上找到一个类似的问题:
https://stackoverflow.com/questions/10040204/
|