文本识别微信小程序
一、引言
1.1编写目的:
通过规范小程序的开发过程,达到提高质量,降低维护成本的目的。开发者应根据本指南进行小程序开发和编制小程序开发文档。
1.2背景:
在信息量非常大的时代,PDF和图片占信息量较大一部分,这就造成了用户对图片和PDF文本识别的大量需求,包括对各种语言文字、手写体、数字等。本项目目的为满足这一市场的需求。
1.3应用:
旨在为此微信小程序的开发指定规范、明确开发方向和目的。使每个成员了解自己的分工,并严格按照此文档执行。
1.4为用户解决的问题及其价值
该程序可以将图片和某些无法复制的PDF中的文字识别出来供用户使用,后期识别出来的文字能支持复制,格式规范和无乱码。在一定程度上,该程序方便了人们的学习和生活。
1.4阶段目标:
1、写出小程序的前端基本样式,后端对图片中文本字符分割的算法。
2、完善前端基本样式,后端调用百度orc进行文字识别。
3、丰富小程序界面及功能,并进行排错。
二、环境要求
运行环境:Android
开发平台:pycharm、VS code、微信小程序开发者工具
开发语言:JS、python
三、人员分工
人员名称 |
祝祥瑞 |
李博凯 |
崔鹏 |
工作内容 |
分配任务 |
绘制预期效果图 |
绘制预期效果图 |
需求说明书 |
程序前端设计 |
程序功能的代码实现 |
|
审查、修改、补充需求说明书 |
程序前端代码实现 |
实现百度OCR端口调用 |
|
程序功能的代码实现 |
|
|
|
工作量 |
32% |
38% |
30% |
四、系统划分
本小程序的系统划分:接口系统
接口系统分为:
1、获取用户手机的相机权限,若相机不授权,则无法使用拍照识图功能。
2、获取用户手机的相册权限,若相册不授权,则无法上传图片进行识别。
3、通过接口调用百度OCR,百度OCR无调用频率限制,但每天有免费调用次数限制(最高50000次)。因为该小程序未添加数据库系统,所以对于不同用户进行识别时,会重复调用此接口。
4、获取用户微信账户信息,其中包括该账户中所有的已公开信息,若用户不授权,则无法对相册进行授权。
5、由于文字体系的庞大以及其复杂性,所以该小程序的服务几乎都依赖于第三方,暂时无更好备选方案。该程序的稳定性取决于第三方库的稳定性。
6、该程序的识别准确度,取决于照片的清晰度以及文字的标准程度,照片越清晰,文字越标准,则准确度越高。可以识别的内容包括汉字、数字、英文、标点符号等。
文档源码:https://gitee.com/rui-123/year-old-city
请发表评论