在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
来园子也有一段时间了,一直没时间写点东西,说实话刚开始也不知道写什么,一直以来对验证码识别比较感兴趣,曾经想着自己处理图形实现识别验证码,不过感觉对我来说太难了,偶然中再网上发现了Tesseract,于是就想借助Tesseract 来实现简单验证码的识别,正好今天周末有时间写了这点东西。 1、Tesseract介绍: Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生--2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。 2、下载Tesseract: http://code.google.com/p/tesseract-ocr/downloads/list,可以到这里下载一些识别必须的文件。 3、编写代码: Tesseract可以在命令行中运行,但觉得不太好用,于是就通过代码调用DOS命令实现图像识别 1 using System.Diagnostics;
图片识别以后会把识别的内容保存在一个txt文件中,我们可以通过代码将保存在txt文件中的内容读出来,直观的显示出来 读取txt文件 1 public static string LoadDataFromTXT(string filePath)
这样运行以后就可以看到这样的效果
经过多次实验发现对于这种简单的数字验证码,识别正确率还是非常高的,但是对于我们中华民族博大精深的汉字,它表现的是否也如此优秀呢?那就让我们来做一下实验。。 在网上随便截一张带有汉字的图片:
让我们来看看汉字的识别效果吧: 大家看了一定很失望吧,对于汉字不是太给力,得到的结果乱七八糟,根本不能用,还要有很大的改进之处啊。。。不过它还是为我们识别一般验证码提供了方便。。
到这也基本讲完了,顺便讲一下如何实现窗体淡入淡出效果 using System.Runtime.InteropServices;
效果呢就是这样: 至此全部结束,第一次写东西也不知道怎么写,也没什么技术含量,不过还是希望和大家一起学习,一起进步,有什么问题、指教请留言。。。
|
2023-10-27
2022-08-15
2022-08-17
2022-09-23
2022-08-13
请发表评论