C#OCR图片识别
图片识别的技术到几天已经很成熟了,只是相关的资料很少,为了方便在此汇总一下(C#实现),方便需要的朋友查阅,也给自己做个记号。
图片识别的用途:很多人用它去破解网站的验证码,用于达到自动刷票或者是批量注册的目的,但我觉得它最吸引我的地方是可以让一些书写的东西,自动识别成电脑上的文字,比如说手拟的合同,修改过的书面论文或者是文档,每月的花费发票需要在电脑上录入或者是汇总信息,日记本上的文章要转移到电脑上等等,我们现在就不用再头痛把它们在电脑上敲写一遍了。
本文介绍两种比较主流和成熟的识别方式:
方式一、-OCR实现。
方式二、()组件实现。
方式一、-OCR的使用。
-OCR下载地址:
其中需要使用的3个dll是.dll、DevIL.dll、ILU.dll。
需要注意的是这几个.dll是vc写的引用要在程序中用引用,关键代码:
[(".dll",="OCR",=.Cdecl)]
(,);
[(".dll",="",=.Cdecl)]
Rpart(,,,,,);
[(".dll",="",=.Cdecl)]
(,);
[(".dll",="",=.Cdecl)]
(,,,,,);
调用代码很简单只有一句:
.Show(.((,-1,,,width,)));
其中:为图片路径,、坐标均为0即可,width、图片的宽和高。
方式二、()组件实现。
在使用之前需要给大家说的是组件的兼容性不是很好,使用的时必须打上或者sp2补丁,读取中文才行。
sp1补丁地址(226M):
sp2补丁地址(301MB):
给项目添加组件引用,如图:
使用代码:
MODI.=.();
doc.();
MODI.;
MODI.;
doc.OCR(MODI..IFIED,true,true);//识别简体中文
for(inti=0;i