项目地址:http://code.google.com/p/tesseract-ocr/
最简单的应用示例代码:
#include <allheaders.h>
#include <baseapi.h>
#include <strngs.h>
#include <publictypes.h>

#pragma comment(lib,"liblept168.lib")
#pragma comment(lib,"libtesseract302.lib")

int test_ocr(char* img_path)
{
    tesseract::TessBaseAPI tessApi;
    int ret = tessApi.Init(
        "<tessdata所在的目录>",
        "eng", // 中文:"chi_sim"
        tesseract::OEM_DEFAULT,
        NULL,
        0,
        NULL,
        NULL,
        false);
    if(ret != 0)
    {
        return ret;
    }

    tessApi.SetPageSegMode( static_cast<tesseract::PageSegMode>( tesseract::PageSegMode::PSM_SINGLE_BLOCK));
       
    STRING text_out;
    if (!tessApi.ProcessPages(img_path, NULL, 0, &text_out))
    {
        return -1;
    }

    // 返回的字符是UTF-8编码
    // text_out.string();
   
    return 0;
}

// 这里的test.jpg是经过处理得到的二值化单行文本。
test_ocr("C:\test.jpg");

程序的目录结构:
test.exe
tessdata
liblept168.dll
libtesseract302.dll

参考:
http://blog.csdn.net/yasi_xi/article/details/8763385
http://www.cnblogs.com/baizx/archive/2010/08/23/1806136.html
http://club.excelhome.net/thread-897117-1-1.html


本文链接地址: 开源OCR引擎Tesseract的基本应用
http://qingfengju.com/index.asp?id=376

分类:Win32/C++ 查看次数:9507 发布时间:2014/8/29 21:39:31

WinMerge是一款开源的文件对比合并工具。
http://winmerge.org/

WinMerge提供了“过滤器”功能,可以在对比目录时排除特定的目录或文件,下面是一个过滤器的示例,用来排除ClearCase的.copyarea.db文件。

ClearCase.flt

## "##"是行内注释

## WinMerge 文件/目录过滤器标题和说明
name: ClearCase 过滤器
desc: ClearCase 辅助文件过滤器

## 设置过滤器的类型
## "include" 过滤器对比所有不匹配规则的的项
## "exclude" 过滤器仅对比所有匹配规则的的项
def: include

## 过滤规则
## 文件过滤器的格式 "f: <正则表达式>"
## 目录过滤器的格式 "d: <正则表达式>"
f: \.copyarea\.db$

过滤器使用方法:
工具 -> 过滤器 -> 文件过滤器 -> 安装(选择此.flt文件)


本文链接地址: WinMerge 的文件/目录过滤器
http://qingfengju.com/index.asp?id=375

分类:杂谈随感 查看次数:8376 发布时间:2014/7/29 19:35:19