danglingfarpointer's memoization

仕事周りでの気付き、メモ、愚痴などを書いていきます。

2015-01-01から1ヶ月間の記事一覧

Tesseract OCRで数字の認識

オープンソースで最も認識精度が高いと言われている文字認識エンジン、Tesseractで数字を認識してみる。名刺の中の電話番号を認識する、という想定。OSはMac OS X. 画像の準備 名刺っぽいプリントアウトをスマホのカメラで撮影。 画像サイズは2592x1944. 人…

文字認識エンジンTesseract OCRで学習

はじめに Googleの文字認識エンジンTesseract 3.02での学習プロセスの備忘録。OSはMac OS X. jTessBoxEditorという、学習を省力化するツールを使ってみる。 題材として、デジタル時計や電卓のような文字を認識するための学習をする。文字は[0-9]と:に限定。 …