【オープンソースで使えるOCR!】Tesseract-Ocrを試してみる【Mac版】

AI関連の実装/デモ
この記事は約3分で読めます。

はじめに

tesseract-ocrを利用し、OCRをする手順を紹介します。

プロジェクトURL:

tesseract-ocr
tesseract-ocr has 12 repositories available. Follow their code on GitHub.

tesseract-ocrをインストール

brew install tesseract

英語の文字認識を試してみる!

コマンドの実行

適当な画像を用意し、ターミナル上で以下のコマンドを実行します。

tesseract test.png result -l eng

-l engは、英語で認識するためのオプションを指定

今回はこちらの画像で検証しました。(画像元:https://en.wikipedia.org/wiki/Receipt)

eng

OCRの認識結果

英語でのOCR結果がこちら

Berqhotel

Grosse Scheidegg 3818 Grindelwald

Familie R.Mul1er

Reoh.Nr. 4572 30.07.2007/13:29:17 Bar Tisch 7/01

2xLatte Macchiato 4.50 CHF 9.00

1xGloki 5.00 5.00 1xSchweinsohnitzel 22.00 22.00 1xCh§sspatzli 18.50

Total : CHF

Incl. 7.6% MwSt 54.50 CHF: 3.85

Entspricht in Euro 38.33 EUR Es bediente Sie: Ursula

MwSt Nr.: 430 234 Tel.: 033 853 87 16 Fax.: 033 853 67 19 E—mail: grossesoheidegg0bluewin.ch

元のレシート画像と見比べてみた感じだと
英語の文字認識はある程度うまくいくことが確認できました。

日本語の文字認識を試してみよう

次に、日本語のレシートでためしみましょう。

準備

日本語の認識をおこなうためには、日本語用のデータセットを取得する必要があります。

まずは、以下のリンクから、jpn.traineddataをダウンロードしておきましょう。

tesseract-ocr/tessdata
Contribute to tesseract-ocr/tessdata development by creating an account on GitHub.

ダウンロードが完了したら、データセットを以下のパスに配置しておきます。
/usr/local/Cellar/tesseract/3.04.01_1/share/tessdata

以下のコマンドで配置するパスに移動してFinderで開きます。

cd /usr/local/Cellar/tesseract/3.04.01_1/share/tessdata
open . 

Finderが開いたらそこにデータセットを移動して下さい。

コマンドの実行

それでは、ターミナルで以下のコマンドを叩いて試してみましょう!

tesseract test.png result -l jpn

-l jpnでOCR対象言語を日本語に設定しておきます。

用いた画像はこちら(画像元:http://miettal.hatenablog.com/entry/2015/12/31/020434)

jpn

OCR認識結果

そして、読み取り結果はこちらです。

まい博すけっじ

*ネ*****ネ冷**ネ渚ネ率澪ネ撃**ネ*ネ

営業時闇 : ぁさ8時~よるー 2時 年中無休

鸞*******************************

うーーん、日本語だとうまく認識できていなようですね。。

さいごに

今回は、オープンソースで公開されているOCRのソフトウェアであるtesseract-ocrを試してみました。結果としては、英語ではある程度うまくいくようですが、日本語だといまいちでした。。

(補足)

インストール時にその他の言語データセットもまとめて同時にインストールしたい場合は以下のコマンドでダウンロードできます。

brew install tesseract --all-languages
タイトルとURLをコピーしました