【プログラム入門】 Python画像解析入門 (第5回 OCRを利用したプログラム) 1/4

Python OCR
タネゾー君_python5回目-1

 

今回は、プログラム入門として
Pythonで画像解析ソフトを作るための入門向けの
情報発信をします。

Pythonで作る画像解析入門、
第5回 OCRエンジンを利用したプログラムとして、
プログラムの処理を記述したいと思います。

 

タネゾー君_python5回目-2

 

今回は、ご覧の内容で説明できればと思います。
よろしくお願いします。

 

タネゾー君_python5回目-3

 

前回の復習を行います。

 

タネゾー君_python5回目-4

 

前回は、pythonの新規ファイルの作成と
変換対象の画像の準備を行い、
OCRエンジンを利用できるように変数toolに代入し、
変換処理対象の画像を変数img01に代入しました。

 

タネゾー君_python5回目-5

 

早速ですが、OCRのライブラリの機能を利用して
実際にプログラムで文字データの変換を行っていきます。

 

 

タネゾー君_python5回目-6

 

 

まず画像を文字データに変換するため、OCRエンジンの変換用の関数を利用します。
変換結果を変数に格納するため、作成した変数 txt01 に処理結果を代入します。

引数は、変換したいデータと読み取り対象としている言語、読み取りするための方法、
となります。

これから順に説明します。

 

 

タネゾー君_python5回目-7

 

一つ目の引数は対象となる画像データを指定します。
画像データについてはopen関数で取得したデータを変数img01に代入したため、
ここではimg01を指定します。

 

 

 

タネゾー君_python5回目-8

 

二つ目の引数は読み取り対象となる言語を指定します。
今回は日本語を対象としますので、jpnを指定します。

 

 

タネゾー君_python5回目-9

 

三つ目は読み取りする方法を指定することとなります。
方法は0~13番目まであり、文字認識の結果が異なります。
今回は標準的な方法としたいため、デフォルトとされている3としました。

ここで、わからないこともあるかと思うので、
さらにこの処理の内容を細かく確認します。

 

~続く~

コメント