【プログラム入門】 Python画像解析入門 (第4回 プログラムの記述と基本) 2/3

Python OCR

【プログラム入門】 Python画像解析入門 (第4回 プログラムの記述と基本) 2/3

全編公開中
タネゾー君_python4回目-10

 

次に、プログラムをインポートしていきたいと思います。

 

 

 

タネゾー君_python4回目-11

 

まず初めに必要な機能が入ったプログラムファイルをimportする必要があります。

具体的には、必要な機能をこれまでPCにインストールしてきましたが、実際に作成するプログラムで利用できるようにしないといけません。
その為に、目的の機能が入っているファイルをプログラムに取り込みます。
importを行うことによって、インポートしたプログラムの機能を利用することが可能となります。

 

 

 

 

タネゾー君_python4回目-12

 

今回importが必要なものはPILに含まれているImageと、Pyocrとなります。
記述は

from PIL import Image
import pyocr

となります。

 

 

 

 

タネゾー君_python4回目-13

 

インストール済みであるTesseractをPyocrで利用できるように、Tesseractのexeファイルをインストールしたパスをセットします。
Pyocrはここまでで説明したように、TesseractをPython環境で使用するためのラッパーとなります。
ラッパーとは異なるプログラムをつなぐ中間のようなものとなるため、Tesseractの実行ファイルであるexeファイルをPyocrにセットすることとなります。

 

 

 

 

タネゾー君_python4回目-14

 

改めて、Pyocrの役割について説明すると、図のようにPythonとTesseractの翻訳を行っているようなイメージとなります。
言語の違いによる問題や形式が違うことにより翻訳機のような存在が必要となります。

 

 

 

 

タネゾー君_python4回目-15

 

 

ここから、プログラムを記述していきながら基本的な要素について確認していきます。

 

 

 

 

タネゾー君_python4回目-16

 

 

次に、PILのImageの中のopen関数にてocr-test.pngという画像ファイルを読み込みます。
読み込んだ画像は、変数img01にて参照できるようにします。

 

 

 

 

 

タネゾー君_python4回目-17

 

関数という言葉はあまり聞きなれない方もいるかと思いますが、関数はコンピュータに対する命令のようなものとなります。
open関数はファイルを開くための命令となります。

その命令の詳しい処理がPILの中のImageに含まれているため、image.openとなっています。
関数のカッコ内のファイル名の部分は引数呼ばれており、計算や出力、入力してほしいデータを記述する対象を入力します。

関数によって引数に、任意の数字を渡すものや、モノの状態を渡したり、今回のようにファイル名を渡したり、関数の処理内容によって異なっております。

どんな処理をしたいのかで関数を使い分け、使用したい関数の引数に何が必要かによって、必要なデータを用意する等しながら、プログラムを作成していきます。

 

 

 

タネゾー君_python4回目-18

 

変数とはプログラム上で扱いやすいようにデータを格納するものです。
元の値をここに一旦いれておいて、プログラムにて足したり、引いたり変化させていきます。
最終的にプログラムの演算結果として出力等行います。

 

 

 

 

~続く~

コメント