【プログラム入門】 Python画像解析入門 (第3回 OCRを実装する) 2/2

Python OCR

【プログラム入門】 Python画像解析入門 (第3回 OCRを実装する) 2/2

全編公開中!
タネゾー君_python3回目-DESKTOP-802JJIT-part-2

 

ここからは、紹介しました必要な機能を、
実装する環境に準備していきます。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-3

 

まずはじめにOCRエンジンであるTesseractをインストールします。

Windows版のインストーラーはドイツの文字認識を行っているマンハイム大学図書館
提供しているものをダウンロードします。

64bit版をダウンロードします。
その下の32bit版でも問題ありません。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-4

 

ダウンロードしたインストーラを起動すると、
言語の選択画面となるので、英語を選択

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-5

 

その後、しばらく設定等が続きますが、
デフォルトとしてすすめます。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-6

 

Choose Componentsの画面が表示されたら、
Additional script date 「+」を展開してスクリプトデータを選択していきます。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-7

 

展開された画面の中からJapanese scriptJapanese vertical scriptを選択します。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-8

 

次に追加言語データの選択を行います。
Additional launguage date の「+」を展開します。

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-9

 

展開された画面の中からJapanese Japanese vertical を選択します。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-10

 

続いてフォルダの設定画面はデフォルトのままとするため、
NEXTとし、次の画面でインストールを選択します。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-11

 

インストールが終了したら、NEXTをクリックし、
次の画面表示でFINISHとなります。
これでTesseractの準備は完了となります。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-12

 

これからPyocrをインストールするのですが、
その前に使用するPIPというものについて説明します。

PIPとは、Pythonで記述されたパッケージソフトをインストール、管理するためのシステムです。
主にPyPIというオープンソースのPythonのパッケージが公開されているデータベースから
インストールすることなります。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-13

 

では、説名したPIPを使用して実際にインストールしたいと思います。
まずコマンドプロンプトを起動してください。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-14

 

次にPIPにて、インストールを行います。
PythonにてPIPのコマンドでPyocrのインストールコマンドを使用するため、
記載のように記述し、実行します。

pipが実際にインストールされているディレクトリを参照して、
Pipのインストールコマンドを動かすようなイメージとなります。

コマンドを入力しましたら、インストールが始まったのち完了します。

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-15

 

インストール後は、PIPにてLISTコマンドを入力して、
正常にインストールが終了しているかを確認しましょう。

 

 

 

タネゾー君_python3回目-DESKTOP-802JJIT-part-16

 

出力された内容を確認すると、PyocrPILLOWを確認できました。
Pyocrをインストールすることで、PILLOWもインストールされています。

これで実行環境の準備は完了です。

コメント