【プログラム入門】 Python画像解析入門 (第3回 OCRを実装する) 2/2
ここからは、紹介しました必要な機能を、
実装する環境に準備していきます。
タネゾー君_python3回目-DESKTOP-802JJIT-part-3
まずはじめにOCRエンジンであるTesseractをインストールします。
Windows版のインストーラーはドイツの文字認識を行っているマンハイム大学図書館が
提供しているものをダウンロードします。
64bit版をダウンロードします。
その下の32bit版でも問題ありません。
タネゾー君_python3回目-DESKTOP-802JJIT-part-4
タネゾー君_python3回目-DESKTOP-802JJIT-part-5
その後、しばらく設定等が続きますが、
デフォルトとしてすすめます。
タネゾー君_python3回目-DESKTOP-802JJIT-part-6
Choose Componentsの画面が表示されたら、
Additional script date 「+」を展開してスクリプトデータを選択していきます。
タネゾー君_python3回目-DESKTOP-802JJIT-part-7
展開された画面の中からJapanese script と Japanese vertical scriptを選択します。
タネゾー君_python3回目-DESKTOP-802JJIT-part-8
次に追加言語データの選択を行います。
Additional launguage date の「+」を展開します。
タネゾー君_python3回目-DESKTOP-802JJIT-part-9
展開された画面の中からJapanese と Japanese vertical を選択します。
タネゾー君_python3回目-DESKTOP-802JJIT-part-10
続いてフォルダの設定画面はデフォルトのままとするため、
NEXTとし、次の画面でインストールを選択します。
タネゾー君_python3回目-DESKTOP-802JJIT-part-11
インストールが終了したら、NEXTをクリックし、
次の画面表示でFINISHとなります。
これでTesseractの準備は完了となります。
タネゾー君_python3回目-DESKTOP-802JJIT-part-12
これからPyocrをインストールするのですが、
その前に使用するPIPというものについて説明します。
PIPとは、Pythonで記述されたパッケージソフトをインストール、管理するためのシステムです。
主にPyPIというオープンソースのPythonのパッケージが公開されているデータベースから
インストールすることなります。
タネゾー君_python3回目-DESKTOP-802JJIT-part-13
では、説名したPIPを使用して実際にインストールしたいと思います。
まずコマンドプロンプトを起動してください。
タネゾー君_python3回目-DESKTOP-802JJIT-part-14
次にPIPにて、インストールを行います。
PythonにてPIPのコマンドでPyocrのインストールコマンドを使用するため、
記載のように記述し、実行します。
コマンドを入力しましたら、インストールが始まったのち完了します。
タネゾー君_python3回目-DESKTOP-802JJIT-part-15
インストール後は、PIPにてLISTコマンドを入力して、
正常にインストールが終了しているかを確認しましょう。
タネゾー君_python3回目-DESKTOP-802JJIT-part-16
出力された内容を確認すると、PyocrとPILLOWを確認できました。
Pyocrをインストールすることで、PILLOWもインストールされています。
これで実行環境の準備は完了です。
コメント