【プログラム入門】 Python画像解析入門 (第1回 基本要素について学ぶ) 3/3
どうも、タネゾー君です。
プログラム入門として
Pythonで画像解析ソフトを作るための入門向けの
情報発信をします。
今回は、Pythonで作る画像解析入門、
第1回 基本要素について学ぶとして、
OCRというものについて確認していきたいと思います。
イメージとしては
PDFのデータをワードやエクセルに文字出力したり、
スキャンした画像の数値などをデータとして保持するようなことです。
次に、具体的に何ができるのかについて一例をあげていきます。
一つ目は、家計簿の自動作成
レシートをスキャンして日付、商品名、価格をデータ化
エクセルなどに出力できれば、かなり便利かと思います。
また市場に出回っているような家計簿アプリを作成するのもいいと思います。
その場合は、アプリの作成スキルも必要となります。
二つ目は、過去の資料のデータ化です。
印刷物のみで配布されているようなデータをパソコンで処理する場合、
印刷物の文字をすべてパソコンに入力しないといけませんが、
印刷物をスキャンして文字起こしを自動でおこなえればかなり便利になると思います。
三つ目は、
免許証やクレジットカード等をスキャンして
必要な数値を部分的にデータ化します。
このようなことを行うことでクレジットカードや免許証の番号の管理が自動で
行えるようになります。
こちらは画像処理したい位置などを特定する必要がありますので、
ひと手間かかる実装となります。
最後にまとめを行います。
まず、Python とはインタプリタ言語でコンパイルが必要ない言語となります。
OCR とは画像を認識して文字出力等を行う技術となります。
それらを利用することで画像をデータ化し、作業を自動化するような便利な
ソフトウェアが作成できます
次回から具体的に画像処理のコードなどを考えていきたいと思います!
youtubeにて全編公開中!
コメント