アマチュア無線や電子工作,バイクの話などを徒然なるままに書き散らすメモ程度のblogです.


by jq1ocr

OCRed by Acrobat 9

雑誌はデフォルト電子化するようにしています.スキャンした雑誌類はファイル名こそ気をつけてましたが,中身については画像データの PDF のままにしていました.スキャナに付属の OCR ソフトは大体窓用なので,林檎國住人としては,無理に OCR にかける必要もないし...とは思っていたものの,処理をすれば検索が容易になるので,簡単にできるならかけたいなと思っていました.

すると,Acrobat にその機能があるではないですか.通常 PDF を見るのには OS 付属の preview を使っていたので,Acrobat の出番はありませんで最近まで気づきませんでした.(PDF を作るのは Mac では簡単なので,わざわざ Acrobat 系のソフトを起動することもなかった)小さなファイルをいくつかやってみた結果,意外と使えるなぁと思いました.

解析には時間がかかるのですが,フォルダごと複数ファイルを指定することも可能です.手始めに QST の入ったフォルダを丸ごと OCR してみました.上書きも怖いので,とりあえずはファイル名に _OCRed をつけた処理後のファイルを作成する設定にして Go です.QST1冊でだいたい10分くらいのようです.(iMac 2.8GHz Core2Duo使用) ファイルサイズも 100MB くらいだったものが 70MB くらいになります.まあ写真とか結構入ってますからね.純粋に文字ばかりの書類だともっと小さくなりそうです.
[PR]
by jq1ocr | 2011-02-02 07:50 | 徒然話 | Comments(0)