最悪なことに気づいたわ


俺は書籍は一旦1200dpiでスキャンしてソフトで600dpiに圧縮することで高画質低容量を計っていたんだよ。

で、画像込みの文章ページの場合は白黒スキャンだと画像の写りが悪いから、
グレーでもスキャンして、白黒で撮った文章ページの上にグレーで撮った画像部分を切り貼りするっていうやりかたしてた。

でも、1200dpiで撮った白黒、グレー画像をそのまま画像編集に持ち込もうにしても僅かな傾きがあるから
傾きを補正してから画像編集の段階に移ろうと判断した。

でも傾き補正はAcrobatで600dpiに圧縮する時についででしてくれるんだよ。
だから俺は1200dpiで撮ったページを先に600dpiに圧縮しつつ傾き補正してから画像編集ソフトで切り貼りすることにした。

切り貼りが終わったら、そのページをPDFの該当箇所に差し込むだけなんだけど、
画像編集ソフトで切り貼りが終わった段階ではjpgファイルだからOCR情報がない。
そこで切り貼りが終わった画像ファイルにOCR情報を付加させるために“再度”600dpiで圧縮したんだよ(Acrobatは圧縮時に傾きだけでなくOCRも付加してくれる)

こうして切り貼り完了済みかつOCR付加の画像(PDF)をスキャン書籍の該当箇所に挿入。


こういうことを今までずっと繰り返してきたんだけど、
振り返ってみると写真等込みのページについては2度600dpiに圧縮してるんだよ
だから10倍にアップしてみるとハッキリと画像の劣化が見て取れる……
悲しすぎる