自炊技術総合25 @電子書籍板
■ このスレッドは過去ログ倉庫に格納されています
>>732
kinkosは
Konica Minolta C754
とか、コニカミノルタ系の複合機を使ってます。
品質とかが気になるのなら店員さんに相談したら、一緒に解決策を考えてくれるよ。 >>666
スキャンならミニストップも良いかも。コンビニとしては珍しくカラーでも600dpiまで設定できる。スキャンの価格はA3カラーでもA4モノクロでも1枚30円。
ソースが写真・文字混在か、写真かで設定をかえられる。
ただPDFは遅いのでjpgで出力して自分でまとめる方が楽。 地域によって違うかもしれないが、
○ファミマ、ローソン、サークルKサンクス
シャープ複合機 最大400dpi
白黒コピー
B5/A4/B4/A3 10円、
カラーコピー
B5/A4/B4 50円、
A3 80円
スキャン 30円
○セブンイレブン
富士ゼロックス 200、300、400、600dpi(600dpiは白黒のみ)
白黒コピー
B5/A4/B4/A3 10円
カラーコピー
B5/A4/B4 50円、
A3 80円
スキャン 30円
○ミニストップ
RICOH MP C3004MC 600dpi
白黒コピー
B5/A4/B4 5円、
A3 10円、
カラーコピー
B5/A4/B4 30円、
A3 60円
スキャン 30円
○kinko's
KONICA MINOLTA C754e 白黒カラーとも600dpiまで
白黒コピー
B5/A4/B4/A3 9円
カラーコピー
B5/A4/B4 45円、
A3 90円
スキャン コピーと同じ料金
会員価格あり 過去の利用実績に応じて白黒1枚6円まで値引き。学割あり。 コンビニの機械はもうADFついてないだろうし、
A3フラベ替わりだな。 複合機のスキャナは文書向けに高圧縮スキャン機能が付いたりする。
スキャン画像を解析して、文字、画像、図形などを識別して置き換えることでファイルサイズを
大きく減らせるが、肝心の画質を損なうことになる。このモードは自炊には向かない。 コンビニのマルチコピー機の使用者アンケートで不満点の上位に原稿フタが重いってのが入ってたらしく、
公的文書のプリントサービス対応機にリプレースする際に各社一斉にADF無しが標準になったらしい。 有料のOCRソフトは、e typistが一番ですか?
雑誌をスキャン予定です。
600dpiにする必要ありますか?
300で十分でしょうか? OCRなんて辞書次第なんだから読ませたい文章によって違うだろ。
最適なスキャン条件はOCRのチューニング次第だから大抵はOCRソフトに推奨が謳われてる。
OCRは体験版があることが多いし試してみれば良いんじゃないか? >>747
使ってる
300〜400dpiで十分
どちらかと言うと解像度よりピントの方が重要な気がする
縦書きに強く、ルビまでOCRするからとこだわって決めたが実際はあまり必要じゃなかった
複雑なレイアウトならパナの方がよい気がする
ええタイピストではときどき図とされてしまう
二強ソフトのどちらでもいいと思う
たとえ認識率99%でも二行に一文字は間違うってことになるので、
あまり期待しない方がいい
実用上は問題ないけど気分的には結構雑だなと感じてしまう
割り切って使わないといけないと思う
縦書きには一文字ごとに空白と改行記号が入るので
むしろPDFビューアーで閲覧する際に問題が多く出る
テキスト選択がずれたり、選択範囲をコピーして検索とかよくするが
改行やスペースをないものとしてうまく処理してくれるものを探す必要があり。 PDFリーダーについておまけ
消去法でPDFリーダーでは自分の知っているのでは
Foxit Readerしか使えるのがなかった
検索結果の一覧の文字数が少ないやら設定できないとか
コンテキストメニューにGoogle検索がなかったり
いろいろ使い勝手が好きじゃないが
他のソフトでは縦書き文字では一文字しかコピーされないやら
空白が混じりいろいろ不便など
自分のベストを探してください
いいのが見つかったら教えてくださいと思う >>747
Google Cloud Vision APIが最強じゃないかな? Google Cloud Vision APIでOCRで透明テキストのPDFまでは出来るけど、そこから図とかイメージを抽出して、epub形式に持っていく簡単な方法は無いかな。
ABBYY FineReaderで手動で抽出してってのは出来そうなんだけど、果てしなく手間が掛かる。 >>748
雑誌の予定です
>>749
おお使ってらっしゃいますか!
某レビューでは、雑誌などは
パナの方がレイアウト読み込みスムーズとありましたが、
やはりそうなのでしょうか。
参考になります!
>>751
データとられちゃいそうで、、、 >>752
>Google Cloud Vision APIでOCRで透明テキストのPDFまでは出来る
良ければやり方教えてもらえませんでしょうか
OCR目当てでGoogleCloudVisionAPI登録したんだけどよくわからず
現状Keepass GoogleSyncPluginにしか使ってなくてもったいない
個人的にgoogle keepのOCR精度でPDF作れたらもう何も言うことないって思う
あれほんとまじすごい >>755
ありがとう
やっぱそっち方面の知識必要になりますか
教えていただいたURLみて頑張ってみます 炊飯器
http://www18.atpages.jp/suihanki/
半自動傾き補正&トリミング&画像補正ツール。
wikiに載ってるこのツールがリンク切れで見れない
他で落とせる場所ないですか? 読取革命買いました。
雑誌一冊、300dpiで25mbくらい。
600dpiだと、250mbになりました。
OCR時間も10倍かかってしまうのでしょうか。
まだ300の保存中ですが、
スキャン始めてから40分くらいかかってます。
600DPIですと、半日なのでしょうか、、、
何かいらない設定組み込んでしまっているのでしょうか? あれ?600dpiの方が、早く仕上がりそうです。
何故でしょう?
認識にかかる時間が大幅に短縮されました。 ChainLP v0.40-16
■何をするもの?
連番画像や圧縮画像を指定サイズにリサイズして、画像だけのLRF、PDF、ePub、Mobi、または連番ファイルを作成します。
また、青空文庫形式のテキストファイルをソースとして入力し、縦書きの画像またはフォント埋め込みPDFにすることもできます。
ChainLP使ったこと無いんだけど既にPDF化されたものを再圧縮したり
カラー画像をグレーに編集したりは無理? エプソンのDS570Wを使ってるんだけど、
給紙時に紙がたわむのか、表側上部に陰が出来ちゃう
同じ症状の人いないかなぁ https://i.imgur.com/W4vRTmX.jpg
この画質で471KB
どういう圧縮したらここまでの画質を保ってこんなに小さく出来るんだ?
https://i.imgur.com/ptULAQU.jpg
この画質で1325KB
鮮やかなままでカラースキャンがなされていつつ、同時に文字が黒くハッキリとスキャンされて、
それでファイルサイズがこの小ささ
どうしたらここまでのスキャン・圧縮が出来るの? 複数の画像をアクロバットとかで単にPDF化したばあい画像そのものの劣化は無いですよね?
jpegからPDFにファイル形式が変化することそのものが画質に影響するのかちょっと気になって… >>765
ない、と言うかソフトによりそうとも言い切れないと言うか
とりあえずコンテナの概念についてお勉強してきてはいかがでしょうか どうなんでしょうね
Acrobatでは"ファイルを単一のPDFに結合”って項目があって、そこでは完成時のファイルサイズを大まかな目安として大中小って指定出来る一方
ドラッグアンドドロップで複数画像から1つのPDFを作った場合はファイルサイズ的にほぼ変化が無いんですよね >>763
DS530使ってるけど自分も上部の真ん中が帯状に黒っぽくなる。
薄めの紙だとなる確率高いような。
該当箇所だけ補正するのは面倒なんで、
自分は漫画に影響でないように上部黒い帯が薄くなるよう全体を画像補正してスクリプト組んで一括処理しちゃってる。薄くなる程度だけど。 >>767
AcrobatというアプリとPDFというファイルは別のものとして考えないと答えは出ないよ。
PDFは基本的にただのコンテナ。いわばZIPとかと同じカテゴリ。
文書としての体裁を保つための規定が細かくあるが、それさえ守っていれば何をどう入れてもいい。
ビュワーアプリがそれを表示できるかはまた別だけど。
AcrobatはPDFをつくるためのアプリ。
Acrobatの方針として見えるのは最終的な体裁に合わせるためなら元データの維持は重視されていない。
だからデータを勝手にいじらないような設定をあえて指定しないと最終形態に合わせて勝手にデータをいじられてしまう。
もちろん元データをいじらずにPDFという形にまとめるだけのアプリもある。 >>768
ありがとう、やっぱり全く同じ症状だね
読み込み時の画質設定で対処してみるかぁ 今、複数の書籍を各フォルダに画像ファイルとして分けて格納してるんですけど
それぞれをPDF化するというのを全フォルダに対して一括してやりたいんですが
いい方法ありますか? よくわからんけどChainLPでなんとかならんの? Scansnapで縦線出るときって上の面のページが圧倒的に多い
これは両面スキャンするよりも片面を2回スキャンして繋げたほうがいいのかな
PDFファイルをページ互い違いに結合できると良いんだけど無理ならJPEGにしてから
リネームソフトで並び替えるか >>772
その複数のフォルダがひとつのフォルダの中に納まってるのであれば、
そのひとつのフォルダを指定すればまとめられるよー >>772
ごめん、勘違いしてたわ
776は忘れて
ChainLPのバッチ処理っていう機能で出来るから調べてみて 10マソ位の予算でドキュメントスキャナ買おうと思うんだけど、
オススメってありますか?
スキャンする書籍はプログラミング関連の本が中心で、図を含むモノクロ印刷です。
裁断機は置く場所が無いので代行サービスを使う予定です。 裁断代行使うならそのままスキャナまで貸してくれる業者を使って
とりあえずはどんなもんか体験してみればいいんじゃない?
とりあえずスキャンする本のサイズもわからないと機種を挙げることすらできんし、
本の量(在庫、増加ペース)がわからんと機種のグレードも読めない ソニーリーダーで買った本のDRM解除はどうやれば…
calibreに追加しようにもデータをPCに落とす方法わからない… このスレ的にはいかなる端末のいかなるデータでも
フラットベッドでスキャンすれば解決する 電子書籍アプリ立ち上げた状態の端末をフラベでスキャンするのか
キャプより斬新な方法やね
キーボード取れないノートPCだと厳しそうだにゃー コピー機でお札をコピーするとすんなり撮れない処理が入っているような
アナログ撮影の保護を解除するような話題はまたスレ違いかもしれん。
コピーするとコピーってスカシが出る紙とかあるよね たぶん光を当てたときに反射率の違いで文字が浮き上がるようになってると思われ
金属光沢と半透明のページは物理プロテクトだよな… 表示デバイスの高解像度が進むと思って、出来る限り高解像度で保存してたが、結局10インチくらいの
タブレットで読むなら、液晶が1920x1200でも3840x2400でも300dpiでスキャンしてあれば見え方に
大した差はないなって実感した 10インチの高解像度だと普通に見るなら網膜の識別能力超えるだろうね
VRゴーグルみたいに眼前に画面出すと4Kでもまだ足りないとかなるらしいが >>778
中古で1万で購入。
縦線が入りだしてどうにもならなくなったら買い替え。
だいたい毎年買い替えることになるから
予算10万で10年使える ChainLP使い始めましたが今一わかりにくいです
「漫画A」フォルダにjpeg画像が数百枚
「漫画B」フォルダにjpeg画像が数百枚
…
となってる時に一々
「漫画A」フォルダについてjpeg画像を無劣化でそのままPDF化
「漫画B」フォルダについてjpeg画像を無劣化でそのままPDF化
…
とするのは面倒なので一括で「漫画A」をPDF化、「漫画B」をPDF化としたいです 設定項目が多くてさっき試しにテストしてみたんですがファイルサイズが小さくなってて無劣化になっていない…
そもそも一括処理以前の問題として、単体で処理するのも方法が分からない状況 もしかしてChainLPって詳細設定>画像>本文>クオリティ で値100にしてても処理の過程で再エンコード・圧縮してる? ChainLPは画像の簡易加工やリサイズをする前提のソフトなので素のjpgをそのまま再格納って設定はなかったはず
複数書籍の一括処理はBatchLPでできる
漫画だったらPDFにしないでjpgzip(cbz)にまとめるほうが扱いも手軽だよ ではJpeg画像を無劣化でそのままPDF化、しかも複数フォルダを一括で出来るソフトってありますか? PDFのツールなんて探すのが面倒なくらいたくさんあるんだし
適当なのはワードで検索して出てきたツールをとにかく試してみたらどうかね?
PDF絡みで無劣化が条件に入ると本当に無劣化かどうかで揉めやすく
最終的に使う本人が判断する事になるんだよね。
というかこういう一括処理はバッチファイルとかスクリプトで何とかする方が早いんじゃないかね。 >>785
普通紙でやる技術もある。目に見えない小さなドットを埋め込んでウォーターマーク(すかし)を入れる。
それをデジタル機でコピーするとモアレのように浮き上がる。
ちなみにカラーコピーではどの機械で出力したかまで分かるので悪用しないように。 scan snap ix500で勉強ノート(ルーズリーフ)を300枚ほどスキャンしようと思うんだけどレンズどれぐらい汚れる?
スキャンし終わったら布で拭こうとは思ってるんだけど、その後に通常書籍をスキャンするのに支障でるかな? まずはそのノートには何で文字を書いたのか次第では?
仮に鉛筆のようなもので書いていたとしても
スキャナのガラス面はそれなりにきれいにできるが、
樹脂製の搬送路やローラーに付いた黒鉛成分汚れは落としにくいとおもう。
なので後からスキャンした本を汚すかもしれない。
http://www.pfu.fujitsu.com/imaging/downloads/manual/cloud_win/ix500/jp/troublecloudpc/topic/document_dirty.html
これによると鉛筆書きの場合はやっぱりそれなりに影響あるようだね。 シャーペンでノート取ってたけど濃いめの芯使ってるから鉛筆とほぼ同じ
搬送路やローラーについた黒鉛が原稿に移るとは考えてなかった PFUのドキュメントスキャナのローラーは汚れやすいよ
普通の印刷物のインクでもローラーに付くしローラー経由で原稿も汚れる
エタノールか純正の掃除液は必須 安紙漫画雑誌であんなことになるのに
鉛筆だなんてとてもじゃないが恐ろしくて 非破壊しようとハンディスキャナ買おうかと思いますがおすすめってあります?
amazonのAibecyというのがスキャン端が短いので買おうかと思ってるけど
レビューが一個もないので不安 消毒用エタノールは廉価だけど使うなよー
酒税対策で塩がいっぱい入ってるから
ガラス内に白い粉が吹く 一時期使ってたが別に粉なんてふかなかったけどな。
マツキヨで買ったヤツだけど。
酒税対策もイソプロパノール配合でクリアだし。
あとは苦味成分入りのもあるね。
塩の入った消毒用アルコールって、機械の金属部品にも悪影響あるだろうし
出来れば避けたいから具体的に製品名とか教えてくれると助かる そもそも酒税対策で混ぜ物って食品ではないことにするって方向が多いのに、
食品でもある塩を混ぜて酒税対象外になるのか?
塩化ベンザルコニウム配合のものもあるけど、これのことかな?
こいつらは消毒薬として売られてる物ばかり引っかかるけど、
消毒用エタノール銘で売られてるものの中にもあるんかな? やっぱ200万近くするスキャナを使ってる代行業者の品質にはかなわないや スキャナの品質よりもその場で状態を確認して適宜補正できる方が重要 >>808
それってどこ情報?
エタノール 塩 でググってもエタノール沈殿しか出てこないし
一般に「消毒用エタノール」と呼ばれるものは酒税対策されてないはずだけど
http://general.kenei-pharm.com/learn/influenza/2918/
http://general.kenei-pharm.com/faq/ethanol/
無水エタノール
エタノール濃度99.5v/v%以上、酒税対策されてない、高い
消毒用エタノール
エタノール濃度76.9〜81.4v/v% 残りの成分は水、酒税対策されてない
消毒用エタノールIP
エタノール濃度76.9〜81.4v/v% 飲用不可能にするためにイソプロパノールを添加(酒税対策) 残りの成分は水、安い 消毒液を消毒用アルコールと勘違いしてるだけじゃね?
店舗の入り口とかにおいてある手の除菌用アルコールには塩化物入り物があるし。 >>813
料理用酒には酒税法回避のために食塩が入ってるよ
もちろん清掃用や消毒用にはならない 折角だからシャーペンで書いたノートをスキャンし続けるとこんな汚れの影響が出てくるってサンプルアップしといた
https://i.imgur.com/FY6Bgiu.jpg
iX500で白黒で1200dpiかつ濃さ5でスキャン
シャーペンで書いたノートを300枚ほどスキャンした辺りでこのような汚れの影響が出てきた
まるでマジックペンのにじみみたいになってる
ミクロに散らばった黒鉛が影響してるのだろうか? >>820
なら塩の入った「消毒用アルコール」を挙げてくれ 安いのがいいのならまあ使ってりゃいいんじゃん
自己責任で 大した価格差じゃないからわざわざ消毒用なんて買わないが、
塩が〜とか粉吹くとか根拠不明のネタには気になるからな。
無水でも酒税対策されたものもあるし。 酒税対策されていないメタノール使ってお酒つくれそうだな
やったら駄目だが >>819だけどさっきピックローラを拭いたら黒鉛びっしり取れた
でも汚れ落としたらまた普通にスキャン出来たわ フルカラーの雑誌サイズをそれなりの品質保って1ページ800kB以下に押さえる方法教えて欲しい >>826
モアレ低減させて網点潰してノイズ除去で均す
jpg設定は サンプリング比 4:4:4にする(重要)
品質の値はファイルサイズと画質見ながら適当に調整
最後にjpegtranなどで最適化する EPSONのスキャナって黒背景にできないんだな
黒背景でオーバースキャンしてエチルトランにかけたら傾きガッツリ補正できるって知ったから期待したのに >>830
そうなのか
そうなったらやっぱり業務用のスキャナにする意味あるんだな 背景黒だとセンサーのキャリブレーションが出来ないからね。
一時的にでも白にしてキャリブレーションする機構が必要になる。
つまり余計なコストがかかる >>828
サンプリング比4:4:4にしたら元サイズの3倍になったんだが なんか設定おかしくなったせいかRalpha使うとファイルサイズがもとより大きくなるようになってしまったぞ
死ねよ Ralphaで変換したら、縦×横って意味での大きさが10倍になってしまったんだがなんで?
画面上部の「大きさ 比率(%)」って所は「100%」のままいじってないんだが
バグ? jpg to jpgで補正もリサイズもせず4:4:4で再サンプリングだけしたの?
それ全然意味ないよ
低画質の狭い箱に詰めるために捨てられたデータは高画質の大きい箱に入れ直してももう取り戻せない
ScanSnapなんかだとスキャンの段階で4:2:0にされちゃうしな
完成版で画質とファイルサイズ減の両方を取りたいならスキャンの段階ではケチっちゃダメ
600dpiできれば可逆で保存して網点潰してきちんと均してからリサイズする
補正リサイズ後のデータなら元がjpgでも4:4:4で再サンプリングする意味はたぶんある
Ralphaの設定戻したいならRalpha.ini捨てるかリネームして初期化すればええ
デフォルトだと品質90サンプリング4:2:2だから
どっちにしろIX500とかでスキャンしたjpgよりは大きくなるはずだがな 変換後のファイルが72dpiにいつの間にか落ちてたんだが?
元が600dpiだったのにどこで変わるんだ? ■ このスレッドは過去ログ倉庫に格納されています