自炊技術総合25 @電子書籍板
■ このスレッドは過去ログ倉庫に格納されています
>>185
いや、そういう意味じゃない
時間じゃなくて一番の心臓部って意味
スキャンしたもの活かすも殺すも画像補正しだいだろ >>186
他のソフトだって数クリックで放置だよ
ドロップするだけでクリックさえいらないのもあるわ おそらくその一年でスキャンした元画素ももう削除しちゃったんだろうなw AcrobatでOCRかけるとデフォで傾き補正されるでしょ? とりあえずIDなしレスのあぼ〜ん設定誰か教えてくれんか
あと次スレはワッチョイでお願い IDなしに効果あるかは知らんけど >>194
自分の使ってるchmateでの話になるけどNGIDのところを文字列にして入力欄は空のままOKで消えた
やったらスレがびっくりするほどキレイになった 確か日焼け汚れ飛ばして余白切りコントラスト強め傾き補正リサイズしてからでないとOCRは文字認識下がるはず っていうかacrobat自体OCRソフトとしては認識率低いよね
そしてソフトがゴマンとあるせっかくのPDFなのになぜ無料のソフト使わない >>195
ありがと!
対象を電子書籍板に絞ればID出ない板の巻き込みもなく安心ね どのソフトを使うか?無料を使わないのか?とか、本人がそこに不満を漏らしているわけでもないし
突っ込むのは余計なお世話じゃないかね?
ID無し氏の反応もアレだが、59Tuwq7/氏も無理やりツッコミを捜してるようで見苦しい >>200
本体とacrobatのみでなんとかしようとしてる所が問題の原因だと思うけど >>194
ワッチョィ化したらスレ終了でしょ
特定個人に絡む粘着ストーカー嵐が跋扈するし
過疎るから嫌だなあ >>202
gimpとか言ってるし、フリーのトールを聞いてきてもいる以上は、
少なくともacrobatoのみの状態から変わる気は有るんじゃない?
当初はさておき。 スキャンスナップってどんな層を考えてるんだろうとは思う
模範ユーザさんはこんな感じですかい
・仕上がりにとくにこだわりはなく、紙書類を捨てられて、ディスプレイで読めれば十分
・縦線など小さなことは気にしない
・300dpiでも気にしない。将来、低解像度に不満を持つこともない
・多少のページの傾きも余白も気にしない
・PDFで出力(画像ファイルは残さない)
・PDF編集はわからないので適当に捨て置く
・付属の縦書きOCRは実用にならないので割り切る もともとはビジネス文書のスキャンでしょ
大型複合機のADFのように自動装填でスキャンしてくれる機械の個人版。
e文書法対応とかアピールしてたし。 え?高画質高品質自炊を心がけてる人ってどれぐらいのコスト・労力掛けてんの? Ralpha使ってみたけど割といいね
色々試してみるわ やっぱ文字+写真ページはジレンマに悩まされる
トーンカーブやガンマを調節して文字を黒くハッキリさせようとすると、写真が暗闇みたいになってしまうし、
かといって写真をハッキリさせようとすると文字が薄くなる
やっぱこういう究極的なところは一括調整は無理なのかなぁ
さすがに1ページ毎に画像部分切り貼りは労力的に半端ないし どれくらい手間かけてるかなんて人それぞれだろ。
多かろうが少なかろうが、当人の勝手であり他人が何を言っても余計なお世話だ。
自分は手間を削減するために機材には出来るだけ妥協しないことにした。
こんな自分からしたら性能の悪いスキャナで画質に文句言って苦労してるやつは無駄な労力かけてるとしか思えんが、
だからといってその手間をかけることが悪いとは思わん。
裁断機は切れれば良いとは自分は思わない。
でも切れれば良いと思ってる人を馬鹿にしたりはしない。 >>213
>>こんな自分からしたら性能の悪いスキャナで画質に文句言って苦労してるやつは無駄な労力かけてる
IX-500は自炊の定番だと思ったんだが、4万以上したこのスキャナでさえ性能悪いって認識なのか?ある意味自炊に本気の人からすると。 4万有れば中古の業務機が選択肢に入るね。
ウチにあるスキャナのうち4台は4万以下だったよ。
scansnapはウチでは2番目に高かったスキャナだw
価格じゃなくて大きさとか騒音が問題なんだけどね。あと中古に対する意識か。 >>208
今現在はそうでもないが昔はとにかく他の追随を許さないくらい安かった
そこそこのドライバ補正を勝手にやってくれる
あの独自ドライバに慣れた人はTwainが使いにくくて駄目らしい
カスタマイズはできずオフにもできないができることが少ないというのは
悩む要素が少ないというという意味でもある
ただ、後補正前提で600dpiカラー圧縮1でスキャンって言う人も少なからず要るんだよな
そういう用途ならDRやfi買ってた方が幸せになれたのではとは思う
今だとDR-C240と値段差そんなにないし そうそう
AcrobatのClear Scanって機能が割と凄いんだが使ってる人多いのかな 99%でもずいぶん精度は低いってわかったなー
1/100は間違うから
2行のうち1文字はだめなわけかと Ralphaでトーンカーブや色調やグレースケール化や試してみたけどやっぱり今一だわ
IX-500のデフォルトアプリで白黒1200dpiの方が普通に俺には合ってたっぽい
やっぱり文字が黒くくっきりじゃないと納得出来ん >>214
ちょっと拡大しただけてもライン抜けがあれほど酷いのに高品質の訳がないだろ
ポンコツだよ、ただザッと流し読み出来ればいい人には速くて便利なだけで
古本だらけならコレでもオッケー 正解はフラッドヘッドスキャナなんて言わないでくれよ 結論出たなら良いことだ。
個人の嗜好は尊重しないとな。
もう何も手伝えることは無い。
だからグレスケの話や裁断機の話もスルーしておくれ 二極化がすげえよね
ここんとこの本格派の人々の会話内容が俺にはほとんど理解できない
高価な技術書とか写真集とかスキャンするんだろうな
俺は昔読んだSF小説とかだから超適当だ S1500使ってて綺麗にしても色線消えず、富士通のほうでも保障終了しちゃったってのもあり
そろそろ新しいのにスキャナーを変えようと思ってますが
キャノンのDR-M260使ってる方いないですか?
ドキュメントスキャナーの中では一番新しいみたいで
富士通のScanSnapシリーズの新しいモデルは出そうにない?感じで
キャノンのスキャナーに目が留まりましたので、色線の出具合など知りたいです。
>>211
Ralphaはおすすめです。
文字だけのをグレースケールにする際は
赤青緑全部1.0にすると
なんと色線が消えます。素晴らしいです。
カラーの場合は完全に駄目ですが、白黒保管の場合はおすすめです。
保管する際にスキャンした解像度のままと縦1600or2000に下げたの二種類あると良いです。
スマホやタブレットで将来的に4k対応になった際に1600がギリギリ快適に読めるレベルになると思いますが、後々で高解像度で使う形式に変更も対応できます。
確実に言えることは、スマホタブレットなど小型端末で8kの解像度の需要は皆無ですので、最終的に4kに絞った解像度適用を考えるのが楽です。 何かないものなのかね
文字だけを黒くクッキリさせつつも、画像は暗くさせずにグレーっぽくする方法は 写真に合わせて保存してビューアの方で文字読むためにコントラスト強めりゃええやん
写真見るときだけコントラスト戻して
ていうかそろそろマジでやめろイライラが半端ない >>230
お前頭悪すぎて話にならん
アホは失せろ Amazonのプリントレプリカが一般的になったらもうそっち買うわ >>236
>>https://i.imgur.com/6TsZ3Dw.jpg
やっぱりまだ文字がぼやけてる。拡大して見たらまだ妥協出来る文字感なんだがな
そのページは写真が無いから、緑色じゃ無くても構わない俺からしたら白黒でスキャンするわ
>>https://i.imgur.com/OibYFb8.jpg
こっちは文字クッキリしてるけど
何て言うんかな…朝起きて目やにがついた状態でものを見ようとすると少し霞んだ状態でものが見えるけど
Jpegでスキャンしたものを見ると全部そういう感じが少しあるんだよな >>237
いや、これはSSの保存形式がjpgだからぼやけだだけで
元のPDFファイルはまんまベクタPDFだからどんなに拡大してもぼやけないよ どこかの海外の大学で写真のような画像もベクトル変換して保存するような発表がなかったっけ?
タダの高効率非可逆フォーマットみたいな内容だったと思うけど。
そこまで行けば自炊にも意味があるかもしれんけど、
アナログスキャンする前提でのファイル形式としてはビットマップで詰めて行くしかない以上は
ベクタ画像最強とか言っても意味無いんじゃ >>238
普通にスキャナでスキャンしてから、どういうソフトでベクタPDFにしてるの? …白黒君は何でもかんでも自分に当てられたレスだと思わんほうがいいで
>234からの流れなら販売されてる電子書籍の話で自炊スキャン関係ないし
ベクターとビットマップの違いが分からない子にいきなり絡まれたら>236も当惑するじゃろ >>241
>>…白黒君は何でもかんでも自分に当てられたレスだと思わんほうがいいで
ただ単に俺の感想言っただけ、な
俺が何でもかんでも自分に当てられたレスだと思ってる思わんほうがいいで、お前
>>ベクターとビットマップの違いが分からない
ベクターって図形の形状データで記録されてるからいくら拡大してもジャギーが生じないって奴だろ? >>241
>>>234からの流れなら販売されてる電子書籍の話で自炊スキャン関係ないし
ただ単に俺の感想を言っただけだからお前の指摘は当たらない 検索も出来ないアホ相手にするなって
俺のchmateはあぼーんだらけだぜ スキャナ買って一年以上wiki詠まないどころか補正やChainLPやRalphaさえ知らなったヤツだしな
匿名掲示板なら何やっても許されると思ってるただの年寄りだろ、質問するマナーもなってないし
無視無視 自分も10年自炊してるがwikiは見たことない
でも先人のほとんどのブログはチェックしたな >>1の自炊wikiだけど情報古すぎやろ?
2000年代のスキャナの情報が残ってたし >>247
S1500が黄金期のころと今とじゃ
電子書籍の普及度が違うからな・・ 補正技術的なことについてはぶっちゃけ電子書籍板にスレが出来てから殆ど変わってない
まあ、スキャナー機種に関しても殆ど性能的には変わってないから影響もないしね キヤノンなんかもうグレード別に時々型番変えるくらいだしな
scansnapはfiのお下がりでいきなり機構ごと変わったりもするけど フォーマット別の特性なんかは情報の古い新しいもないしな
jpgがぼやけてるなんて特性知ってる人間からしたら当然だし
一回じっくり読むだけでもトンチンカンな「感想」は出なくなるのに 解体とかツールとかのデータとして纏める価値があるものはwikiが良いと思うけど、
スキャナに関してはスレで話題にしたほうが良いというか、個別対応に近い感じだと思うわ。
何をどうスキャンしてどう使いたいのかとか重要だし。
文章にすると無責任になりすぎるというか表現が難しいというか。
複数の機種を使ってて比較とか出来る人も殆どいないしね。
インプレスの記事に期待するところが大きい。 wikiって言うからにはどのスキャナでどういう設定でスキャンしたら、
もしくは、どの画像編集ツールでどの設定項目をどういう風にして編集したら、結果、どういう画像になるのかっていうのを一覧に纏めて比較できるようにして欲しかったわ
こう言う話は文字で言うだけじゃお互いの認識のズレが絶対あるからな あえて言うと
ドキュメントスキャナーでエクセレントでスキャン
Ralphaでカラーなら解像度下げてスムーズにさせる
白黒ならグレースケールにして綺麗にして解像度下げてスムーズにさせる
解像度下げるにして縦は1600以上 スコア集を裁断したらノドギリギリまでバンドメンバーのインタビュー記事があって切れてしまった… >>254
補正環境の共有化については昔から問題だったからなぁ
一昔は写真屋補正を目標に原本についてはIT8ターゲットのお陰で機種補正切り600dpiカラースキャン後のIT8ターゲット当がほぼ基準的な感じになったけど、今は一昔と違って自炊の窓口が広がった為に各自の環境基準に合わせざるえなくなって上記の設定をすすめにくくなったな >>256
逆にタブレットが4k高解像度対応が早すぎたなと思った。
まだまだ先かと思ってたのにw
それでも300dpiの縦解像度統一させるだけにしてもそんなに問題ないが
600dpiや1200dpiで保管してる方は解像度下げるってプライドの問題になりそう。
だけど、解像度縦1600-2000ぐらいが正直クリックして次のページの表示時間が綺麗で安定してるから良いんだよな
600や1200のままだと次のページの表示時間を考えたら多少画質落としてもいいって感じてしまう 10+10+10=30
10×10×10=1000
30教えるのはすぐ済むが1000教えるのは一生かかる
それぞれの基本項目を説明しただけで十分で、そこからさらにそれぞれの組み合わせのパターンまで教える必要ないんだよ
同じことの繰り返しなんだから
春先の新入社員か
それにほとんどの事は検索すりゃいくらでも出てくるじゃん
意思を伝えるための道具である「文字」を文字として「読む」ではなく「映像」として美しく「観たい」なんて特殊な事例は需要ないから供給も無いだろうけど Wikiなんだから何かやりたいと思った人がやれば良いのに、誰もやらないってことは必要ないってことでしょ。
ほしければ自分でやれば良いのでは >>208
>スキャンスナップってどんな層を考えてるんだろうとは思う
>模範ユーザさんはこんな感じですかい
>・付属の縦書きOCRは実用にならないので割り切る
キヤノン DR-C225W に付属のOCRは縦書きでも実用レベル。 実用になるかどうかは使う人の判断基準次第だと思うんだが うわあ、週跨ぎで基地外の相手してたんだ(´・ω・`;) 以前ここでビジネス文書スキャンについて何回かお世話になったけど、妥協点見つけられなかったからPNGのまま保存してる
w9先生のアクションが最新写真屋だと走らなかったりするんで色々自分でやらんとならんけど、やっぱ時間かけないと無理だわなあ 今は知らんけどS1500やfi-6130の頃のPFUの縦書きOCRは文字として認識できず謎の記号の羅列で
誰が判断しても実用にならないレベルではあったな
キヤノンは当時からまだ読める透明テキスト吐き出してた 思ったんだがOCRってそんなに重要?
そもそも日本語の認識率自体が(個人的に見てきた限りだと)7割以下かな?
で表や図の中に補足説明的に文章があったり、デザインの関係上文字が斜めになったりフォントがそこだけ特別に大きくなったりしてるともっと認識率下がるよな?
数式が入り交じるともはやまともに認識されないし
OCRってそんなに使う?
俺個人的には、「そこにとりあえず文字がある」という認識だけさせてりゃ、後々マーカーで線引きする時に少しやりやすいって程度にしか思ってないわ >>266
愛読書は必ず処理しとく
見つけたい場所が一発で開けるので
ただ、PC内のファイルを全文検索するような検索はしない
普段はEverythingで十分助かってる >>265
Canonといえば、最近最新のスキャナでDR-M260ってのがあるが
DRプロセッサーを搭載しててフラベの画質が可能になってるっぽいな
それでもフラベよりかカラーの画質は若干落ちるが スレでは多くの人が同意しなかった2値スキャン大好きな人もいるんだし、
OCRだって必要な人もいるさ このスレ常駐の方の電子書籍保有数なんて5千冊は余裕で超えてるだろうし
OCRは必須になるわな >>271
5000冊とかマジかよ
もちろん自炊で、だよな?
俺結構頑張ってきたつもりだけどまだ1000すら言ってない…
で、その5000冊の内何冊がマンガだよw 昭和50年以前の怪しい印刷品質の本だとOCRは全く役に立たないな OCRはgoogle keepがマジ優秀
飾りフォントどころか手書きですらとんでもない精度で認識されまくる
問題は画像一枚ずつ読み込んではテキスト抽出を繰り返さねばならんところ
有料でこのエンジン積んだ一括処理アプリ出してくれたら買うんだが >>273
キヤノン DR-C225W の場合、旧字体が混入した戦前の書籍(縦書)だと認識率98%ぐらい。
でも国会図書館の図書館限定配信をプリントしたのをスキャンしてみたら酷い結果でした。
>>274 を試してみます。
戦前の書籍については、「字体」が「字體」となってても認識できるけど、「と」が妙な装飾がついた字体になってるとダメ。 ここの奴らとリアルで仲良くなったら電子書籍をムフフさせてくれるんだろうな >>272
半分だな・・・
いまさらだけど、ワンルームに住んでたら9割が本で埋まってたんだろうなって思うとぞっとするw リアルで〜って話のことだろ。
家族に類する間柄なら私的複製の範囲ではあるから適法では有るよ。
数人でかつ入れ替わりなどが無い関係なら家族に類するといえるんじゃないかね。
著作権関係のインタビューによく答えてる福井弁護士がどこかで言ってたと思う >>272
逆に自炊以外であるんか?
アマゾンやebookの電子書籍は入れてないです。
安かったりセールありポイントセールなどで
購入しても解像度低すぎなので見づらい。
>>280
そっちのほうか、ってか家族の間柄は私的複製の範囲になるんだね。
それについては驚きだわ 自炊するからには自炊をし終えた書籍は捨てたいんだけど、
読了し終えてない本だとどうしても「もしかしたら、もしかしたらスキャンに何かミスがあって捨てたらもうどうしようも無くなる」という念慮が頭に浮かんで捨てられなくなる
「だったら何で自炊し終えたのに家に置いてんだよ」って自分で突っ込み入れてしまうがこの思考状態が治らないんだよな 成人向けのコミックの自炊を始めたのですがモアレってむずいですね
取り込んだ画像を拡大していくと出たり出なかったりするのですが普通ですか? 最近ググって知ったからそのフレーズ使いたいんだなコイツ
何から何まで恥ずかしいヤツ >>284
等倍で見てモアレ出てなかったらスキャンには問題ない
閲覧時の拡大縮小時のモアレはビューアの拡縮アルゴリズムで差がでる
lanczos3使えるコミックビューアでの閲覧を推奨
等倍でモアレてる場合はスキャン時のdpiが低いと思われ
600dpiでスキャン後にlan3か2段階縮小で変換かけられるツールで縮小するといい
詳しくは自炊wiki参照 >>284
通常の印刷は175線程度の印刷だから350dpiもあればモアレはだいぶ抑えられるが、
成年コミックなんかは単価が高いことや客層がニッチなこともあって上質な紙に高精細な印刷のものも多い。
なのでモアレ気にするなら600で取るしかない
特にデジタル作画の高精細トーンな作家や表紙の単色カラーは600を。
あと画像の確認は等倍表示が基本だよ。
スキャン由来の画像データ上のモアレなのか、表示上の補正由来のモアレなのか判別が付かなくなっちゃうからね。
というか拡大してモアレ出るって拡大の補正アルゴリズムに問題あるような。 ■ このスレッドは過去ログ倉庫に格納されています