自炊技術総合27 @電子書籍板
■ このスレッドは過去ログ倉庫に格納されています
機種選定に正解なし
スキャナに詳しい人でも君が望んでいる品質や予算が分からなければ答えられない
出たばかりでレビューもろくにない新機種なら尚更 >>160
ありがとうございます
kindleで漫画を買ったことあるんですが、あれくらいの解像度があって読めたら十分です。
ググった感じでは、新機種の方がスキャン速度があがってるみたいですね。奮発して新型のScanSnap買います
https://www.youtube.com/watch?v=c014zStJ2S0 近所のブックオフが閉店なんだけど、閉店セールやばいな。
抑えてたつもりなのに数えたら累計137冊買ってしまってる。
何割引の時買うかが勝負の分かれ目だな。
これぐらい自炊の量が増えても何とも思わなくなった自分が恐ろしい。 数えられるぐらいならまだ大丈夫
進行すると数える気なくなるし月に何十冊も処理してるのに何故か総数が増える まあ自炊のゴールが見えてきたのが大きいのかも知れん。
あと本棚2つ分ぐらい+137冊。
でも油断するとすぐ増えそうだ。 >>162
電子化されてる漫画や小説で解像度に不満がないなら、
もう電子化されたものを買い直したほうがいいよ
自炊にかける時間で何冊も本が読めちゃう 俺今まで自炊する時にはページ番号はしっかりと原本と対応させる事にはしっかり注意を払ってた
大抵の本は冒頭、本編、索引で番号付けが振り直されてるから、PDF内の番号もしっかりと対応させてた。
(さすがにi,ii,iii,iv,v…といった文字種までの対応はさせてはいないが)
それとPDFのプロパティで、PDFを開いた時の初期表示の方法は「ページパネルも表示」「単一ページで表示」「全体表示」にすることにしたわ
でもガチ職人はPDF内にしおりを作って目次と対応させてる人までいるんだな
さすがに俺はそこまではしてないわ
そこまでやると1冊当たりの労力が格段に上がるでしょ ix1500で全部PDFにした後acrobatの無料期間の二週間で全部OCR処理しようと思うんだけどこれってできないとかある?例えばix1500で一旦OCR処理しちゃうと上からより精度の高いacrobatでOCRかけれなかったり二週間のお試しじゃページ数とか限られるとか 以前のAcrobatの縦書きのOCRは壊滅的だったはずなので
どれくらいよくなったか報告もよろしく >>167
最近は元原稿がデータの事が多いから、そういったやつは電子版の方が暗部やトーングラデの表現性が段違いにいいからね >>167
一冊数分で取り込めるのに、一体どんな本なら何冊も読めるんだい?
と思ったら>>168氏の↓産業みたいなことやってるひとかい?
たいへんだなあ(はなくそほじほじ >>170
acrobatDCproで処理したことあるけど200ページ位の本一冊歪み補正とOCR処理に三分かからないくらい
ただix1500でかけた後にacrobatで処理したことないからそもそもできるのかどうかも分からん AcrobatはOCRのさい解像度勝手に下げられたりしてたけどProだとどうなのかね
実行時のオプションで避けられたとは思うがその辺よく把握しないまま
試用期間で焦って始めると後でハマりそう clearscanってよくわからんのだけど誤認した文字は誤認したまま表示されちゃうの? 透明PDFがテキスト化されるのとは違うんだろうしこの問題は発生しないと考えていいのか アクロバット9でクリアスキャンした感想
・ファイルサイズは10分の1ぐらいになる
・原画から文字部分が削除され文字に置き換えられる
・したがって誤認されると違った文字になる。特に数式系が顕著
文字オンリーの小説ならともかく、それ以外で使おうとはとても思わないな、俺は 決定的に違うのは
クリアスキャンすると原画に手を加えられるって所だな
PDFにOCRかけた場合はレイヤー層を上に重ねてそこにテキスト情報を付加されるだけであって、原画には(圧縮はあっても)手が加えられる事はないからな 朝晩の通勤で読み終えた本
休日でスキャンしおえ
焼酎を飲みながらバタピーをつまみつつ
読み耽る秋の夕方 読了前に読み終えた部分を先行してスキャンしてしまうこともあり
残った部分はマスキングテープとガムテープで簡易製本して読む
しかし見た目が無様なので
ガムテープはせめて銀か黒にしようと思った >>179
ありがとう
うーん、ベクター化の失敗ってならわかるけど、それだと透明テキストを表示してることになっちゃうと思うんだ。識字はまた別の話なんじゃ
あとバージョンによってどの程度の差異があるのか気になる 透明テキストはルビのように画面上に見えないテキストを置くだけだけど
ClearTextはフォントやレイアウト込みで再現され画像と置き換えられる
失敗したら結構取り返しが付かない >>183
ありがとう
そのリスクはあるんだよね。
ファイルサイズが小さくなるし、文字も綺麗になるならいいなあと。
前提として、技術書だとか専門書メインにサクサクiPadで読めればいいんだ。何度も回転するから、ファイルサイズが結構重要なんだ。
運用としては元の画像PDF or 非圧縮PDFも一緒に保管しとくのがいいのかな。設定としてはどんな感じがいいのかな。仮にclearscanやめて圧縮で読むとしたら、どのへんで折り合いつけるべきなんだろ 圧縮率を高めるために文字を差し替える技術は、差し替えられてない字とのフォントの差が美的センスの許容外なので使わない
読む前に自炊する派なので、読むのがストレスになるならオーバークオリティと割り切って設定を下げる
読むのに使わないなら意味ないから、高品質設定を別に残すこともしない
いざとなったら本を買い直す だよなぁ〜
自炊愛好家にとってクリアスキャンは普通に要らない 絶対に見る事が無い20年前の技術書とかマニュアルを処分しようと丁寧にスキャンしてると
俺何してるんだろうって気分になる 俺は5冊とか10冊なら思い出としてスキャンする
多かったら普通にあきらめる >>187
自炊そのものが目的なので
わりと造ったPDFが今後どうあろうとどうでもいいんだよな
(データ消えちゃったりしたら愕然とするけど)
でも家にずっとほっといた数十年前のパソコン雑誌なんかを取り込んでると
謎の達成感があるわ ここの自炊愛好家らって海外アプロダにアップされてる方の自炊電子書籍には興味ないの? ってか捨てれそうなものはスキャンしてから捨てるってのがデータ的にも部屋の空間効率的にもメンタル的にも良いでしょ
アマゾンで買った掛け時計の説明書なり組み立てカラーボックスの説明書なり、はたまた、
区役所等で拾ってきた各種ビラ・パンフレットだって
大体はすぐに要らなくなるんだからスキャンして後はポイ捨て
でも、最近はネット販売されてる商品は説明書もホームページにアップされてる事が多いから
そこから(綺麗な)PDFをダウンロードしたら紙の説明書等は廃棄してるわ こういう数ページ~40ページぐらいの冊子等は裁断しようにも薄すぎて出来ないし、
そもそもホッチキスで留めて折りたたんでるタイプが殆どだから
カッターで切り離してからスキャンしなきゃいけないのがちょっと面倒
すんげーめんどくさいのが、広げると新聞紙レベルの巨大紙面だけど、折りたたむ事によってコンパクトサイズにしてる奴
アコーディオンみたいに折りたたんでる奴も。
カッターで逐一切り離してページ順に揃えるところから初めからいかんからな 断裁は1枚からできるし
ホッチキス閉じはホッチキス抜いて広げて中央から断裁すればいいだけだし・・・ >>195
ペーパーカッターでの裁断の話じゃないぞ?
大型裁断機だぞ?
薄い冊子だと、冊子を固定するプレスが効かないから裁断できないんだよ おおっと素人が口を出してはならないレベルの高度な会話でしたね
大変しつれいいたしました >>187
20年捨てられなかった未練をデジタル化して断ち切れるんだから無意味ではないと思うよ。 >>192
しかもなかにはマルチ言語なだけで、用があるのは紙面の1/8ぐらいだったりw >>196
別途、薄いやつようにローラーカッターを買ってみるとか。カールあたりなどなど。あれはあれで割と便利よ。 なんか知らんがあぼ〜ん祭りになっとるな
例の子が来てるのか 200DXなら1枚でもいけるよ
受け木の状態をちゃんと把握してれば 大型裁断機って言うからには業務用のでっかい裁断機なんじゃないの?
自炊裁断機とか中華裁断機とかのオモチャじゃないだろ。
自炊裁断機なら一枚切りできるし。 なるほど、つい200DXくらいの事だと思いこんでたけど、確かにあの手の機構としては普通サイズだから大型とは言わないのかも。 OCRソフトかけたPDFに、別のOCRかけるとどうなるかわかる人教えてください〜
前のOCRの情報は消える? それとも、メタ情報的に残る? 俺もそれかなり気になって動けない状態
もし上書きできるなら
自炊自体全部業者にまかせて簡単なOCR処理だけ自分ですればいい
けど初めにOCR処理したソフトと後からOCRかけるソフトで変わるんじゃないかと。
ScanSnapはScanSnapで読み込んだものしかOCR処理できないみたいだし Acrobatのように既存のPDFを加工するソフトはわからんが
市販のOCRソフトの場合は画像をjpegで抽出してPDFを作り直すものが多い
PDFtkで画像PDFと透明テキストPDFを合成できるんで前にやってみたが
画像+透明テキストPDFにさらに透明テキストPDFを合成するとテキスト部が2重にできてしまう
分離の方法は分からなかった 二重なるデメリットはファイル自体が重くなること?
二重になった分検索に引っかかりにくくなった?
むしろ二重になった分検索に引っかかるようになる? レイヤー層は分かれてるっぽいので一応検索はできる
情報増える分重くはなるだろうが一冊丸々試したわけじゃないので実用への影響は知らん
一見して分かるところだとFoxitReaderのテキストビューアがめちゃくちゃ残念な感じになる
https://i.imgur.com/ohc35lx.png >>212
楽しく読んでたけどコマコマンドンドで声出してわろた
確かるるののももよいよい。。も秀逸
浮き上がって見えてきそう >>212
Foxit Readerを試してみたけど、縦書きの文書をテキストビューワーで見ようとして行き詰ってしまいました。 海外製のソフトなので縦書き文章の表示には未対応の模様
けどこれ以外で透明テキストを可視化できるリーダーを自分は知らないので確認用に使ってる >>212
おぉ、充分参考になります
ありがとう
あとちょっと面白いw 透明テキスト使う人いるんだな
図鑑とかそういう奴やるのかな
OCRするときは
テキスト化してepub作っちゃうから
ちょっと新鮮 むしろ自炊でテキスト起こしまでやってる人いたんだ
テキストに置き換えられるほどOCRに精度がないから
苦肉の策で透明テキスト乗っけてる人がほとんどってのが現状なんだけど Google Booksのプレビューなんかも固定レイアウトの画像にOCR情報だから
一概にそうも言えないかもねー タテスジ関連の検証があっさり終わってて残念。
誤爆する状況を追い込んで探すくらいはしてほしかった。
「確実」でない以上は個人で判断して使うかどうか判断するしかないんだけど、
従来より搭載されていた機種との違いがあるのかとか気になるんだよね。 >>219
まぁ、epub作るのも趣味なのかもしれんね
e.Typist、ルビも拾えるから気に入ってる
OCRした後は、青空文庫の解説みて
間違いやすい文字を正規表現で検索してラフに修正
その後は、実際に読んでみて違和感ないかを探す感じ
問題は完成すると読み終わってるので、
何度も繰り返し読む好きな本以外はおすすめしかねますw >>222
縦筋に困ってたからこれ買っちゃうかも
http://amzn.asia/d/a4I3FZe
でもアマゾンの評価は低いね レビュー後編で最後に書かれてるけど、
ユーザーが求めるのは「ワンタッチで99%うまくいけば残り1%は失敗してもいい」ではなく、「この方法でやれば100%成功する」という確実性ではないかと思う。
これなんだよね。
これがわかっていながらタテスジ除去の検証がテキトーなのはダメってことかね。
機能ONにしたらどこかで縦のラインが消えてるかもしれないというリスクを潜在的に負うことになる。と
例えばタテスジ処理したページのスキャンは処理なしと処理済を同時に吐くとか、
そういった安全策の機能が欲しいな。 まあ言ってもスキャナーなんてタテスジが全てだからな ScanSnap iX1500
最大セット可能枚数 50 枚なのか
50枚だと単行本一冊むりなんだよな
2回にわけないと駄目でそれが面倒だから
最大セット可能枚数100枚で出して貰いたかった >>228
そんなもん後でフリーソフトで修正できるじゃん
縦線はそうはいかないから随時pcモニターに張り付いてなきゃいけない タテスジ対策も装填枚数も、スキャン位置や傾きも
業務機だとかなり改善するんだけどな。
そういったコスト削減して家庭用の価格帯に落とし込んでるとはいえ、
超音波で重送の心配が一掃されたくらいの決定的なメリットがないと
物理的なコストアップ要素は削除対象なんだろうね。
改善したいなら中古業務機に行くのが手っ取り早いと思うよ。 ADFでスキャン画質がかなり良い20万以下の(中古)業務機って何がある? 縦筋よりも歪みが問題だよ
あれはすごいテンション下がる 歪みは後補正でどうにもならないからねぇ
>>229
縦筋も修正は可能
手間考えると取り直した方がはやい場合も多いけどな
縦線で一番悩まされたのはDR-5010C
ぱっと見で分からん細くてクッキリな縦線がとにかく多い
DR-6010Cは埃が落ちやすい機構なのでだいぶ楽になった
fi系はボケ気味なので軽いものなら補正で飛ばせる
ただし薄いトーンも飛ぶ >>231
20万以下ならよく出てくるモデルではX10C以外みんな射程圏内じゃね?
X10Cが20で出てるな・・・
自分は白黒背景使い分けたいのでPFU機になっちゃうけど、
ストレート搬送出来て光源2本でCCDでってことでfi6670あたりを勧めたい。
黒背景専用でいいならcanonが結構候補に挙がるけど、
G1100とかの世代のモデルはなかなかな出てこないね。でてもかなり高いし。
9080Cまで戻るとアレだし、
6030はわからないけど5010はA3エントリー機であって高性能に振った機械ではないし。
カメラメーカーだけあって発色がいいという話も聞くが、自分にはよくわからん。 fiのタテスジはホコリの位置によってボケたりクッキリだったりするね。
ガラスに近いホコリはクッキリ、光学系内部だとボケる傾向にある。 >>234
え?縦線ってフリーソフトじゃ無理でしょ?
フォトショみたいな高級ソフトでギリじゃん それ言い出したら見開きの上下ズレ(伸び)もフリーソフトじゃしんどいじゃろ
フラベでなるべく伸びないようにスキャンしたあとどう調整してもズレて合わない部分は
フォトショで部分的に歪ませるなどの処理が必要になってくる 見開きってズレてる方が見開きっぽいんじゃね?
伸びとかどのレベルまで要求してんのか知らないけどchainLPとかで縦固定すると基本同じサイズだし いやあのさあ…
そんなこと言い出したら
縦線あったほうが自炊っぽくていいんじゃね
とかも通用しちゃうじゃん
そもそもが人によって求めるものが違うんだから
>228に>229のレスの時点でどうかと思うわ
考え方が違うんだからほっとけば >>241
いや実際の漫画は見開きの繋ぎ目なんて完全には見えないじゃん
180度ブチ開けば別だけど
ハッキリとせずイメージ膨らむエリアだろ見開きのジョイント部って
そして実際の漫画に縦線なんか無いだろ、比べる方がおかしい
さらに傾きも言ってるんだから傾きはpc前に張り付かず後でフリーソフトで対策できるのは当たり前じゃん、何言ってんの? 後で対策できる傾き等と後でどうにもならんからその場でやり直す必須の縦線とを同列に扱うなと言ってるわけで 見開きのずれってページの間に少し空白を作ると小さいずれなら大丈夫じゃない? フォトショ買った身からするとフリーソフト縛りとか
何でそんなマイルール前提になってるんだかわからんがまあ頑張れ
俺はコンじるで縦線消すわ 他人の及第点はそれなりに参考になるし興味が無いわけじゃないが、
判断基準として有効なのは本人だけだろ。
オレが正しい合戦とか押し付けはイラネ >>242
3次元で曲げられる本とモニタで見る電子書籍では見え方が違うし脳の補完のされ方も違う
そちらがどう思うが自分は平面上で180度開いてる状態で強制的に
見させられる電子書籍の見開きが繋がってないのは気になるし
>228もそう思ったから書いただけだろう
そんなもん他人に意見されたって感覚的な話なんだから変わるわけないし
反論されても困りますよってこと (無線閉じの)マンガ雑誌の場合、カラーページは通常見えないであろう根元まで印刷されてて驚く
のり排除の為に切断するとき、いつも断腸の思いで切ってる(おおげさ >>247
強制的に見せられるって言うけど例えばみんな大好きperfectviewerなんてわざわざ見開き部分に薄暗いモヤ作ってリアルに近づけてるけどな
それに本質は後で修正できるかその場でやり直しかという手間の話だろ?
後で何とかなるモンは忙しい時でもまとめて済ましとけば暇なときに修正できんだよ
縦線みたいに修正できないものはもう一度スキャンし直し、そしてそれを確認するためにずっとプレビューをチェックしなきゃならん、pc前で張り付いて
その手間の違いを言ってんのに個人の感覚だとか何言ってんの?
縦線何ページも続いても気にならんような感性のヤツは傾いてても縮んでても気にならんよ、当然ソフト補正なんて考えもしない 個人の感覚ではスキャン時にPCに貼りつくのは大前提で当然だと思ってるし
縦線はあっても気にしないのではなく縦線を残すような状況自体をまず作らないわ
そこを最大の手間だというのは ID:JYm/7PDn 個人の感覚だと思う、自分はそうは感じてないし
縦線:スキャン時にチェックで回避可能、フリーソフトでの除去不可、フォトショでの除去可能
斜め:フリーソフトでの除去可能、欠けを防ぐにはオーバースキャンでの取り込み&トリミング処理が必要(そこそこ面倒)
見開き:ノド保護のための本解体(not裁断機)、ノビ歪み防止のためのフラベスキャン、フォトショでの結合処理
努力で乗り越えられるという点では縦線は一番難易度が低い(個人の感覚です)
見開きは金と手間と技術を駆使しやること全てやっても紙の時点でズレてる場合はどうにもならんこともある
絶望度としてはダントツ
異論はもちろん認める
完全に個人の感覚なんで >>250
だからそのpc前待機しなきゃならん面倒な縦線が放置できるようなソフトウェア開発せいっちゅう話やん
振り出しに戻るけど
新製品開発にあたって
スタートが新スキャナーのタテスジ対策の話なんだよ、脇から「いやタテスジよりも〜」って口挟んできてるだけで
scansnap本スレでも延々とこの話だしな
お前の言ってることは本末転倒なんだよ 一番ハードルの低い縦線を対策してくれりゃpcチェック手抜きできる、楽になるって話
それ以上こだわるなら勝手にやればいい、だけどお前も認める一番難易度の低い縦線をはよ対策してチェック地獄から開放してくれってこと
だからその先にあるもの持ち出したり傾きとか持ち出すのは本末転倒だって言ってんの
「縦線より〜」じゃねーよ
お前の言う難易度の低い縦線をクリアできてないのに あと、
>見開きは金と手間と技術を駆使しやること全てやっても紙の時点でズレてる場合はどうにもならんこともある
絶望度としてはダントツ
とか言ってるけど一般化するなよ
俺は見開き処理なんてしてねーよ
真ん中は濁したままで見たいんだよ、よりリアルに
見開き完全に結合するヤツなんてそんなに居ないだろが 自動で縦線消してくれるスキャナ出してってドラえもんに頼めばいいんじゃねえの? 紙の時点ズレてる場合以前もあるんだけどな
例として漫画家の三○本礼(○は伏せ字だけど調べればわかる)
多分見開きシーンで真ん中部分はテープ貼ってアナログとして描いてそう
とにかくひどいよ、電子の方もひどい >>253
一般化してないよ、完全に個人の感覚っていうてるやん
君が言ってるのは『君の理屈』でこちらが言ってるのは『私の理屈』
君の理屈の外で動いてる人間に君の理屈は通らないんだよって言ってるだけ
まあでも>251読んでIX500に夢見すぎちゃった子だというのは分かった
ScanSnapクラスの安物家庭用スキャナで縦線を完璧にどうにかするのなんて最初から無理だし
文句言ったってどうにもならんけどね
ないものねだりの垂れ流しはせめて専スレ言ってどうそ 何にしてもスキャナの自動修正機能って作動したかどうかが後からわからないことが多いよね。
処理のログ残せるような機能とか無いんかね。 「高い業務機使うと、カラーページをこんなに綺麗にスキャン出来るんだぞ」っていう
自慢のサンプルスキャン見せてくれないか?
IX500との比較があれば尚更嬉しい 業務機のメリットは機構の物量からくる搬送安定性だからなぁ。
とりわけカラーの発色が良いとかそんなのは無いだろ。
あえて言えばカラーを売りにしてるcanon機だろうな。
PFUもパナもそれ程カラーを重視してるようには思えん。
そもそも元原稿が見れないのにカラー云々言っても意味ないんじゃないか?
好みもあるし。
あとcanonならWebサイトにサンプル無かったっけ?。 ぶっちゃけそこまでして他人に業務機かってほしいなんてことは全くない。
「綺麗な」なんて曖昧な基準に対して明確な回答なんて出来んよ。
自力でショールーム行くなり、勢いで見切り発車するなりの決断が出来ないなら家庭用でいいんじゃね。 ■ このスレッドは過去ログ倉庫に格納されています