X



トップページ電子書籍(仮)
1002コメント346KB
自炊技術総合27 @電子書籍板
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2018/09/21(金) 18:11:55.68ID:YUqrT2i9
書籍を自分でスキャンして電子化する、
通称「自炊」についてのスレッドです。

■前スレ
自炊技術総合24 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1501637878/
自炊技術総合25 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1515530055/
自炊技術総合26 @電子書籍板
https://rio2016.5ch.net/test/read.cgi/ebooks/1523430737/

■関連スレ
【コミック】自炊技術総合スレッド43冊目【書籍】
http://yomogi.2ch.net/test/read.cgi/download/1442423719/

■参考サイト
自炊技術Wiki
http://wikiwiki.jp/bookjisui/
0103名無しさん@お腹いっぱい。
垢版 |
2018/10/07(日) 04:04:27.16ID:Gf7O58ax
>>102
ページ単位の操作だけ?
ページの中まで直接いじるとかはない?
俺的には、1ページ内において文章エリアと写真・表エリアを認識して、
文章エリアについてはワード感覚で編集出来たり、写真・表エリアについては画像編集ソフトみたいにいじれたら最高に良いんだが
0104名無しさん@お腹いっぱい。
垢版 |
2018/10/07(日) 04:06:38.98ID:Gf7O58ax
それと圧縮率ってどうなん?

Acrobat9のOCR掛ける機能はOCR掛けると同時に600dpiへの圧縮が出来るんだが、
1200dpiの白黒書籍を600dpiに圧縮した時はほぼ見た目の劣化無しにファイルサイズが4割になる。
カラーの場合は3割ぐらいになる
カラーも600dpiに圧縮しても見た目の劣化はほぼ無し(20倍ぐらいに拡大したら劣化が分かるが)
0105名無しさん@お腹いっぱい。
垢版 |
2018/10/07(日) 08:36:32.16ID:l1dzTgza
>>103
その辺は引き続き可能だけど劇的な進化は特に感じなかったな。
OCRまわりはほとんど使ってないから分かんないや。すまん。ただ圧縮アルゴリズムが新しくなったって話は聞いたとこないので変わってないかも?
0106名無しさん@お腹いっぱい。
垢版 |
2018/10/07(日) 11:06:47.03ID:wtM0+ATp
7万くらいするんでしょ
7000円でも迷うのに

OCRソフト+CubePDF Utilityでまだこと足りてる
ページを入れ替えても透明テキストが消えることもない

PDFの画像の傾きとかまで補正したかったら
必須なんだろうな
0114名無しさん@お腹いっぱい。
垢版 |
2018/10/11(木) 11:42:26.94ID:OTS3flc6
>>112
PK-513?
台座を45°回転で直るぞ

>>113
おめ
連続20冊ノークリーニングでスキャンして縦筋の状況をレポートしてくれ
0118名無しさん@お腹いっぱい。
垢版 |
2018/10/11(木) 15:44:45.75ID:W2zKQYIh
200DXは収納のたびに受け木は外すし、
自覚無しで知らないうちにローテーションしてるかもしれんけどね。
0123名無しさん@お腹いっぱい。
垢版 |
2018/10/13(土) 08:48:42.34ID:ji01ZFIK
お前らix500のままでファイル補正ソフト買うってパターンはないのか??
俺はそれでいこうか悩んでるとこ
0124名無しさん@お腹いっぱい。
垢版 |
2018/10/13(土) 09:11:19.62ID:Y2sE0I3I
何を補正する気か知らんけど
ライン抜けや歪みは後補正でどうにかできる類のもんじゃないぞ
0128名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 00:18:37.97ID:mEEcA/Lk
縦線てそんなに致命的かな。
代えのきかないものは、フラットのスキャナを使って、そこまでしないなら気にしない。
割り切って考え出したら楽になったよ
0131名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 06:18:09.72ID:PQ/wope4
>>128
そりゃ致命的だろ
スキャナー品質の98%は縦線の有無
というか縦線あったらコピーじゃない、似てても全く別なもの
0135名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 09:10:24.58ID:oRv4M+fi
>>132
古めのコミックを元にした市販の電子書籍で縦線が出てると、紙本がなくなり、電子書籍のデータしか残っていないような状況になったとき、不完全なデータしかないということで文化的には損失だな。
まあ、今の市販の電子書籍は解像度や圧縮率の問題で不完全品と言わざるを得ない代物だから、文化の継承という意味でどちらにせよ無意味だが。
0138名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 11:39:32.31ID:wkqXSrZZ
>>135
>>古めのコミックを元にした市販の電子書籍で縦線が出てると、紙本がなくなり、
>>電子書籍のデータしか残っていないような状況になったとき、不完全なデータしかないということで文化的には損失だな。
背景が単色なら(例えば白黒書籍なら背景は白)手作業で縦線消去は手間がかかるが個人でも可能
10年ぐらい先にはAIというか高性能なPDF編集ソフトがそれぐらいは補正してくれそうな希望的観測はある
0139名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 12:23:51.75ID:atQz6MZV
縦線以前にアナログコピーなんて劣化すんのがデフォだし
似て非なるものになるのが当たり前なんだがな
コピーじぇねえって言われたらそうだよとしか返しようがないわ

だからこそできるだけ原画に近くなるように画質の良い機種を選定するし
機械的には除去不可能だがユーザー側で回避できる縦線が98%とか
根拠が分からなさすぎてまったく同意できない
0140名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 13:40:52.38ID:6icyNu3Y
品質を理由にスキャンをやり直す理由の98%が縦線というなら同意できる
他の品質はゆがみも含めて設定までの段階で追い込み済みだから
0141名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 14:42:48.83ID:8cluyaqO
フラベスキャナ
ガラスの裏のゴミどこまで妥協出来る?
スキャン範囲に毛タイプあったら分解掃除決定だけど
0142名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 18:23:06.63ID:XgVd3Jkb
妥協点なんて人それぞれなことなのに。

割り切るのも、気にかけるのも結構だが、
それは自分のなかだけにしてくれ。
0145名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 21:51:46.34ID:XgVd3Jkb
妥協点を開陳しあうのは別にいいと思うけど、
同意できないとかいう話になると決着なんてつかないだろ?

この手の話は最終的には好きにしろってことになるのがオチだ
0146名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 21:58:50.21ID:z9j7JIhf
別に縦線以外全部許容する派を否定する気はないが
98%とかどっから捻り出したかも分からん具体的な数値出してきて
それが当然みたいな言い回しされても困る
0148名無しさん@お腹いっぱい。
垢版 |
2018/10/14(日) 22:09:10.70ID:wkqXSrZZ
俺にはなんでお前らがそんなに縦線ごときにこだわるのかが理解出来ん
一番重要なのは写真・図表と文字文章が混在してるページをスキャンした時に、写真・図表はハッキリ、文字文章はくっきりを両立させることが至上命題やろ
当然ADFで
0151名無しさん@お腹いっぱい。
垢版 |
2018/10/15(月) 10:24:59.16ID:2wIkKMA7
写真か文字かコミックか雑誌かビジネス目的かでも違う
コミック漫画なら縦線は致命傷
縦線が5枚も続いたら気になって集中出来ないし読みたい気持ちも一気に萎える
ビジネス書類やらレシートやら雑誌なら気にもならない
0152名無しさん@お腹いっぱい。
垢版 |
2018/10/15(月) 10:31:10.00ID:obvfqrMc
雑誌って一括りにしてるけど中身によるだろ…
文章中心のとビジュアル中心のとあるだろうに
0154名無しさん@お腹いっぱい。
垢版 |
2018/10/15(月) 11:16:49.14ID:CPAnn5YX
どうせいつものIDなし白黒君だろ
人と基準が違う自覚もなしにごり押ししてくるんだから相手するだけ無駄
0157名無しさん@お腹いっぱい。
垢版 |
2018/10/15(月) 23:32:10.95ID:OnRMs8Cq
ハハハ、オレも。

何故かマウス型スキャナやモバイル用スティック型を買ってしまったり。

A3が鬼門。今までスキャナに費やした金でADF付きA3対応の新品買えたかも。
0158名無しさん@お腹いっぱい。
垢版 |
2018/10/16(火) 13:35:40.04ID:D5v2UIcr
やっぱ大都市圏にあるブックオフは安くていい古本売ってるね
ちょっと気になるってレベルですぐに買ってしまう
で、気になるってだけだから碌に読まずに自炊だけして終わる
0159名無しさん@お腹いっぱい。
垢版 |
2018/10/16(火) 14:16:33.94ID:Sb/LART8
自宅の漫画や小説500冊以上を全て自炊しようとおもってるんだけど
今から個人で漫画や小説とか文庫本をスキャンするならScanSnap iX1500が良い?
詳しい人おすえて
0161名無しさん@お腹いっぱい。
垢版 |
2018/10/16(火) 17:34:33.63ID:jrhBZnHM
機種選定に正解なし
スキャナに詳しい人でも君が望んでいる品質や予算が分からなければ答えられない
出たばかりでレビューもろくにない新機種なら尚更
0163名無しさん@お腹いっぱい。
垢版 |
2018/10/16(火) 23:08:57.92ID:8lZMD7Qt
近所のブックオフが閉店なんだけど、閉店セールやばいな。
抑えてたつもりなのに数えたら累計137冊買ってしまってる。
何割引の時買うかが勝負の分かれ目だな。
これぐらい自炊の量が増えても何とも思わなくなった自分が恐ろしい。
0164名無しさん@お腹いっぱい。
垢版 |
2018/10/16(火) 23:13:39.56ID:B4YVt87y
数えられるぐらいならまだ大丈夫
進行すると数える気なくなるし月に何十冊も処理してるのに何故か総数が増える
0165名無しさん@お腹いっぱい。
垢版 |
2018/10/16(火) 23:32:02.30ID:8lZMD7Qt
まあ自炊のゴールが見えてきたのが大きいのかも知れん。
あと本棚2つ分ぐらい+137冊。
でも油断するとすぐ増えそうだ。
0167名無しさん@お腹いっぱい。
垢版 |
2018/10/20(土) 20:43:43.93ID:K5tgREPZ
>>162
電子化されてる漫画や小説で解像度に不満がないなら、
もう電子化されたものを買い直したほうがいいよ
自炊にかける時間で何冊も本が読めちゃう
0168名無しさん@お腹いっぱい。
垢版 |
2018/10/20(土) 21:09:27.09ID:3vLbK2gH
俺今まで自炊する時にはページ番号はしっかりと原本と対応させる事にはしっかり注意を払ってた
大抵の本は冒頭、本編、索引で番号付けが振り直されてるから、PDF内の番号もしっかりと対応させてた。
(さすがにi,ii,iii,iv,v…といった文字種までの対応はさせてはいないが)

それとPDFのプロパティで、PDFを開いた時の初期表示の方法は「ページパネルも表示」「単一ページで表示」「全体表示」にすることにしたわ

でもガチ職人はPDF内にしおりを作って目次と対応させてる人までいるんだな
さすがに俺はそこまではしてないわ
そこまでやると1冊当たりの労力が格段に上がるでしょ
0169名無しさん@お腹いっぱい。
垢版 |
2018/10/20(土) 21:15:41.92ID:Oa76771n
ix1500で全部PDFにした後acrobatの無料期間の二週間で全部OCR処理しようと思うんだけどこれってできないとかある?例えばix1500で一旦OCR処理しちゃうと上からより精度の高いacrobatでOCRかけれなかったり二週間のお試しじゃページ数とか限られるとか
0172名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 00:53:52.71ID:dl0vXC3O
>>167
最近は元原稿がデータの事が多いから、そういったやつは電子版の方が暗部やトーングラデの表現性が段違いにいいからね
0173名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 03:18:30.97ID:L83ahq+7
>>167
一冊数分で取り込めるのに、一体どんな本なら何冊も読めるんだい?

と思ったら>>168氏の↓産業みたいなことやってるひとかい?
たいへんだなあ(はなくそほじほじ
0175名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 07:35:12.13ID:Iqv0rbRv
>>170
acrobatDCproで処理したことあるけど200ページ位の本一冊歪み補正とOCR処理に三分かからないくらい
ただix1500でかけた後にacrobatで処理したことないからそもそもできるのかどうかも分からん
0176名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 08:29:51.35ID:5XL9IcWN
AcrobatはOCRのさい解像度勝手に下げられたりしてたけどProだとどうなのかね
実行時のオプションで避けられたとは思うがその辺よく把握しないまま
試用期間で焦って始めると後でハマりそう
0177名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 13:22:40.48ID:biHlE+gI
clearscanってよくわからんのだけど誤認した文字は誤認したまま表示されちゃうの? 透明PDFがテキスト化されるのとは違うんだろうしこの問題は発生しないと考えていいのか
0178名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 15:18:54.85ID:EIDklYfH
アクロバット9でクリアスキャンした感想

・ファイルサイズは10分の1ぐらいになる
・原画から文字部分が削除され文字に置き換えられる
・したがって誤認されると違った文字になる。特に数式系が顕著

文字オンリーの小説ならともかく、それ以外で使おうとはとても思わないな、俺は
0179名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 15:20:40.74ID:EIDklYfH
決定的に違うのは
クリアスキャンすると原画に手を加えられるって所だな

PDFにOCRかけた場合はレイヤー層を上に重ねてそこにテキスト情報を付加されるだけであって、原画には(圧縮はあっても)手が加えられる事はないからな
0180名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 17:15:34.36ID:KDbXKS8v
朝晩の通勤で読み終えた本
休日でスキャンしおえ
焼酎を飲みながらバタピーをつまみつつ
読み耽る秋の夕方
0181名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 17:18:50.30ID:KDbXKS8v
読了前に読み終えた部分を先行してスキャンしてしまうこともあり
残った部分はマスキングテープとガムテープで簡易製本して読む
しかし見た目が無様なので
ガムテープはせめて銀か黒にしようと思った
0182名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 17:22:26.19ID:biHlE+gI
>>179
ありがとう

うーん、ベクター化の失敗ってならわかるけど、それだと透明テキストを表示してることになっちゃうと思うんだ。識字はまた別の話なんじゃ
あとバージョンによってどの程度の差異があるのか気になる
0183名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 17:57:33.70ID:OrzKjQj9
透明テキストはルビのように画面上に見えないテキストを置くだけだけど
ClearTextはフォントやレイアウト込みで再現され画像と置き換えられる
失敗したら結構取り返しが付かない
0184名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 18:58:20.33ID:biHlE+gI
>>183
ありがとう
そのリスクはあるんだよね。
ファイルサイズが小さくなるし、文字も綺麗になるならいいなあと。
前提として、技術書だとか専門書メインにサクサクiPadで読めればいいんだ。何度も回転するから、ファイルサイズが結構重要なんだ。
運用としては元の画像PDF or 非圧縮PDFも一緒に保管しとくのがいいのかな。設定としてはどんな感じがいいのかな。仮にclearscanやめて圧縮で読むとしたら、どのへんで折り合いつけるべきなんだろ
0185名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 20:04:52.36ID:3z5oNpCZ
圧縮率を高めるために文字を差し替える技術は、差し替えられてない字とのフォントの差が美的センスの許容外なので使わない

読む前に自炊する派なので、読むのがストレスになるならオーバークオリティと割り切って設定を下げる

読むのに使わないなら意味ないから、高品質設定を別に残すこともしない

いざとなったら本を買い直す
0187名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 23:33:51.77ID:uqNke4Ej
絶対に見る事が無い20年前の技術書とかマニュアルを処分しようと丁寧にスキャンしてると
俺何してるんだろうって気分になる
0189名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 23:57:07.92ID:L83ahq+7
>>187
自炊そのものが目的なので
わりと造ったPDFが今後どうあろうとどうでもいいんだよな
(データ消えちゃったりしたら愕然とするけど)

でも家にずっとほっといた数十年前のパソコン雑誌なんかを取り込んでると
謎の達成感があるわ
0191名無しさん@お腹いっぱい。
垢版 |
2018/10/22(月) 01:24:39.85
ってか捨てれそうなものはスキャンしてから捨てるってのがデータ的にも部屋の空間効率的にもメンタル的にも良いでしょ

アマゾンで買った掛け時計の説明書なり組み立てカラーボックスの説明書なり、はたまた、
区役所等で拾ってきた各種ビラ・パンフレットだって
大体はすぐに要らなくなるんだからスキャンして後はポイ捨て

でも、最近はネット販売されてる商品は説明書もホームページにアップされてる事が多いから
そこから(綺麗な)PDFをダウンロードしたら紙の説明書等は廃棄してるわ
0192名無しさん@お腹いっぱい。
垢版 |
2018/10/22(月) 01:29:07.42
こういう数ページ~40ページぐらいの冊子等は裁断しようにも薄すぎて出来ないし、
そもそもホッチキスで留めて折りたたんでるタイプが殆どだから
カッターで切り離してからスキャンしなきゃいけないのがちょっと面倒


すんげーめんどくさいのが、広げると新聞紙レベルの巨大紙面だけど、折りたたむ事によってコンパクトサイズにしてる奴
アコーディオンみたいに折りたたんでる奴も。
カッターで逐一切り離してページ順に揃えるところから初めからいかんからな
0195名無しさん@お腹いっぱい。
垢版 |
2018/10/22(月) 02:12:04.44ID:YUezP/5D
断裁は1枚からできるし
ホッチキス閉じはホッチキス抜いて広げて中央から断裁すればいいだけだし・・・
0196名無しさん@お腹いっぱい。
垢版 |
2018/10/22(月) 04:10:24.53
>>195
ペーパーカッターでの裁断の話じゃないぞ?
大型裁断機だぞ?
薄い冊子だと、冊子を固定するプレスが効かないから裁断できないんだよ
0197名無しさん@お腹いっぱい。
垢版 |
2018/10/22(月) 04:14:50.27ID:YUezP/5D
おおっと素人が口を出してはならないレベルの高度な会話でしたね
大変しつれいいたしました
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況