X



トップページ電子書籍(仮)
1002コメント397KB
自炊技術総合26 @電子書籍板
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2018/04/11(水) 16:12:17.97ID:4Q8BIzUO
書籍を自分でスキャンして電子化する、
通称「自炊」についてのスレッドです。

■前スレ
自炊技術総合23 @電子書籍板
http://rio2016.2ch.net/test/read.cgi/ebooks/1485175560/
自炊技術総合24 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1501637878/
自炊技術総合25 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1515530055/

■関連スレ
【コミック】自炊技術総合スレッド43冊目【書籍】
http://yomogi.2ch.net/test/read.cgi/download/1442423719/

■参考サイト
自炊技術Wiki
http://wikiwiki.jp/bookjisui/
0488名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 13:31:05.59ID:DMtfXFg9
Google Cloud Speech API を叩けばつべの字幕(自動生成)並の精度は得られるんでね
Google Cloud Vision APIによるOCRもそうだが
ある程度自力でどうにかできる人ならどんどん先を行ける時代になってきてるね
0489名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 14:26:10.81ID:gSKOSkc5
地デジでもたとえば大河ドラマとかセリフの文字データもついてるんだけど
有効に検索に活かせるような状態にはなってないよなー
もったいなさすぎ
0490名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 15:26:56.25
文献管理ソフトなんて初めて聞いたんだが何するものなの?
自炊して沢山貯まったPDF管理にも使えるの?
0491名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 16:32:34.24ID:dKMIkqmC
電子化した本なんて50冊もないからファイラーで管理してるな
タグっぽいのとインクリメンタルサーチ、migemoだけ対応してりゃ十分
0492名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 21:00:06.77ID:ZzvFgzrF
ヤフオクの自動入札って
出品者が別IDで落札額を手動入力して試すと
こちらの入力した数字ばれるよね
ぎりぎり下まで釣り上げられるのがしょっちゅう
ああめんどくさい
0493名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 22:10:30.55ID:cX45ggjZ
その価格まで払う意思があるから入力したんでしょ?
なのになんで文句言うの?
イヤならはじめからその金額入れなければ良いじゃない
0497名無しさん@お腹いっぱい。
垢版 |
2018/06/18(月) 04:17:05.50ID:JsBN6EA4
>>493
そんな乞食行為をわかっていても
大人の対応でいちいち報告しないし見て見ぬふりをしてやってるんだ
さらによい出品者ですと評価までしてやってる
感謝しろw
0498名無しさん@お腹いっぱい。
垢版 |
2018/06/18(月) 10:39:46.49
私は宣言します

もし地震等の災害を考えた場合、倒壊・火災で大切な本がグジャグジャになったり、水浸しになったり、燃えたりする可能性があり
そうなると折角集めた本が無になる

今回の地震で自分の本が無になる恐怖が頭をよぎった

だからもう今後は大切な本であっても速やかに自炊し、紙のままで残すのは箱1つ程度に抑えます
HDDなら頑張れば5台でも常時持ち運び可能だ
0500名無しさん@お腹いっぱい。
垢版 |
2018/06/18(月) 15:50:36.77ID:J7Or/+eP
昨夜オクみてたけど
〜関連本まとめて○冊って奴で3000円くらいで落札されそうだったのが
終了間際にヒートアップして5万で落札って正気の沙汰じゃないよ
文末に裁断済って書いてはあったが
あれ見落としてないか心配
0503名無しさん@お腹いっぱい。
垢版 |
2018/06/18(月) 19:54:43.53ID:WOrqzsas
コミックの偶数、奇数ページですが、X座標はどちらも同じくらいの中央に配置するのがデフォでしょうか。
こんな配置かなと進めていくと、次の巻で全然合わなかったりで、絶対的な基準をどこに置くのが良いのか困っています。
0505名無しさん@お腹いっぱい。
垢版 |
2018/06/19(火) 00:25:42.92ID:TR1CMJhe
>>503
内枠の大きさは作品や漫画家によって違うので絶対値でのX値は決めてない
本毎に調整してできるだけセンタリングしてる
タチキリやノド側描写が多い場合は内枠の位置調整は諦める
0507名無しさん@お腹いっぱい。
垢版 |
2018/06/19(火) 21:48:24.67ID:9uq7C9n+
>>498
まえに書いたかも知れないが、
人生あと40年なら14000日
不摂生で病気になると仮定して20年なら7000日しかないんだよね
仕上がりのクオリティを追求するのもほどほどにして
さっさと活用した方がいい
0508名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 07:29:42.79ID:6tz8/v8a
自炊挑戦で調べてゆくうちにここに来ました
どんな手順でやればいいのか大体は理解できましたが
取り込みソフトBTScanがvectorの該当ページも作者のページもnot foundで
検索で掛かるのは怪しげなダウンロードサイトばかりで入手方法がわかりません
他に入手できる先があれば教えて下さい
0510名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 10:00:24.82ID:1lD10zbT
BTScanついに公開停止か
Waybackやsoctnicにもないから作者氏が意図的に消してるっぽいね

誰かアーカイブ控えてた有志が自炊wikiに上げてくれるの待ちかね
WaybackからVectorの履歴追って確認した感じだと
最終バージョンは 2013年発表のbtscan305.lzh の模様
0512名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 14:34:56.53ID:rXdLa4Dk
管理者として実行が必要だったり
ユーザーアカウント制御でひっかかるからね
初心者におすすめってわけにはいかなくなった
だから公開停止なのかな
でも代わりがない
0513名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 14:46:18.43
かまぼこ形のハードカバーの裁断
https://i.imgur.com/bYQ9TIA.jpg

ホント裁断が難しい
本書は“かまぼこ形”のハードカバーだったから一度の裁断では切れない(無理に切ろうとすると中央部の無駄な切り込みが深くなる)
本書では中央で二分割してから各々を裁断したけど、その各々でさえ切るべき所が曲面がかってたから一度で裁断できず2度裁断
結局トータルで4回裁断となったため画像でも4つ分の切れ具合が見て取れる

切り口がホント酷いね
PDF化したら90%以上は気にならなくなるといえども、こんな仕上がりになった時の気持ち悪さは半端ない
0514名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 14:51:10.80ID:gWwP+ctZ
そもそもniftyのホームページサービスが終わった後の移転先アドレスがわからん。
homepage2なアドレスのサービスって2016年で終わってるでしょ?
0516名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 18:11:05.89
自炊人生初、本そのものが一部ページ欠損してるのに出会ったわ
一瞬、裁断後でもまだページ同士がノリでひっついたり、うっかり一部のページを落としたのかと思って調べたけど
そうじゃ無くて市販されてた本そのものがページ欠損してた
欠損ページ数計20ページww
多すぎだろw
0519名無しさん@お腹いっぱい。
垢版 |
2018/06/21(木) 11:47:02.12ID:Wh5IJrAW
BTScanは3.07が最終みたいだね。
うちのも3.05だったけど。

学生時代に作ったツールとWebサイトで、
niftyのホームページサービス移行申請しなかったので自動削除
ってところだろうか。
0523名無しさん@お腹いっぱい。
垢版 |
2018/06/22(金) 10:07:36.04ID:rV5q3KiZ
まあ活字の場合は印刷時に滲みで太くなる前提で造られてるわけだから
デジタルフォントに起こすならその分の太みを入れるというのはわかる
滲み表現やランダム揺らぎまでやる必要があるかは謎
0525名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 08:50:03.24ID:Vrp45EL/
新古書店で買った本もあるんだけれど
シール剥がしはめんどくさいな
ジッポーオイルも使っているがなかなか危険
0527名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 14:49:07.64ID:pLNh01u/
自分は乾燥したセロテープ跡が一番面倒に感じる。
紙質にもよるけど粘着成分は溶剤か?したシールをペタペタやれば取れるし。
0530名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 21:12:48.73ID:BziHtzEO
昔の家庭にはベンジンがあったけれど
あれがなにかの役に立った記憶がないなー
マジックのあとさえ落とせない
0531名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 21:55:12.95ID:BziHtzEO
>>526
高いなー業務用かと思ったけど
自炊に限らず
IKEAの商品とか無神経でどでかいシールを貼ってるので
活躍してくれると思う
0532名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 22:13:31.99ID:xFH5qmKN
>>531
何かぐぐるとやけに大容量で高いやつが出て来るけど
俺は近所のホムセンでエアゾールタイプを600円?ぐらいで買ってる
値札剥がしだけに使う場合1本使い切るのが大変な程度には使い出がある
0533名無しさん@お腹いっぱい。
垢版 |
2018/06/24(日) 01:29:09.43ID:Y0i9NRhh
≫早い時間帯でまずは1点取りたいですね。
≫そして、キーになるのがセットプレー。
もう一度コーナーキック。
恐らくソン・フンミンを使いたいというような
ショートコーナーでしたがメキシコの選手も
対応しています。≫3回連続で
ショートコーナーをやってますけれども
そこまで効果的なショートコーナー
できてないですよね。

地デジの文字放送
生なのに優秀だよね
0535名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 04:59:35.48
この前自炊したpdfの量見たら900個いってたわw
白黒とグレーのスキャンとかで重複はあるものの俺も頑張ったな
0537名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 12:32:58.02ID:8/U90t2g
ワールドカップのガイドブックをコンビニで買って即自炊したのだけれど
WEBで確認したらKindle本でも売っていて、
念のためにサンプルを見たら600dpiと遜色なしで
結局何が言いたいかと言うと
自炊の醍醐味ってきれいに残すことではなく、
落書きや書き込みや思い出を残せることなんじゃないかと
思った次第で
0539名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 14:21:44.30ID:Z9I/6Gsq
>>537
モノクロだと差はでかくなるぞ
インクの滲みが無い分、暗部の諧調の表現力がかなり違う
また断ち切り?がないので表示範囲も若干大きい
なので電書が無い書籍はいかに綺麗に残すことが重要だったり
0540名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 14:24:04.18ID:T6GZVWuK
>600dpiと遜色なし
画質に関してはdpi高けりゃいいってもんでもないので
使ってるスキャナや補正技術力と市販電子書籍のデータの質によっては
逆転することはいくらでもあるんでね
0542名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 21:35:11.78ID:LcasA8dQ
1200dpiで保存していたら、えらいことになってきた>コミック。
4Kモニタで作業しているから麻痺してたけど、50%でも縦ぶつかるとかちょっとやり過ぎたかも。
0543名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 21:59:16.07ID:T6GZVWuK
スキャナは何使ってるん?
ADFだと光学600dpi超の機種はないからフラベだと思うけど
フラベで1200dpiは苦行すぎないか?
0544名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 22:11:37.44ID:LcasA8dQ
>>543
DS7500
ドライバレベルの疑似かもしれないけど、選べたのでそれで行ってる。
それでもコミック2回くらいに分けて乗せるだけだから、そんなに時間を取られない。
後の編集の方が大変。HDDじゃ無理。
0545名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 22:35:20.89ID:T6GZVWuK
ググってみたけど光学解像度 原稿台1200dpi / ADF600dpi みたいね
ADF使ってるみたいだから600でスキャンされたものがドライバで拡大されてるだけと思う
個人的に600超は趣味の世界だと思ってるけど
編集時の苦労に見合うだけの画質が得られてるかは検証したほうがいいかもよ

もっともフラベで光学1200dpiでスキャンしたからといって高画質が得られるとも限らないけど
540にも書いたけど必ずしも高dpi=高画質ではないので
0547名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 02:39:56.70ID:tkzLVLnh
印刷物の解像度が350dpi相当なので1200dpiという3倍強のスキャンは補正前提としても過剰だと思うよ
0549名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 08:38:47.96ID:J/vPlL04
コミスタ(旧)の超極薄トーン使ってる漫画なんかだと600で白飛ばしすると消えちゃうので
光学1200は有効だって話は聞いたことある
ただそこまでやる人は600と1200でそれぞれの補正方法を調整する技術力と
違いを見分けられるだけの目視力が必要になるし
極め人はそうはいないんじゃね

何はともあれ高dpiでって考えの人は案外実際のスキャン画質見てない場合も多い
将来8Kやそれ以上のモニタ使うにしても閲覧時にビューアで
Lanczos拡大したほうが軽くて綺麗って結果になると思うわ
0550名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 09:35:52.01ID:YFpvcNYi
>>549
将来のことを言うなら、OCRとAIの進歩でスキャンデータのテキスト化が可能となりdpiなんか関係なくなるのでは
0552名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 14:26:42.46ID:MTfbKJiE
印刷を適切(満足)に拾える解像度が有れば無理に高解像度にする必要はないんだけど、
可逆でもそれなりに圧縮かかることを考えると好きなだけ高解像度でスキャンすれば良いんじゃない?
それでもファイルサイズは大きくなるだろうから、
非可逆の人はそのせいで圧縮率上げる羽目にならないように見極めが大切だとは思うけど。
0553名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 20:17:38.36
最悪なことに気づいたわ


俺は書籍は一旦1200dpiでスキャンしてソフトで600dpiに圧縮することで高画質低容量を計っていたんだよ。

で、画像込みの文章ページの場合は白黒スキャンだと画像の写りが悪いから、
グレーでもスキャンして、白黒で撮った文章ページの上にグレーで撮った画像部分を切り貼りするっていうやりかたしてた。

でも、1200dpiで撮った白黒、グレー画像をそのまま画像編集に持ち込もうにしても僅かな傾きがあるから
傾きを補正してから画像編集の段階に移ろうと判断した。

でも傾き補正はAcrobatで600dpiに圧縮する時についででしてくれるんだよ。
だから俺は1200dpiで撮ったページを先に600dpiに圧縮しつつ傾き補正してから画像編集ソフトで切り貼りすることにした。

切り貼りが終わったら、そのページをPDFの該当箇所に差し込むだけなんだけど、
画像編集ソフトで切り貼りが終わった段階ではjpgファイルだからOCR情報がない。
そこで切り貼りが終わった画像ファイルにOCR情報を付加させるために“再度”600dpiで圧縮したんだよ(Acrobatは圧縮時に傾きだけでなくOCRも付加してくれる)

こうして切り貼り完了済みかつOCR付加の画像(PDF)をスキャン書籍の該当箇所に挿入。


こういうことを今までずっと繰り返してきたんだけど、
振り返ってみると写真等込みのページについては2度600dpiに圧縮してるんだよ
だから10倍にアップしてみるとハッキリと画像の劣化が見て取れる……
悲しすぎる
0556名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 20:58:14.97
画像切り貼りする作業って完全にテンプレ化された定型作業だからプログラム化して欲しいわ

同一ページを白黒でスキャンしたものとグレー(カラー)でスキャンしたもの2つを投入

プログラムが2つの画像から画像領域を解析

解析された画像領域(白黒の方とグレーの方)を見比べ一定程度の違いがあるかを判定

違いがあるならばグレーの方の画像領域を切り取る

それを白黒の方の対応する画像領域に上書きする

同一ページについて複数の画像領域があるなら全部に対して繰り返す

以上で一つのページについての作業完了

これを1冊丸ごと自動化して欲しい
完全な定型作業だから画像に詳しいプログラマにやって欲しい
0557名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 21:02:02.61
ってか、スキャナで白黒スキャンする時って一旦グレーかカラーでスキャンしたものをスキャナ内部で白黒にしてるんでしょ?
だったら、スキャン時に同時に>>556の処理も施せば一度のスキャンで画像込みページを高精細且つ文字くっきりでスキャンできるのに…
0558名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 21:12:07.56
1200dpiからの600dpiへの圧縮は絶対に譲れないからな〜
圧縮することで白黒pdfは40%、グレー(カラー)pdfは25〜30%にファイルサイズ削減出来るから大切
0559名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 21:32:13.74
PDFの各ページをPDFのまま画像編集できないのかな

一旦画像へ変換してから(画像編集の工程を挟んで)再度PDFに変換するからどうしてもファイルサイズが増減する問題を避けられない
PDFのまま作業出来たらホント便利なんだが
0564名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 02:28:04.59
あ…
>>553の件について補足すると、>>553で言ってたのは、
・1200dpiでスキャン→Acrobatで600dpiに圧縮(+傾き補正+OCR)
→(写真込みページを)jpgに書き出し @
・グレーで撮ったページから写真部を抜き出す A
・@とAを画像編集→jpgに出力→AcrobatでPDF化→Acrobatで600dpiに圧縮(+傾き補正+OCR)
ってことで、これじゃあ写真込みページは600dpiに圧縮する行為が2度あって画質が劣化した
って認識だったんだが、
白黒ページをjpg出力した”から”文字の輪郭がにじんだ(=劣化した)
ってことなのかも…w
さっきtiff出力したらjpg出力特有の「(2000%ぐらいの)拡大時に輪郭がぼやけた感じ」になったから…

こんな所で拡張子の特性を感じるとは思ってもみなかった
0565名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 03:02:24.42
さっき写真込みページをtiff,pngどちらの拡張子ででも挑戦して画像編集したけどやっぱり仕上がり具合が悪かった
やっぱり、1つのページ内に文章と写真がある場合、文章部分をtiffのように完全に白黒に分けつつ、写真部分をjpgのように色鮮やかにしつつ
それらが共存するように1つのページに収める事って無理なんだな(画像圧縮の仕様的に?)
0569名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 03:53:29.23ID:QG5vZ0w6
文字の輪郭のにじみを気にする必要があるのかな?
写真を重視した設定でPDFに取り込んで、文字がOCRで認識できるのであれば、実用上の問題は無いと思う。
0570名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 03:57:37.50ID:vUbGffPd
>>568
スキャンしたのをtiff形式で保存して、photoshopで編集するときに関係ない方をマスクして編集の影響が出ないようにしてページを完成させ、それをPDFにまとめる。
0572名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 04:01:16.43ID:dzYux2mc
基本的に縮小すると大なり小なりボケるものよ
ちなみに画像補正はどの程度の事やってるのよ?
0573名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 04:53:47.69
>>572
1200dpiでスキャンしてAcrobatで600dpiに圧縮した白黒とグレーのページをJPG出力して、GIMPにドラッグアンドドロップ
白黒の方を下のレイヤー、グレーの方を上のレイヤーにする
グレーの方のレイヤーを写真領域だけにトリミングする
すると、その下にあった白黒のレイヤーが透けて見える=文章は白黒の文字くっきりかつ写真はグレーの色鮮やか、の状態になる
で、GIMPからJPG出力→AcrobatでPDF化

こういうやり方してたわ
0574名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 04:55:41.12
要するに画像編集ソフトでは単に切り貼りだけしてただけ。画像そのものにRGBとかガンマ値とか諸々の編集は一切手をくわえて無い
0576名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 06:11:24.44ID:5Z6Cff4t
違法割れアフィサイト運営IDなし君の得意技は
複数回線を使って一人で会話することです
0578名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 07:37:38.56
>>575
iX500とAcrobat 9が俺の環境で
かつ俺の扱う本は殆ど白黒活字本だったから、あれこれ試行錯誤していく内に現状になった
この試行錯誤の過程で
 NuanceのPower PDFのOCR能力にしても圧縮能力にしても明らかにAcrobatに劣ってること や
 読んde!!ココのOCR能力がAcrobat 9に劣ってること や
 Ralphaで画像編集しても俺の望んだような仕上がりにはならないこと
などなどが色々分かって、現状に落ち着いた


多少色々試した結果言えることは
 iX500付属の専用ソフトの設定だけでそれなりのスキャンが出来る
 Acrobatはすげー
 GIMPは基本的なことなら一通り出来る
ってこと
0579名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 07:39:01.77
Acrobatはマジで強力。他の同系統のソフト群とは比べるまでも無いと思う
何とかして学割で最新版買おうかめっちゃ迷ってる
0580名無しさん@お腹いっぱい。
垢版 |
2018/06/28(木) 08:12:29.27ID:ZnuQz9VI
acrobatはccになってからページの編集(抜き差し、回転などが個別、一括思いのまま)が楽になって使い勝手がとてもいいよ。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況