X



トップページ電子書籍(仮)
1002コメント397KB
自炊技術総合26 @電子書籍板
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2018/04/11(水) 16:12:17.97ID:4Q8BIzUO
書籍を自分でスキャンして電子化する、
通称「自炊」についてのスレッドです。

■前スレ
自炊技術総合23 @電子書籍板
http://rio2016.2ch.net/test/read.cgi/ebooks/1485175560/
自炊技術総合24 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1501637878/
自炊技術総合25 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1515530055/

■関連スレ
【コミック】自炊技術総合スレッド43冊目【書籍】
http://yomogi.2ch.net/test/read.cgi/download/1442423719/

■参考サイト
自炊技術Wiki
http://wikiwiki.jp/bookjisui/
0458名無しさん@お腹いっぱい。
垢版 |
2018/06/14(木) 23:41:50.89ID:j5sntz9K
おかしい部分があった
×刃の反対側は斜めに切れてしまう
○刃の軸の反対側は斜めに切れてしまう
0459名無しさん@お腹いっぱい。
垢版 |
2018/06/15(金) 05:41:01.82ID:CZO8pUED
予備の刃を保存したまま本体が壊れかかったので、
買い替える前にせっかくだから刃を交換してみたら
切れ味の違いを感じたわ。
中華だから国内製造機の質の良い刃とは違うんだろうけどね。

国内製造機は刃が高いし気軽に交換できないのは辛いね。
砥ぎの回数も制限あるし。

厚いものを切ると下の方が斜めになるってのは抑え厚不足な気がしないでもないが、
5年も裁断してるのならそれくらいは知ってるだろうから、
バネでも劣化したんかね?
試しに2段裁断して背の硬さを軽減してみてはどうだろう?
0461名無しさん@お腹いっぱい。
垢版 |
2018/06/15(金) 21:54:37.31ID:SbJ5v5DQ
>試しに2段裁断して背の硬さを軽減してみてはどうだろう?

見開きのある漫画なんかは厚さ5〜10mmぐらいにして
糊を0.3mmぐらいずつスライスするのを繰り返して裁断しているんだが
スライスのし始めが特に斜めに切れやすいから
背の硬さは影響していそう

メンテに出してないのは、出している間裁断できないのがつらいからという理由
自炊中毒だな
もしメンテに出したら報告する
0465名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 14:17:05.10ID:4KPAwf+h
IBSN本の名前でフォルダ作って、
作者名などはExcelで管理

Excelから本を探して、
Excelから該当フォルダに飛べるようにしてる
0468名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 18:10:17.98ID:4KPAwf+h
>>466
古書も含め、同人誌など(現行の)ISBNが付いていないものは、
ISBNが付いているものとは別のフォルダへ入れてる

ISBNを付けたフォルダ名にしているのは、
同じ題名の本でも、フォルダ名が被らないようにしたいため
だから、ISBNがない本にはこっちで蔵書番号を付けてるよ
ちなみに、ISBNと同じ桁数

べつにISBNがあっても蔵書番号を付けたらいいんだけど、
なんとなく時系列でならんでるし、あんまり無意味な数字ばっかりもな〜と思って、ISBNに頼れるところは頼ってます
0469名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 20:06:26.73
やっぱ作者名、作品名の順なんだな
俺真逆でやってたわ
作者で本を探す事ってないからなぁ…
まぁそう言ってもタイトル順で並べたところで特に意味もないし…
(例えばTheで始まるタイトルは全部 ざ から始まることになってしまうしなw)

あとISBNは書いた方が何かあった時のための検索にいいのか…


タイトルにも副題あるばあいあるし
漫画なら各巻毎に副題がある場合があるよな。この場合は例えば 第3巻(副題○○) ってな具合にしないと順番が崩れる
各巻が数字付けられてる時はそれでいいが、上中下巻の時はそのまま記載するだけだとアイウエオ順が崩れる。これも厄介
0470名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 20:12:59.44
作者名っていっても、作者が2人以上居る時もあるし、原画と作画が別れてる場合もあるww
ややこしい

それと
ガチ勢にはこんな事言うまでもないだろうが
  <作者名>(タイトル)[出版社]「出版年」【ISBN】
ってな具合に区切り文字を明確に分けておいた方がいい
後々何かあって一括で変更しなきゃいけない時に正規表現で楽々変更できるからな
0471名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 20:13:04.89ID:8BbypEMs
>>468
なるほどね。
古い時代の書籍が多いと>>464が便利だけど、ISDNがあれば検索が楽ですよね。

>>469
同姓同名で別の作者って滅多にいないけど、同タイトルの書籍ってそれなりにありますからね。
0473名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 21:35:38.77ID:6R/DOMj/
ファイル名は著者書名だけだわ
上位に分類フォルダあるし目録がわりのタブ区切りテキストもあるけど
0474名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 21:47:07.36ID:Xq3FA+f8
俺は作者名はなるべく全部ファイル名に入れる
最近の福本スピンオフ作品なんかは大量に作者があって入力がめんどくさいw
[福本伸行×萩原天晴×上原求×新井和也] 一日外出録ハンチョウ
とか
アンソロジー系は諦めてる
0475名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 21:52:32.90ID:zMB1PyyY
件名もつけとくよ自分は
検索が楽
『幸徳秋水の基督抹殺論』/幸徳秋水/巨乳 痴女 乳首 着エロ イメージビデオ ローション
0476名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 22:19:40.68
わかる
デスノートは番外編とかあるから命名に困る
番外編、スピンオフは名前の統一性を保ちつつの命名をしなきゃならんから悩む

区切り記号はスペース節約のために半角コンマ , を使ってるわ

フォルダ構造に情報を反映させることでファイルそのものは手短に済ますってやり方もあるよな
 小畑健\デスノート\第02巻\p103.jpg
みたいな
0477名無しさん@お腹いっぱい。
垢版 |
2018/06/16(土) 23:13:55.89ID:bwpQ0N3+
フォルダ名は文字数の制限があるから、
あれもこれもキーワードを付けたい欲張りの自分が
どうやって文字数を減らそうかと四苦八苦してる未来が見えたからやめた
フォルダは格納する場所って割り切ってしまってるな
0478名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 01:05:10.13ID:cB0/EDU8
あとで閲覧したときに必要に応じてタグ代わりにつけてるなー
利用頻度が高いのはEverythingの履歴に残ってるから一発で開けるようになる
0488名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 13:31:05.59ID:DMtfXFg9
Google Cloud Speech API を叩けばつべの字幕(自動生成)並の精度は得られるんでね
Google Cloud Vision APIによるOCRもそうだが
ある程度自力でどうにかできる人ならどんどん先を行ける時代になってきてるね
0489名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 14:26:10.81ID:gSKOSkc5
地デジでもたとえば大河ドラマとかセリフの文字データもついてるんだけど
有効に検索に活かせるような状態にはなってないよなー
もったいなさすぎ
0490名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 15:26:56.25
文献管理ソフトなんて初めて聞いたんだが何するものなの?
自炊して沢山貯まったPDF管理にも使えるの?
0491名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 16:32:34.24ID:dKMIkqmC
電子化した本なんて50冊もないからファイラーで管理してるな
タグっぽいのとインクリメンタルサーチ、migemoだけ対応してりゃ十分
0492名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 21:00:06.77ID:ZzvFgzrF
ヤフオクの自動入札って
出品者が別IDで落札額を手動入力して試すと
こちらの入力した数字ばれるよね
ぎりぎり下まで釣り上げられるのがしょっちゅう
ああめんどくさい
0493名無しさん@お腹いっぱい。
垢版 |
2018/06/17(日) 22:10:30.55ID:cX45ggjZ
その価格まで払う意思があるから入力したんでしょ?
なのになんで文句言うの?
イヤならはじめからその金額入れなければ良いじゃない
0497名無しさん@お腹いっぱい。
垢版 |
2018/06/18(月) 04:17:05.50ID:JsBN6EA4
>>493
そんな乞食行為をわかっていても
大人の対応でいちいち報告しないし見て見ぬふりをしてやってるんだ
さらによい出品者ですと評価までしてやってる
感謝しろw
0498名無しさん@お腹いっぱい。
垢版 |
2018/06/18(月) 10:39:46.49
私は宣言します

もし地震等の災害を考えた場合、倒壊・火災で大切な本がグジャグジャになったり、水浸しになったり、燃えたりする可能性があり
そうなると折角集めた本が無になる

今回の地震で自分の本が無になる恐怖が頭をよぎった

だからもう今後は大切な本であっても速やかに自炊し、紙のままで残すのは箱1つ程度に抑えます
HDDなら頑張れば5台でも常時持ち運び可能だ
0500名無しさん@お腹いっぱい。
垢版 |
2018/06/18(月) 15:50:36.77ID:J7Or/+eP
昨夜オクみてたけど
〜関連本まとめて○冊って奴で3000円くらいで落札されそうだったのが
終了間際にヒートアップして5万で落札って正気の沙汰じゃないよ
文末に裁断済って書いてはあったが
あれ見落としてないか心配
0503名無しさん@お腹いっぱい。
垢版 |
2018/06/18(月) 19:54:43.53ID:WOrqzsas
コミックの偶数、奇数ページですが、X座標はどちらも同じくらいの中央に配置するのがデフォでしょうか。
こんな配置かなと進めていくと、次の巻で全然合わなかったりで、絶対的な基準をどこに置くのが良いのか困っています。
0505名無しさん@お腹いっぱい。
垢版 |
2018/06/19(火) 00:25:42.92ID:TR1CMJhe
>>503
内枠の大きさは作品や漫画家によって違うので絶対値でのX値は決めてない
本毎に調整してできるだけセンタリングしてる
タチキリやノド側描写が多い場合は内枠の位置調整は諦める
0507名無しさん@お腹いっぱい。
垢版 |
2018/06/19(火) 21:48:24.67ID:9uq7C9n+
>>498
まえに書いたかも知れないが、
人生あと40年なら14000日
不摂生で病気になると仮定して20年なら7000日しかないんだよね
仕上がりのクオリティを追求するのもほどほどにして
さっさと活用した方がいい
0508名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 07:29:42.79ID:6tz8/v8a
自炊挑戦で調べてゆくうちにここに来ました
どんな手順でやればいいのか大体は理解できましたが
取り込みソフトBTScanがvectorの該当ページも作者のページもnot foundで
検索で掛かるのは怪しげなダウンロードサイトばかりで入手方法がわかりません
他に入手できる先があれば教えて下さい
0510名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 10:00:24.82ID:1lD10zbT
BTScanついに公開停止か
Waybackやsoctnicにもないから作者氏が意図的に消してるっぽいね

誰かアーカイブ控えてた有志が自炊wikiに上げてくれるの待ちかね
WaybackからVectorの履歴追って確認した感じだと
最終バージョンは 2013年発表のbtscan305.lzh の模様
0512名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 14:34:56.53ID:rXdLa4Dk
管理者として実行が必要だったり
ユーザーアカウント制御でひっかかるからね
初心者におすすめってわけにはいかなくなった
だから公開停止なのかな
でも代わりがない
0513名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 14:46:18.43
かまぼこ形のハードカバーの裁断
https://i.imgur.com/bYQ9TIA.jpg

ホント裁断が難しい
本書は“かまぼこ形”のハードカバーだったから一度の裁断では切れない(無理に切ろうとすると中央部の無駄な切り込みが深くなる)
本書では中央で二分割してから各々を裁断したけど、その各々でさえ切るべき所が曲面がかってたから一度で裁断できず2度裁断
結局トータルで4回裁断となったため画像でも4つ分の切れ具合が見て取れる

切り口がホント酷いね
PDF化したら90%以上は気にならなくなるといえども、こんな仕上がりになった時の気持ち悪さは半端ない
0514名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 14:51:10.80ID:gWwP+ctZ
そもそもniftyのホームページサービスが終わった後の移転先アドレスがわからん。
homepage2なアドレスのサービスって2016年で終わってるでしょ?
0516名無しさん@お腹いっぱい。
垢版 |
2018/06/20(水) 18:11:05.89
自炊人生初、本そのものが一部ページ欠損してるのに出会ったわ
一瞬、裁断後でもまだページ同士がノリでひっついたり、うっかり一部のページを落としたのかと思って調べたけど
そうじゃ無くて市販されてた本そのものがページ欠損してた
欠損ページ数計20ページww
多すぎだろw
0519名無しさん@お腹いっぱい。
垢版 |
2018/06/21(木) 11:47:02.12ID:Wh5IJrAW
BTScanは3.07が最終みたいだね。
うちのも3.05だったけど。

学生時代に作ったツールとWebサイトで、
niftyのホームページサービス移行申請しなかったので自動削除
ってところだろうか。
0523名無しさん@お腹いっぱい。
垢版 |
2018/06/22(金) 10:07:36.04ID:rV5q3KiZ
まあ活字の場合は印刷時に滲みで太くなる前提で造られてるわけだから
デジタルフォントに起こすならその分の太みを入れるというのはわかる
滲み表現やランダム揺らぎまでやる必要があるかは謎
0525名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 08:50:03.24ID:Vrp45EL/
新古書店で買った本もあるんだけれど
シール剥がしはめんどくさいな
ジッポーオイルも使っているがなかなか危険
0527名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 14:49:07.64ID:pLNh01u/
自分は乾燥したセロテープ跡が一番面倒に感じる。
紙質にもよるけど粘着成分は溶剤か?したシールをペタペタやれば取れるし。
0530名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 21:12:48.73ID:BziHtzEO
昔の家庭にはベンジンがあったけれど
あれがなにかの役に立った記憶がないなー
マジックのあとさえ落とせない
0531名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 21:55:12.95ID:BziHtzEO
>>526
高いなー業務用かと思ったけど
自炊に限らず
IKEAの商品とか無神経でどでかいシールを貼ってるので
活躍してくれると思う
0532名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 22:13:31.99ID:xFH5qmKN
>>531
何かぐぐるとやけに大容量で高いやつが出て来るけど
俺は近所のホムセンでエアゾールタイプを600円?ぐらいで買ってる
値札剥がしだけに使う場合1本使い切るのが大変な程度には使い出がある
0533名無しさん@お腹いっぱい。
垢版 |
2018/06/24(日) 01:29:09.43ID:Y0i9NRhh
≫早い時間帯でまずは1点取りたいですね。
≫そして、キーになるのがセットプレー。
もう一度コーナーキック。
恐らくソン・フンミンを使いたいというような
ショートコーナーでしたがメキシコの選手も
対応しています。≫3回連続で
ショートコーナーをやってますけれども
そこまで効果的なショートコーナー
できてないですよね。

地デジの文字放送
生なのに優秀だよね
0535名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 04:59:35.48
この前自炊したpdfの量見たら900個いってたわw
白黒とグレーのスキャンとかで重複はあるものの俺も頑張ったな
0537名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 12:32:58.02ID:8/U90t2g
ワールドカップのガイドブックをコンビニで買って即自炊したのだけれど
WEBで確認したらKindle本でも売っていて、
念のためにサンプルを見たら600dpiと遜色なしで
結局何が言いたいかと言うと
自炊の醍醐味ってきれいに残すことではなく、
落書きや書き込みや思い出を残せることなんじゃないかと
思った次第で
0539名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 14:21:44.30ID:Z9I/6Gsq
>>537
モノクロだと差はでかくなるぞ
インクの滲みが無い分、暗部の諧調の表現力がかなり違う
また断ち切り?がないので表示範囲も若干大きい
なので電書が無い書籍はいかに綺麗に残すことが重要だったり
0540名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 14:24:04.18ID:T6GZVWuK
>600dpiと遜色なし
画質に関してはdpi高けりゃいいってもんでもないので
使ってるスキャナや補正技術力と市販電子書籍のデータの質によっては
逆転することはいくらでもあるんでね
0542名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 21:35:11.78ID:LcasA8dQ
1200dpiで保存していたら、えらいことになってきた>コミック。
4Kモニタで作業しているから麻痺してたけど、50%でも縦ぶつかるとかちょっとやり過ぎたかも。
0543名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 21:59:16.07ID:T6GZVWuK
スキャナは何使ってるん?
ADFだと光学600dpi超の機種はないからフラベだと思うけど
フラベで1200dpiは苦行すぎないか?
0544名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 22:11:37.44ID:LcasA8dQ
>>543
DS7500
ドライバレベルの疑似かもしれないけど、選べたのでそれで行ってる。
それでもコミック2回くらいに分けて乗せるだけだから、そんなに時間を取られない。
後の編集の方が大変。HDDじゃ無理。
0545名無しさん@お腹いっぱい。
垢版 |
2018/06/25(月) 22:35:20.89ID:T6GZVWuK
ググってみたけど光学解像度 原稿台1200dpi / ADF600dpi みたいね
ADF使ってるみたいだから600でスキャンされたものがドライバで拡大されてるだけと思う
個人的に600超は趣味の世界だと思ってるけど
編集時の苦労に見合うだけの画質が得られてるかは検証したほうがいいかもよ

もっともフラベで光学1200dpiでスキャンしたからといって高画質が得られるとも限らないけど
540にも書いたけど必ずしも高dpi=高画質ではないので
0547名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 02:39:56.70ID:tkzLVLnh
印刷物の解像度が350dpi相当なので1200dpiという3倍強のスキャンは補正前提としても過剰だと思うよ
0549名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 08:38:47.96ID:J/vPlL04
コミスタ(旧)の超極薄トーン使ってる漫画なんかだと600で白飛ばしすると消えちゃうので
光学1200は有効だって話は聞いたことある
ただそこまでやる人は600と1200でそれぞれの補正方法を調整する技術力と
違いを見分けられるだけの目視力が必要になるし
極め人はそうはいないんじゃね

何はともあれ高dpiでって考えの人は案外実際のスキャン画質見てない場合も多い
将来8Kやそれ以上のモニタ使うにしても閲覧時にビューアで
Lanczos拡大したほうが軽くて綺麗って結果になると思うわ
0550名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 09:35:52.01ID:YFpvcNYi
>>549
将来のことを言うなら、OCRとAIの進歩でスキャンデータのテキスト化が可能となりdpiなんか関係なくなるのでは
0552名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 14:26:42.46ID:MTfbKJiE
印刷を適切(満足)に拾える解像度が有れば無理に高解像度にする必要はないんだけど、
可逆でもそれなりに圧縮かかることを考えると好きなだけ高解像度でスキャンすれば良いんじゃない?
それでもファイルサイズは大きくなるだろうから、
非可逆の人はそのせいで圧縮率上げる羽目にならないように見極めが大切だとは思うけど。
0553名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 20:17:38.36
最悪なことに気づいたわ


俺は書籍は一旦1200dpiでスキャンしてソフトで600dpiに圧縮することで高画質低容量を計っていたんだよ。

で、画像込みの文章ページの場合は白黒スキャンだと画像の写りが悪いから、
グレーでもスキャンして、白黒で撮った文章ページの上にグレーで撮った画像部分を切り貼りするっていうやりかたしてた。

でも、1200dpiで撮った白黒、グレー画像をそのまま画像編集に持ち込もうにしても僅かな傾きがあるから
傾きを補正してから画像編集の段階に移ろうと判断した。

でも傾き補正はAcrobatで600dpiに圧縮する時についででしてくれるんだよ。
だから俺は1200dpiで撮ったページを先に600dpiに圧縮しつつ傾き補正してから画像編集ソフトで切り貼りすることにした。

切り貼りが終わったら、そのページをPDFの該当箇所に差し込むだけなんだけど、
画像編集ソフトで切り貼りが終わった段階ではjpgファイルだからOCR情報がない。
そこで切り貼りが終わった画像ファイルにOCR情報を付加させるために“再度”600dpiで圧縮したんだよ(Acrobatは圧縮時に傾きだけでなくOCRも付加してくれる)

こうして切り貼り完了済みかつOCR付加の画像(PDF)をスキャン書籍の該当箇所に挿入。


こういうことを今までずっと繰り返してきたんだけど、
振り返ってみると写真等込みのページについては2度600dpiに圧縮してるんだよ
だから10倍にアップしてみるとハッキリと画像の劣化が見て取れる……
悲しすぎる
0556名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 20:58:14.97
画像切り貼りする作業って完全にテンプレ化された定型作業だからプログラム化して欲しいわ

同一ページを白黒でスキャンしたものとグレー(カラー)でスキャンしたもの2つを投入

プログラムが2つの画像から画像領域を解析

解析された画像領域(白黒の方とグレーの方)を見比べ一定程度の違いがあるかを判定

違いがあるならばグレーの方の画像領域を切り取る

それを白黒の方の対応する画像領域に上書きする

同一ページについて複数の画像領域があるなら全部に対して繰り返す

以上で一つのページについての作業完了

これを1冊丸ごと自動化して欲しい
完全な定型作業だから画像に詳しいプログラマにやって欲しい
0557名無しさん@お腹いっぱい。
垢版 |
2018/06/26(火) 21:02:02.61
ってか、スキャナで白黒スキャンする時って一旦グレーかカラーでスキャンしたものをスキャナ内部で白黒にしてるんでしょ?
だったら、スキャン時に同時に>>556の処理も施せば一度のスキャンで画像込みページを高精細且つ文字くっきりでスキャンできるのに…
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況