X



トップページ電子書籍(仮)
1002コメント397KB
自炊技術総合26 @電子書籍板
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2018/04/11(水) 16:12:17.97ID:4Q8BIzUO
書籍を自分でスキャンして電子化する、
通称「自炊」についてのスレッドです。

■前スレ
自炊技術総合23 @電子書籍板
http://rio2016.2ch.net/test/read.cgi/ebooks/1485175560/
自炊技術総合24 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1501637878/
自炊技術総合25 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1515530055/

■関連スレ
【コミック】自炊技術総合スレッド43冊目【書籍】
http://yomogi.2ch.net/test/read.cgi/download/1442423719/

■参考サイト
自炊技術Wiki
http://wikiwiki.jp/bookjisui/
0751名無しさん@お腹いっぱい。
垢版 |
2018/07/16(月) 00:11:04.67ID:WLHmyRY3
>>750
ちょっと眠いのでトンチンカンなレスだったすまんです
違う部分なのかもしれないけどレス
うちは届いたときから外れた状態だった
連絡したら、プラスボルトが緩みピンが落ちてしまった為だろうとのことで
ボルトを締め直した
軽症だったこと、丁寧に対応してもらったこと
それに交換しても同じと考え
重量と手間を考えて返品手続きはしなかった
それ以降起きていないのでそのまま使ってる
なので、あまり追求してないわー
レスを読んで懐かしいなと思った
0752名無しさん@お腹いっぱい。
垢版 |
2018/07/16(月) 07:00:37.07ID:DHXxyhbt
中華だしネジの緩みくらいは許容範囲で
直せない破損じゃないだけマシと感じるのは妥協しすぎだろうか。

改良中華って重いだけあって作り自体はすごく強固だしね。
0755名無しさん@お腹いっぱい。
垢版 |
2018/07/16(月) 18:36:30.03ID:utwCVYc3
カラーも写真付き白黒も共に大満足のレベルでスキャン出来るなら10万は出せるぞ
iX500は俺の満足レベル的に80~85%だからな
0757名無しさん@お腹いっぱい。
垢版 |
2018/07/16(月) 23:11:49.13ID:oIfZbKx9
ScanSnap S1500
どうしても消えない縦線発生でクリーニングに出した・・・\8640なり

もう8年使ってるから買い替えたいけどDR-M260とかどうなのかな
縦線出ない機種が欲しい(無理か
0758名無しさん@お腹いっぱい。
垢版 |
2018/07/17(火) 22:38:20.87ID:P65IfC2v
スレチだったらすみませんが自炊本ってみなさん何で読んでるんですか?
連休に自炊した漫画ずっと普通の10インチタブレット読んでたらめちゃくちゃ目が疲れて、しんどいです…
kindle paper whiteや楽天kobo みたいな電子インクディスプレイの端末なら、目の負担は多少減るのでしょうか?
この二つならどっちがいいとかありますか?
kobo はモデルによってはmicroSDスロットが付いてて容量を増やすこともできるという噂も聞いたのですが、kindleとどっちがいいのかなと…
それとも一日中本読んでりゃ何で読もうが目は疲れるんですかね?
0759名無しさん@お腹いっぱい。
垢版 |
2018/07/17(火) 23:47:08.09ID:arQcV79W
ノングレアIPS液晶のノートPC と fireHD10にASDECのノングレアシート貼ったもので読んでる
アンチグレアシートはよほど吟味しないと逆効果だがテカテカなくなると読みやすくなる

コミックだとページめくりのたびにリフレッシュ入るからE-inkは意外としんどかったりするよ
0760名無しさん@お腹いっぱい。
垢版 |
2018/07/18(水) 00:36:43.33ID:IcL49C2/
Kindleに入れて読んでるけど自炊ファイルそのまま入れても読めたもんじゃないから画像加工の手間もかかるし見開きとかが難しいからあんまりオススメはできない
個人的に紙っぽい質感は好きだし何より軽いのは利点だな
0762名無しさん@お腹いっぱい。
垢版 |
2018/07/18(水) 08:14:19.99ID:C5fsXo5l
液晶のタブレットでもディスプレイの明るさや周囲の明るさを考えて使えばだいぶ楽になると思うよ。

あとは紙版とのサイズ差かな。
10インチだとA5サイズくらいだからA4を表示するには小さくなっていることになる。
紙版と同じ感覚で読もうとすると視距離を近づけないといけなくなるから、
結果として近すぎor小さすぎで目に負担がかかる。
自炊したものが書籍メインならそれほど問題じゃないが、
雑誌メインなら表示する大きさは気を付けた方が良い。
0768名無しさん@お腹いっぱい。
垢版 |
2018/07/18(水) 22:40:20.02ID:R3hyPm1g
今まで“かまぼこ形”ハードカバーの裁断に悩まされてきた

一旦本体を2分割してから各々を裁断ってやり方だけど、ページ数が多いと案外上手くいかず結局4回ぐらい裁断する羽目になった挙げ句
仕上がりは汚かった
https://i.imgur.com/bYQ9TIA.jpg


それに対してココ10冊以上の“かまぼこ形”ハードカバー書籍の裁断で(とても綺麗とまでは言えないが)上のやり方よりかはマシにする裁断方法が見つかった
それが薄切り法
ハードカバーを2分割せず屈曲した“背”の部分をそのまま裁断していくんだが1裁断で1.5~2mmぐらいの薄切りでやっていくやり方
1裁断目では中央部がほぼ問題なく綺麗に裁断できる
この時点で書籍の0~30%目辺りと70~100%目辺りが全く裁断されてない状況になってるから2裁断目以降はこれらを薄切りしていく
上の画像よりかはまだマシな裁断の仕上がりになる
0769名無しさん@お腹いっぱい。
垢版 |
2018/07/18(水) 23:04:57.51ID:R3hyPm1g
やっぱあれだな
1回の裁断で1mmぐらいの微細な裁断を繰り返した方が全体としてみた時の裁断面のそろい具合はマシだな
でもそれだけ揃えるのにさっき500ページオーバーの本を5~6回裁断したわ しんどい
しかも全体としてみたら多少揃うってだけであって、マジマジと見たら裁断面がかなりザラザラと段差ついてるからな
0770名無しさん@お腹いっぱい。
垢版 |
2018/07/18(水) 23:18:11.39ID:8ftv0XWF
読むのはもっぱらワイド版のコミックですねえ
雑誌はあんまり読まないです
フィルムとか距離とか見直してみます
ありがとうございます。
0771名無しさん@お腹いっぱい。
垢版 |
2018/07/18(水) 23:51:54.17ID:EwDfjd52





手で引っ張って、数十ページ単位に無理やりばらすと
こんな感じになってしまうなあ
平行四辺形
0773名無しさん@お腹いっぱい。
垢版 |
2018/07/19(木) 12:44:21.15ID:0G6dcCo6
600ページの“かまぼこ形”ハードカバーの裁断
薄切り法で5~6回ほど裁断を繰り返した結果
https://i.imgur.com/ChcLZWe.jpg
https://i.imgur.com/W3AapTS.jpg
裁断が結構しんどかったし裁断面に紙くずが散らばってて汚いし結構ギザギザってる

とても綺麗とは言えないが
https://i.imgur.com/bYQ9TIA.jpg
と比べると切り込みの深いところと浅いところの差が少し縮まってるね
0774名無しさん@お腹いっぱい。
垢版 |
2018/07/19(木) 12:57:58.50ID:0G6dcCo6
数十ページの小冊子を細くて小さい糸で結んで,それらを束ねてハードカバーにしてる書籍って
裁断したら糸くずがポロポロこぼれ落ちてきてすんげー厄介だな
スキャン何糸くずが紛れ込んでしまわないか、スキャナの結果に影響しないかって余計な心配事が増える
0778名無しさん@お腹いっぱい。
垢版 |
2018/07/20(金) 16:11:55.18ID:etsHYuxf
近未来型スキャナ=下敷き形で本の1枚1枚の隙間に挟み込んで両面スキャン
最終奥義形スキャナ=X線透過でスキャン
0779名無しさん@お腹いっぱい。
垢版 |
2018/07/20(金) 17:59:44.39ID:B/CvSQTc
そんな時代が来るかもしれないが
いまここに書いても意味がない
夏休みだから仕方ないが
たとえば、救急車が空を飛べば助かる人が増えるんじゃね!
なんか読むとイラッとくるでしょ
0780名無しさん@お腹いっぱい。
垢版 |
2018/07/20(金) 19:56:05.32ID:qAAg5l3+
今でもヘリカルCTみたいな連続スキャンするCT使えば本をスキャン出来るのかな?
さすがに印刷インクの厚みは読めないか。
0781名無しさん@お腹いっぱい。
垢版 |
2018/07/20(金) 23:21:21.66ID:tIe2SrtD
みんな自炊ファイルの傾きチェックってどうしてる?
数度とかは許せるんだけど補正のバグか知らないけどたまに30度くらい傾いて出力されてるページとかが混ざってる
見開きとかじゃなくて画面にできるだけ多くのページを同時に表示する方法ってないですか?調べてもよくわからなくて
例えば横一列に8ページくらい表示して、縦はそれが最終ページまで続くというような感じです。
どのページが大きく傾いてるかを知りたいだけなんです
0782名無しさん@お腹いっぱい。
垢版 |
2018/07/20(金) 23:27:11.00ID:q6Yab3wC
サムネイル表示ありのビューアやファイラを使う
エクスプローラでもコンテンツ表示とか(うろ覚え)にすりゃ一応見れる
0783名無しさん@お腹いっぱい。
垢版 |
2018/07/20(金) 23:36:03.43ID:ireq388j
チェックして結局補正するんだよね?

ただなにもしないってのも選択だわ
OCRでPDF化するときにどうせ勝手に補正されるから

ひどいものはXnConvertの自動デスキューと
トリミング(端から上下左右15−30ピクセル程度)を通しておく
超テキトウ
読むときにモチベーションが下がらない程度の仕上げを目指してる

ちゃんとやりたいのなら自炊wikiなり読めばー

目視だけでいいって言うのなら>>782の言う通りだと思う
0784名無しさん@お腹いっぱい。
垢版 |
2018/07/21(土) 00:40:25.19ID:fr1s/0p+
言い忘れてましたが私はスキャンしてそのままPDFに出力してたんですけど、もしかして少数派なんですかね?
やっぱりまず画像形式で取り込んでからPDF化するのが後々ラクですよね…
0785名無しさん@お腹いっぱい。
垢版 |
2018/07/21(土) 03:39:37.44ID:+n3i44xw
PDF?
Foxit Reader
PDF-XChange PDF Viewer
CubePDF Utility

他にもいろいろ
使い勝手は別として
専用ビューアならサムネイル表示はたいていできるが
0788名無しさん@お腹いっぱい。
垢版 |
2018/07/26(木) 13:43:53.43ID:RShaVhy2
皆さんは、ePubファイルをiosやAndroidの端末で読む時は何をお使いですか?

iBooksは個人的に好きじゃ無いので、お勧めがありましたら教えて頂けたら嬉しいです。
0789名無しさん@お腹いっぱい。
垢版 |
2018/07/26(木) 14:32:02.78ID:QtBfwTo1
まず最初に自炊物をわざわざePubにするという需要がほとんどないのだが
ePub自体は中身zipなのでzipが読めるビューアならたぶん見れる
PVとかComittoNとか
iOSは知らん
0791名無しさん@お腹いっぱい。
垢版 |
2018/07/27(金) 19:16:10.59ID:EJOxaLur
お金そんなにないのと、4センチ切れるっていうのが魅力的に思えたので
中国のBA58A4買おうと思っています。
ゴムシートを貼ったら背表紙が真っすぐ切断できると読んだのですが
ホームセンターで売っているゴムシートでも代用できますか?
専用のやつが売り切れみたいで、、、
0792名無しさん@お腹いっぱい。
垢版 |
2018/07/27(金) 19:44:20.60ID:1EN2Bmu3
ゴムシートは滑りにくくなるだけ。
もともと刃がまっすく降りてくる機種の場合はゴムシートで改善するが、
中華は刃がまっすぐ降りてこないので、工夫は必要。

紙押さえの位置を調整して、紙押さえに沿うように刃を下ろすことでまっすぐにするとかね。
0793名無しさん@お腹いっぱい。
垢版 |
2018/07/27(金) 21:56:45.77ID:EJOxaLur
792さん、レスありがとうございます。

違う機種なんですが、↓のURLみたいにゴムシート敷けばOKなのかなって思っていました。
そもそも刃が真っすぐ落ちないんですか。。。
https://ameblo.jp/iso5210/entry-11152329479.html

コツさえつかめば真っすぐに行ける感じなんでしょうか??
0795名無しさん@お腹いっぱい。
垢版 |
2018/07/28(土) 00:55:44.98ID:RZgBGLOr
設置場所さえ許すのなら改良中華が良いよ。
25mmくらいまでなら安中華でも紙押さえ矯正とか2段裁断とかで垂直も行けるけど、
紙質とか背の硬さ次第で失敗もある。上下にゴムシート挟んでもね。

改良中華は18000くらいだけど価値は十分ある。1mm垂直裁断とかできるし。
垂直裁断にこだわるのなら安中華で手間かけるよりいい。
2000冊くらい安中華使ったけど、改良中華に替えてから安中華で頑張ってたのがあほらしく感じた。

安中華→PK513→200DX→改良中華と4台使ってきた感想。
でも垂直かつギリギリを狙うのならヘキサンが良いよ。
裁断機でぎりぎり狙うとバラすのに結構手間がかかる。
0796名無しさん@お腹いっぱい。
垢版 |
2018/07/28(土) 04:40:54.70ID:c/jU2tR7
斜めに裁断されてしまう原因って今まで2つを想定してた
1:レバーによる圧力で紙を押さえる部分の押さえる力が弱いから、裁断中に力負けして紙がズレる
2:単に刃が本に対して斜めに入って行ってる

特に1ミリ毎の薄切りを試みてる時は、入射する刃に押されて紙がズレて薄切り失敗ってのがよくあるから1:が酷いなって思ってた

ミス無く1ミリ毎の裁断を縦横どちらから見ても垂直に出来るなら、かまぼこ形の裁断が綺麗になるんだがな
0797名無しさん@お腹いっぱい。
垢版 |
2018/07/28(土) 08:34:01.06ID:+EehoKwI
改良中華は押さえがレバー一発になったので効率的になったが、
その代償にガッツリ押さえつけるのが難しく、
斜めになってしまいやすいという記事を読んだのですが、
実際はちがうということですか?
0798名無しさん@お腹いっぱい。
垢版 |
2018/07/28(土) 12:27:41.92ID:HLoLnBjZ
【皇室】秋篠宮妃“紀子さま”と“美智子さま”の『異常性』〔心理学悪用編:小室眞子さま〕★2

ICU大学時代、山守さんも小室さんも同じスキー部員だったとの話。
そのスキー部に眞子様もいた事実。
少ない人数のスキー部内で男を、とっかえひっかえの眞子様。
しかも小室さんに乗り換えた後、山守さんも居るスキー部で活動継続。

小室さんに騙されたとかいう風潮は、あまりにもおかしい。
2012年の留学中に英国で知り合ったアジア人や日本人とも関係を持って・・・(以下略)

詳細は、以下のスレッドでどうぞ!!

〔2chのスレッド〕:https://rosie.5ch.net/test/read.cgi/liveplus/1532735877/
〔記事元〕:http://www.laf.im/yahoo_co_jp-news-20180703
0799名無しさん@お腹いっぱい。
垢版 |
2018/07/28(土) 15:15:05.95ID:YNtmP9ys
>>797
安中華で紙押さえ機構を2度も壊すほど締め上げてた自分だが、
改良中華で押さえが弱いと感じたことは無いな。
どっちもゴム利用ね。

改良中華で押さえが弱いってのはどこで記事になってた?
0800名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 08:46:03.39ID:2vOC0MSR
799さん、レスありがとうございます。

押さえが弱いというのは、記事だったかこちらの過去ログだったか失念しましたが
書いてあったのをたまたま読みました。
自分としては、ガッツリ押さえて真っすぐ切りたいと思っていたので
なるほどなーと思って記憶の隅にのこしていました。

でも実際は改良中華と変わらないのなら、レバー一発のほうが楽ですよね。
裁断機は改良中華にしとこかな!

あとはスキャナー選び。。。
0801名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 09:04:47.24ID:vxGYoy46
改良中華は重い上に手指を掛ける場所が無くて持ち上げにくい

なので使わないときは片付けたりするのなら取っ手をつけるなどの工夫をしたほうがいい。
バランスが悪くて持ちにくい24kgは結構くるよ。

スキャナはどれだけ予算があるか次第だけど、初めてだとどこに拘っていいかが
わからないんだよね。
予算と原稿のサイズや印刷や紙質なんかを書くと使ってる人の助言がもらえるかもだけど。
レンタルでいいからとりあえずシートスルースキャナを一度使ってみると良いんじゃないかな。
機材をそろえてでも自炊作業を継続できるのかどうかもわかるしね。

実際の自炊作業は外から聞いて想像する以上にめんどくさいと思うよ。
環境そろえたは良いけど面倒で続かないなんて事もありえるからね。
0802名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 09:11:06.70ID:2vOC0MSR
白黒や3色刷りのB5くらいの技術書(ITとか数学)、ビジネスの新書
カラーは少しだけどデザイン関連の書籍を取り込もうと思っています。

読用にPDF、保存用にPNGとしておけば後からPDF再作成できますよね?

そこで、一度のスキャンでPDFデータ(OCR付与済み)と
PNGを出力したいと思った場合次の機種であっていますか?

・Canon DR-C240(マルチストリーム出力)
・EPSON DS-530(ダブルイメージ出力)

どちらでもできるなら、耐用枚数が多くて
値段も安いDS530を購入しようかと思っています。
速度もさほど変わらないのかなと思っています。

そもそもPNGで保存じゃなくてPDFで保存したほうがいいような気もしていて、、
そのあたりのアドバイスも頂けると嬉しいです。
0803名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 09:16:11.63ID:2vOC0MSR
↑500冊くらいあるので、1年くらいかけて処理出来たらなと思っています。
読むのには300DPIのPDFで、万が一のための保存用には400DPIのPNGという感じで出来たら嬉しいなと思います。
流石に二回スキャンしないとダメというのなら、手間を考えてPNGは諦めます。
0804名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 09:45:15.98ID:vxGYoy46
実用系か。

図表を検知して2値化の設定を調整してくれたりするDS530のほうを使ってみたい気はするな。
期待通り検知してくれればだけど。
0805名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 12:12:37.64ID:LUMmEzQ0
>>802
>読むのには300DPIのPDFで、万が一のための保存用には400DPIのPNGという感じで
C240ではないがCapturePerfectでマルチストリーム出力を試してみた
設定は可能だしファイルも両方作られる
PDF内の画像はJPEGで格納されるため可逆形式(PNG)で持っておくのはいい
ただ400dpiに意味があるかと言われると正直微妙かな
理由は以下

DR(というかおそらくほとんどのメーカーのADFの場合)、光学的に300dpiの次は600dpiなので
400dpiは300で撮ったものをソフトで拡大するか、600で撮ったものを縮小するかになる

また、DRの600dpiにはモードが二つあって
・速度優先 : 300で撮ったものをソフトで拡大
・画質優先 : 600で撮る
マルチストリームを指定した場合は[画質優先]は選べなかった。
つまり400はもちろん600でも実質的には300dpiでのスキャンになる

オリジナル画像を確保したいということなら400に拡大してしまうのはあまり意味がないのかなと
単にdpiを上げたいという話でも後から必要時にツリーツールなどでやればいいので
ファイルサイズの大きい400で保存して持っておくメリットはないように思う
0806名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 12:45:24.67ID:2vOC0MSR
805さん
教えて下さってありがとうございます。
(知識の深さに敬服です)

400dpiはペパレスというスキャン代行?の会社のお勧め設定だったので
https://pepaless.com/column/171103_01/
なるほど、じゃあ自分もこれで行くかと思った次第です。

でも300を400に引き伸ばしてるだけだと、いいこと何もないですね。。
それに300あればOCRで困ることも無いような記事もみかけるし。

600を400に落としてるならいいのだろうけど、、、それもできないというのなら
300での保存を基準に考えるのがベターということですかね。

DR-C240は自分的には買っても大丈夫な機種と思えました。

DS-530のダブルイメージ出力で同じことができるのなら、こっちにしたいけど、、
他に情報お持ちの方、良かったらご提供願えませんかm(_ _"m)
0807名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 12:55:38.04ID:2vOC0MSR
でも考えてみたら、PNGスキャンデータだけ作っといて、
あとでPDF仮想プリンタみたいなものに出力してもいいんですね。
それだとOCRかけられないのか。。。
マルチストリーム出力だとOCR済みのPDFを吐けますかね?
0808名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 14:39:10.38ID:LUMmEzQ0
ごめん嘘言ったかも
自分が使ってる機種(DR-6010C)だと400dpiは 速度(300)/画質(600)選択式なんだけど
いまマニュアル確認したらDR-C240には画像品質のモードがないっぽい
特に注意書きもないので光学的に400dpiでスキャンできるのかも知れない

>マルチストリーム出力だとOCR済みのPDFを吐けますかね?
吐ける

エプはフラベしか持ってないのでDSのことは分からないが
おそらくwinだとドライバでスキャン時にOCR付PDFにするのが一番楽だと思う
PNG等の画像にあとからOCRかけるのはAcrobatなどの別ソフトがないとできない場合もあるので
(linuxならフリーで質の高いOCR付きPDFを作ることも可能だがちょっと敷居が高い)
0809名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 17:42:29.48ID:2vOC0MSR
808さん、ありがとうございます

いろいろご説明頂いたので、思い切ってDR-C240にしました!
さて、自炊ライフの始まりだー!
0810名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 17:44:37.48ID:2vOC0MSR
ちなみに
「linuxならフリーで質の高いOCR付きPDFを作ることも可能」
こちら、何かガイドありませんか?興味あるので調べてみたいのですが。。
0812名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 17:55:31.65ID:LUMmEzQ0
これから出かけるので今日は詳しく返答できないが
ここの過去ログに詳細がある
もし過去ログ見れる&すぐ知りたいなら探してみて
0813名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 20:23:34.48ID:vxGYoy46
CISのセンサーは読み取り自体300か600でしかしないってことじゃなかったっけ?
一方、縮小光学系CCDの機種だとレンズで調整できる。
出力解像度が1dpiごとでいじれる機種はCCDなことが多いね
0816名無しさん@お腹いっぱい。
垢版 |
2018/07/30(月) 12:27:18.27ID:oPF6hj6x
せっかくの2画面でコミック見開きに良いと思ったが、
画面同士の距離が離れすぎだな。

einkってベゼル部分が幅広なのが多いけど、なにかデバイス構造上の都合なのかな?
0817名無しさん@お腹いっぱい。
垢版 |
2018/07/30(月) 13:43:55.79ID:8AAbOcsA
>>810-811
Linux用OCRまとめ

Google Cloud Vision API編
http://rio2016.5ch.net/test/read.cgi/ebooks/1515530055/755,884,898,970
http://egg.5ch.net/test/read.cgi/software/1470745451/59

Tesseract OCR編
https://egg.5ch.net/test/read.cgi/software/1470745451/42,47


現状では縦書きPDF埋め込みはTesseractに分がある模様
OCR精度自体はGCVのほうが良いのが痛痒
http://egg.5ch.net/test/read.cgi/software/1470745451/55-57,59
0819名無しさん@お腹いっぱい。
垢版 |
2018/07/30(月) 23:45:51.90ID:4SnwuIqj
完全なカラー書籍じゃなくて、白黒+{赤or青or黄色}系の技術書、参考書ってカラーでスキャンするか、白黒でスキャンするか迷うよなw
0823名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 01:01:01.53ID:MvjqUrg5
2色刷りくらいまでならカラーで取ってから色ごとに別々に白飛ばし補正してからあとで重ね合わせてる
0824名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 01:20:46.97ID:eHSBJjbx
中古で本買った時に前に使ってた奴が蛍光ペン等で線引きしてた場合って
カラーでスキャン→画像編集ソフトで特定の色飛ばす
で、本文を害することなく書き込んだものだけ消すって出来るん?
0826名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 08:06:04.69ID:H9aPC3iV
以前「PDFはコンテナだ」みたいな発言あったけど、これってAcrobatで言う所のポートフォリオってやつのことね
機能試してみたけど、コンテナのように画像なりpdfなり束ねるだけの機能だった
0827名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 08:31:17.86ID:bW6sPoFJ
コンテナだって話が出る場合は、画像型式と誤解してる場合なこと多かったと思う。
例としてzipやらのわかりやすい形式が出ることも多かったが。

単純にまとめたファイルっていうよりも、
中にどんな形式で格納されてるかが重要っていう話だと思うよ。
0828名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 11:00:31.39ID:BcT4EiUT
>>817さん

810です、資料のご提示ありがとうございます。

GCVで認識させて結果のJSONを変換して
PDFに上乗せするイメージですかね。
縦書きの文書にはGCVじゃなくてtesseractを使うのかな。
python動けばよいだけなら、Linux以外でもできる気がしますね。
0829名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 13:34:53.95ID:8gfD+zRX
ポートフォリオとして外部から見えるかどうかとは関係なく
自炊PDFの場合、PDFは画像のコンテナにすぎない
例の人がPDF内の格納画像がTIFF/JPEGであることを理解せずに
"抽出"ではなく"変換"で画像を取り出しておいて加工したら劣化した!と騒ぎ
PDFのまま白黒とグレーを合成できれば劣化は起こらないはず
(だから誰かツール作れ)とか言ってたがもちろん間違い

1ページ内にTIFFとJPEGの画像を混在させられれば可能は可能だが
そういう特殊なレイアウトのPDFはキヤノン機でカラー自動の時に吐き出すPDF以外では見たことがない
後から編集できるソフトも聞いたことがない
0831名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 13:51:30.03ID:8gfD+zRX
>>828
汎用ツールの部分は大抵はexe版があるかdosコマンドで代用できるので
シェルスクリプト(sh)の部分をbatなりwshなりahkなりで書き換えてやればいけると思う
ただ実効速度的にはwinだとやっぱ遅いんだよね
導入にwsl入れちゃった後だとそのままそっちでやればいいか、みたいになっちゃう

winの既存ツールとの違いはPDFに格納する画像の形式をわりと自由にできること
JPGの代わりに減色済みの4bitPNGをそのまま入れられるのが嬉しい
0833名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 18:19:39.59ID:5ejmVel8
>>829
んじゃ、例えば1000kbの画像をPDFに“ポートフォリオじゃなく“入れてから、無劣化で元の画像に抽出する方法教えて
当然抽出後も1000kbで
0834名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 18:20:33.28ID:MvjqUrg5
抽出、変換ってのはAcrobat内のメニューの名称じゃないよ
格納されてる形式でそのまま取り出すか(抽出)
指定の方式で書き出すか(変換)
って意味

可逆to可逆ならフォーマットが違ってもdpiや色数変換などが行われない限りは劣化はないが
JPEGto可逆 や 可逆toJPEG の場合は問題になる

Acrobatのメニュー上では違いが分かりづらい
抽出したいときは画像梱包やpdfimagesなどのツールのほうが間違えにくいと思う
0835名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 18:29:35.70ID:MvjqUrg5
なんか誤解があるようだが
PDFのファイル形式の話をしているのであってソフトの使い方の話じゃないよ

"Acrobat上でどうやるか" は使ってる人が研究してくれ
自分はAcrobatのUIは分かりづらく面倒なので他のツールでやる
0837名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 19:06:05.47ID:Tdwajdog
>>834
違いが分かりづらいってお前知らんのかい
ゴチャゴチャ下手くそな説明並べて結局それかよ

>>格納されてる形式でそのまま取り出すか(抽出)
>>指定の方式で書き出すか(変換)
当たり前。それ以外の言葉で捉えるワケが無い。お前は根本的に理解が間違ってる。そんな説明は聞いていない

俺が聞いてんのは
Acrobatで抽出できるか
(Acrobatに限らず)できるならその方法は何か?
だよ。
碌に他人様が言ってる説明理解できずに自分の中の程度の低い理解で下手くそなご託を並べろなんて誰も言ってないから
そこの所は誤解無きように


あと付け加えるとAcrobat相手に
>>自分はAcrobatのUIは分かりづらく面倒なので他のツールでやる
って言ってる時点でこいつの頭の程度がだいたい想像つく

それと
>>なんか誤解があるようだが
って言ってるけど、話の発端は>>826
0840名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 21:54:52.98ID:MvjqUrg5
『確認の方法を知らない』のはそちら側の問題なので自分には教えてあげなければいけない義理はないし
PDFがコンテナなのも周知の事実なのでこちらで証明方法を説明しなければならない理由もない

やり方は『 PDF 画像 非劣化 抽出 』でググれば方法は見つかるし>834でもソフト名を挙げている
(詳しく書いても良かったが煽って情報を得ようとするスタイルを認知するわけにはいかないので
この返でやめておく)

Acrobatが『分かりづらい』のはユーザーが内部の画像形式を正しく理解して
出力形式を合わせてやらないと『抽出』にならないから
とっくにアンインストしてるので正しい抽出の仕方検証に付き合うつもりもない


> って言ってる時点でこいつの頭の程度がだいたい想像つく
そこはお互い様だね
こっちも毎回君がAcrobatを神のツールのごとく言ってるのを見るたび程度が知れるなって思ってるよ
0842名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 22:22:05.68ID:BcT4EiUT
>>831さん

wslっていうのがあるんですね、知らなかったので勉強になりました。

しかしながら、キャノンのスキャナについていたOCRエンジンで結構満足してしまったので、
これ以上探求しないかもしれません、折角教えて頂いたのに申し訳ないですが。。

(でも、いつかpngからPDF作ることがあるかもしれないので
その時に備えて勉強しておくのもいいかも)

ここの皆さんのお陰で楽しい自炊ライフが始められました、感謝です!
0843名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 22:23:13.92ID:BcT4EiUT
減色すること考えたら最初から8bitでPNG取り込みとかできたら素敵なのに。。。
0844名無しさん@お腹いっぱい。
垢版 |
2018/07/31(火) 22:31:45.94ID:BcT4EiUT
先輩方のお陰で今日自炊デビュー出来たのですが、
自炊wiki 以外に読んでおいた方がよいものってありますでしょうか?
0845名無しさん@お腹いっぱい。
垢版 |
2018/08/01(水) 01:10:01.99ID:BmMH3YH1
CANONのOCRエンジンはスキャナメーカーの中ではかなり優秀なほうだと思う
縦書きもまともに認識してくれる
0847名無しさん@お腹いっぱい。
垢版 |
2018/08/01(水) 21:27:08.46ID:/itKlqTD
>>844
多分そんなことより
ストレスと妥協に対してどこまでできるかだわ

色線はカラーであれば6割の確立ででるが
容認できるかどうかなど
0848名無しさん@お腹いっぱい。
垢版 |
2018/08/02(木) 05:52:48.03ID:CHgwyOSo
C240選んだ人でしょ?
それほどこだわりを持ってスキャンするような本じゃないだろうし
普通に作業量との戦いじゃないかね。
1年で500は結構きついと思う。
■ このスレッドは過去ログ倉庫に格納されています