自炊技術総合25 @電子書籍板

レス数が1000を超えています。これ以上書き込みはできません。
1名無しさん@お腹いっぱい。2018/01/10(水) 05:34:15.04ID:/7TF4DuT
書籍を自分でスキャンして電子化する、
通称「自炊」についてのスレッドです。

■前スレ
自炊技術総合23 @電子書籍板
http://rio2016.2ch.net/test/read.cgi/ebooks/1485175560/
自炊技術総合24 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1501637878/

■関連スレ
【コミック】自炊技術総合スレッド43冊目【書籍】
http://yomogi.2ch.net/test/read.cgi/download/1442423719/

■参考サイト
自炊技術Wiki
http://wikiwiki.jp/bookjisui/

952名無しさん@お腹いっぱい。2018/04/04(水) 04:48:08.36ID:KImEvZhb
かまう方もかまう方やで

953名無しさん@お腹いっぱい。2018/04/04(水) 09:16:31.83ID:+AhcpeN4
そろそろ次スレだし 対白黒君用のテンプレ纏めといたほうがいいな
ワッチョイはこのままなしでいいんだっけ?

954名無しさん@お腹いっぱい。2018/04/04(水) 11:29:10.78ID:nfXtRdOp
アレですぐ分かるけど、擬装しほうだからワッチョイ付けてもいいかも

955名無しさん@お腹いっぱい。2018/04/04(水) 13:37:03.77ID:kfAEcs8g
ワッチョイなんてストーカーが喜ぶだけだよ

956名無しさん@お腹いっぱい。2018/04/04(水) 16:32:28.08ID:s8KcMpq1
すみません、この画像の原因が分かる人いらっしゃいますか? DRC225Wです

→ http://imgur.com/jRGTszb  わりといきなり出ました、何回やってもでます。

このエラーが出る前、いつも、4枚くらいずつスキャンしてるのですが、ほぼ毎回、紙詰まりエラー
がでたり、この直前くらいに、左半分は、裏写り防止をしてるみたいに白っぽくなり、右半分は
普通だったりと、意味不明なことがおこってました。 センサー系のトラブルかな?

957名無しさん@お腹いっぱい。2018/04/04(水) 19:14:32.12ID:AClKLtuF
頻発の時点で修理依頼だが、一応ドライバ入れ直して様子見

958名無しさん@お腹いっぱい。2018/04/04(水) 21:11:19.54
よく「修理するぐらいなら買い直した方が長い目で見れば安い」って聞くけど

959名無しさん@お腹いっぱい。2018/04/04(水) 22:50:40.29ID:ZG1mGggf
>>932
あんまり期待しないほうがいいなとは思う
いたれりつくせりではないから
うちのはオートクロップがアホの子だったので、
サイズを定規で測り、最初にミリで入力しておく癖がついた
結果、気持ちよく揃うようになった
業務機ならではだなあって思う

9609122018/04/04(水) 23:34:33.20ID:u6ub9hHv
>>933
VietOCR-5α用の縦書きモジュールjpn_vert.traineddataの検証、サンクス。
tessdata_fastとか、英語のソースから見つけ出せるってすごいな。

早速xubuntu16.04上のVietOCR-5αでjpn_vert.traineddataを試してみた
ところ、横書き用のとは共存できないのか、リネームしてjpn.traineddataの
ふりをさせることで、半角スペースまみれとはいえ、縦書きの画像から見事
それなりの認識結果が得られた。

正直、正解率からいえばblacklistでNG文字を設定し、jpn.unicharambigs
を改造して後処理パターンを修正したjpn.traineddataを使用した現行環境
の方がややマシだった。

とはいえ選択肢が増えるのは良いことなので、メニュー→コマンド→一括OCR
でフォルダ内のtiff画像200件超えを連続処理させてみたところ、相変わらず
020.tif辺りから開始して、最後まで行ってから001.tifに戻ってOCRする
謎行動だったが、何故かjpn_vert.traineddataではない方を使った時と同じ、
日本語になっていない認識結果が得られた(泣)

認識後の後処理に正規表現を使ったリストが使えるらしいのは魅力だが、
残念ながらLinux上ではまだVietOCR-5αは使えないようだ。

あと素のtesseract-ocr4.00αにjpn_vert.traineddataを食わせてみたが、
リネームしようが、jpn+jpn_vertに指定しようが、エラーになって使えなかった。

961名無しさん@お腹いっぱい。2018/04/05(木) 07:58:05.45ID:HiuKo9OF
>>953
ワッチョイありがいいのならIP表示までやった方がいいよ

962名無しさん@お腹いっぱい。2018/04/05(木) 09:56:53.09ID:BWrEmF8i
5chに金払ってID消してるやつはIPもワッチョイも消せるから無駄だよ

963名無しさん@お腹いっぱい。2018/04/05(木) 11:27:15.97ID:X4fYcRiG
過疎るだけ

964名無しさん@お腹いっぱい。2018/04/05(木) 11:30:52.76ID:hE3IdqIY
消してる奴は避けるという目印にはなるけどね。
IDだけでもできるけど

965名無しさん@お腹いっぱい。2018/04/05(木) 14:41:52.36ID:oObhO/zx
>>961
それは書き込む人が激減するから絶対反対

966名無しさん@お腹いっぱい。2018/04/06(金) 00:08:05.34ID:6L44E36z
しかし業務機のフルカラー300dpiは爆走だなあ
満足できるかはまた別として

967名無しさん@お腹いっぱい。2018/04/06(金) 00:08:24.69ID:6L44E36z
○爆速

968名無しさん@お腹いっぱい。2018/04/06(金) 03:00:02.48
自炊愛好家オフ会って無いん?w
お互いの自炊を自慢し合うみたいなwww

969名無しさん@お腹いっぱい。2018/04/06(金) 09:12:11.25ID:d1jIAtXn
そのまま交換会に発展しそうで危ないからやってたとしても表には出てこないだろ

970名無しさん@お腹いっぱい。2018/04/07(土) 04:25:56.86ID:cMMbdHTk
>>960
ubuntuにも入れてみたけど最新ソースからビルドで行けたよ
英語はchromeの自動翻訳まかせ これなかったら今更linuxデビューなんて絶対できんかったわ
まあスレも残り少ないしいい加減うざがられそうなので続きはOCRスレの方で

【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net
http://egg.5ch.net/test/read.cgi/software/1470745451/

あと>884 自己解決したので誰も興味ないだろうけど報告だけ
hocr-pdfの日本語文字化けは標準出力由来だった
ファイル出力に対応したfork版と差し替えで解決 https://github.com/zvezdochiot/hocr-tools.git

971名無しさん@お腹いっぱい。2018/04/07(土) 09:33:57.90ID:QlO8yPr/
いま、Kobo H2Oを使ってるんだけど、
電子化するか迷ってるA5サイズのマンガを寝る前に久しぶりに読んだから、
紙媒体の本が目も疲れないしページも自由に前後できるし本が楽しくて仕方なかった。
今の状態で電子化すると本を読む楽しさが劣化してしまう気がしてきた。
優秀なリーダーなら解決できるだろうか?
もし、お薦めのリーダーがあれば教えて欲しい。

972名無しさん@お腹いっぱい。2018/04/07(土) 15:22:05.57ID:UUQgXppx
紙本で読むことに価値を感じてるならスキャンなんてしないほういいんじゃね?

9739602018/04/07(土) 17:17:19.77ID:asGm9HTg
>>970
了解

つか、その板のレス番4〜29まで長々と籠城してたの、オレ。
Linux+tesseract-ocrネタでバレバレだろうけど。

974名無しさん@お腹いっぱい。2018/04/07(土) 19:10:30.58ID:QlO8yPr/
>>972
大引と束を追加して頑張ってたけど部屋にもう本を置く場所がない
それに地震が起きて本が分銅みたいになって揺れると家そのものが危険になりそうだから重量を減らそうと頑張ってる
ただ、最近紙で読むと楽しさが倍増したから、良いリーダーを買えば同じ楽しさが再現できるのではないかと思って質問した感じ
テキスト読むならどれでも同じような感じだけど、マンガと小説では感じ方が結構違う
大きい画面がいいかも

975名無しさん@お腹いっぱい。2018/04/07(土) 19:55:24.80ID:gQguz6CS
とりあえず、手持ちの本を全部電子化。
でも紙で読むのがすきだから、
よみたい本の読みたい部分だけをプリントして、
よみ終わったら破棄する

976名無しさん@お腹いっぱい。2018/04/07(土) 21:25:59.59ID:SEJCddkV
自分なら読む本はそのまま残して、今後いつか読むだろうけど
今は捨てられない本は自炊する。

9779562018/04/08(日) 17:27:12.69ID:UZVnXelx
すみません、先輩方にお聞きしたのですが、予算7万くらい、なるべく中古なしで
キャノン以外でおすすめのドキュメントスキャナーありますか?

DR125、225Wと使ってきましたが、まともに斜め補正が機能しなくて
キャノンは糞だと思いました。 

最低限、まっすぐ読み取る(補正する)やつがほしいです。縦線ノイズは
この分野の宿命だと諦めます。

978名無しさん@お腹いっぱい。2018/04/08(日) 23:14:46.84ID:Y85XGNB/
>>977
DS-570W持ってるけどダメだなぁ
やっぱり黒背景じゃないと厳しそう

979名無しさん@お腹いっぱい。2018/04/09(月) 04:20:17.80ID:FZ4yIsaf
それはスキューと関係あるのか?

980名無しさん@お腹いっぱい。2018/04/09(月) 08:22:26.77ID:V2cH1GwO
自動傾き補正は

コミック
 →枠線を基準と誤認するので本質的に難しい
文字本
 →文字列のみを基準としてくれればそこそこうまくいくが、
 紙端も基準にされると印刷の傾き(文字列)と影響しあって失敗する
ページ全域のイラストや写真
 →紙端基準にするしかないが、黒背景の方が確実に紙端を認識できる。

こんな感じでどこも一緒じゃないかな?
自分はコミック中心だからかもしれないが、
搬送の安定した中型以上の業務機で傾き補正OFFってのが、
傾きが少なく安定したスキャンを目指した自分の今の結論。

うちでは原稿サイズ+2mmでスキャンしてるが、紙端がスキャン範囲外に出ることはほとんどない。
+1mmだとたまにはみ出る

981名無しさん@お腹いっぱい。2018/04/09(月) 08:37:37.15ID:V2cH1GwO
ピックアップの時に傾いたまま斜めに入っていくんじゃないかなとおもうのいで、
斜行対策として自分は原稿ガイドまわりに手をかけてる。だと思う。
小口研磨された本とか裁断に失敗して裁断面が荒れた原稿の場合に斜行しやすいんだけど、
裁断面と反対側に軽い重しを置いて軽く抵抗掛けたり、
紙が薄い原稿の場合は原稿ガイドと干渉して浮き上がったりする場合にも
やっぱり重しを置いて浮き上がりを抑制したりしている。

原稿ガイドに引っかけて吸い込まれないような形にアクリル板を切っただけの重しだけどね。
自分のこの手間は後工程で角度補正はしたくないっていう方針から来てるが、
角度補正が許容できるのならスキャンの時の補正には期待しないのが楽でいいんじゃないかな?

982名無しさん@お腹いっぱい。2018/04/09(月) 08:59:43.74ID:HTWkRSN+
傾き補正に上限設定がないのが前から不思議だ
45度とか90度とかそこまで曲がって吸い込まれるわけなかろうに
3度以上の傾きは検出しても無視するとかにできればいいのに

983名無しさん@お腹いっぱい。2018/04/09(月) 09:01:51.79ID:pbitxBHv
ix500だと補正オフでも
紙を斜めに入れてもちゃんと補正されるので
適当に放り込むだけでいい

補正オンだと追加でランダムで90度回転する機能だから気が抜けない

984名無しさん@お腹いっぱい。2018/04/09(月) 11:26:28.43ID:V2cH1GwO
>>982
サイズ混載とかで適当に放り込んだ原稿に対応するようになってるんだろうけど、
リミット制限が有ればだいぶ使いやすいとは自分も思う。
紙端を認識したうえでそこから5度以上は無視するとかやってくれないかね。
スキャン影の塗りつぶし補正機能が有る以上は紙端の認識はできてるはずだから、
その内側から基準を探すだけで行けると思うんだけど。

>>983
それは傾き補正じゃなくて原稿の向き補正の機能では?

985956 977 2018/04/09(月) 23:43:53.38ID:BOf7Xatg
レスありがとうございます。
まっすぐ読み取るのって意外と?難しいんですね。素人目に見て、例えば真っ白の原稿
でも、一応は白い原稿をスキャンできてるわけで、その上辺、下辺を平行にすれば、
横は裁断の程度で少し隙間が空くけども真っ直ぐスキャンでき、画像の枠線うんぬんは
関係無くできそうですけどねぇ‥、研磨された中古本はわからないが。

キャノンはホントひどかったですよ、たった1枚の週間漫画のカラー、ぱっと見、まっすぐなのに
斜めのスキャン結果が連発、補正切ったらまっすぐと、意味不明でした。
それと、表はまっすぐ、裏ななめ、とかもね。

ix500のアマゾンレビューだと、斜めるレビューが1個くらいしかなかったけども
S1500→ix500 がだいたい6年位。待って、より良くなったのを買おうかな?

986名無しさん@お腹いっぱい。2018/04/10(火) 00:49:49.20ID:LYn8cWZ/
良いのがほしければ待たずにfiの中古いっとけ

987名無しさん@お腹いっぱい。2018/04/10(火) 02:02:05.35ID:YSVLUJH9
fiの中古のどれ買ったら良いのか分かんね
黒背景ってのに対応してるのがいいの?

988名無しさん@お腹いっぱい。2018/04/10(火) 06:30:36.35ID:R6BmVL+5
ドキュメントスキャナという用途を考えると
原稿紙端を基準にスキャンする場合と印刷を基準にスキャンする場合の両方を考える必要があるからね。
だから印刷内容から基準を探してこようとする。
コミックのようにワク線や斜めの文字列を見つけるとそれに合わせようとしたり、
角度の違う複数の基準らしきものから基準を作り出して合わせてきたりもする。

変な角度に回転させられた場合は何を基準にされたのか確認してみると良いよ。
その機種の補正のクセみたいなのがわかってくれば使い分けもしやすくなって、
不本意な角度補正に遭遇する率が下がるし。

大抵の人はコミックでは角度補正と原稿サイズ認識はOFFって所に到達すると思うけどね。

989名無しさん@お腹いっぱい。2018/04/10(火) 06:45:26.82ID:R6BmVL+5
ちなみにスキャナの評価として斜めと言われるのは原稿を斜めにスキャン搬送してしまう『斜行』を指すのが一般的。

スキャン画像を補正機能で間違った斜めにされてしまう症状は、
本来の機能目的である文字列の認識と文字列基準の角度補正が出来ていれば
原稿が悪いという評価が多いんじゃないかな。

990名無しさん@お腹いっぱい。2018/04/10(火) 08:41:35.72ID:MqxScTxs
斜め補正はスキャン時OFFでえちる使うからあんま意識してないが
キヤノン機は斜行しやすい印象はあるな
ラウンドスキャンの125、225Wならなおさらだろうとは思う

>>984
scansnapは傾き&原稿の向き補正でひとつのオプション
どっちか片っぽだけ有効にはできなかったはず

991名無しさん@お腹いっぱい。2018/04/10(火) 09:41:30.07ID:DlbFGiWR
サイズ自動判別だと傾き補正が常に実行されるってことだけど、
サイズ自動判別をOFFにすれば読み取りモードオプションの文字列の傾きを自動的に補正するって機能が整除できるようになるんじゃないん?

初めて知ったけど傾き補正って5度までって制限がついてたんだね。

992名無しさん@お腹いっぱい。2018/04/10(火) 09:42:33.60ID:DlbFGiWR
誤字ったけど「制御」ね。

993名無しさん@お腹いっぱい。2018/04/10(火) 17:46:41.19ID:3cdFmw59
誤字った…

994名無しさん@お腹いっぱい。2018/04/10(火) 22:43:01.70ID:fCrauAx8
PFUのPaperStream IPって癖が強くてちょっと初心者の自分には難しいねー
クロッピングや傾き補正を使用すると
おせっかい機能で背景色や黒で画像の中まで塗りつぶされてしまう
だから使用しない設定つくっておかないといかんね
これ各モデル共通の仕様で普通?

995名無しさん@お腹いっぱい。2018/04/10(火) 22:56:01.38ID:sBW57/G4
>>977
ds530悪くないよ。

996名無しさん@お腹いっぱい。2018/04/10(火) 23:03:45.10ID:scIFJAfd
エッジを四角く認識するみたいなオプション無い?
PaperStream IPドライバじゃなくて富士通twainドライバのほうだけかな?
機種固有機能かもしれんけど。

9979942018/04/11(水) 00:36:46.22ID:avizQGkR
研究します

998名無しさん@お腹いっぱい。2018/04/11(水) 10:59:32.63ID:hpuyM7NN
機種によって個性がいろいろあるから
複数あるとはかどるな
ゴルフはやったことないけどクラブもいっぱいあるもんね

999名無しさん@お腹いっぱい。2018/04/11(水) 15:04:44.71ID:GEwtgRn2
やっほー

1000名無しさん@お腹いっぱい。2018/04/11(水) 15:05:05.18ID:cwFbhkve
おしまい

10011001Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 91日 9時間 30分 50秒

10021002Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php

レス数が1000を超えています。これ以上書き込みはできません。