自炊技術総合25 @電子書籍板
レス数が900を超えています。1000を超えると表示できなくなるよ。
>>820
なら塩の入った「消毒用アルコール」を挙げてくれ 安いのがいいのならまあ使ってりゃいいんじゃん
自己責任で 大した価格差じゃないからわざわざ消毒用なんて買わないが、
塩が〜とか粉吹くとか根拠不明のネタには気になるからな。
無水でも酒税対策されたものもあるし。 酒税対策されていないメタノール使ってお酒つくれそうだな
やったら駄目だが >>819だけどさっきピックローラを拭いたら黒鉛びっしり取れた
でも汚れ落としたらまた普通にスキャン出来たわ フルカラーの雑誌サイズをそれなりの品質保って1ページ800kB以下に押さえる方法教えて欲しい >>826
モアレ低減させて網点潰してノイズ除去で均す
jpg設定は サンプリング比 4:4:4にする(重要)
品質の値はファイルサイズと画質見ながら適当に調整
最後にjpegtranなどで最適化する EPSONのスキャナって黒背景にできないんだな
黒背景でオーバースキャンしてエチルトランにかけたら傾きガッツリ補正できるって知ったから期待したのに >>830
そうなのか
そうなったらやっぱり業務用のスキャナにする意味あるんだな 背景黒だとセンサーのキャリブレーションが出来ないからね。
一時的にでも白にしてキャリブレーションする機構が必要になる。
つまり余計なコストがかかる >>828
サンプリング比4:4:4にしたら元サイズの3倍になったんだが なんか設定おかしくなったせいかRalpha使うとファイルサイズがもとより大きくなるようになってしまったぞ
死ねよ Ralphaで変換したら、縦×横って意味での大きさが10倍になってしまったんだがなんで?
画面上部の「大きさ 比率(%)」って所は「100%」のままいじってないんだが
バグ? jpg to jpgで補正もリサイズもせず4:4:4で再サンプリングだけしたの?
それ全然意味ないよ
低画質の狭い箱に詰めるために捨てられたデータは高画質の大きい箱に入れ直してももう取り戻せない
ScanSnapなんかだとスキャンの段階で4:2:0にされちゃうしな
完成版で画質とファイルサイズ減の両方を取りたいならスキャンの段階ではケチっちゃダメ
600dpiできれば可逆で保存して網点潰してきちんと均してからリサイズする
補正リサイズ後のデータなら元がjpgでも4:4:4で再サンプリングする意味はたぶんある
Ralphaの設定戻したいならRalpha.ini捨てるかリネームして初期化すればええ
デフォルトだと品質90サンプリング4:2:2だから
どっちにしろIX500とかでスキャンしたjpgよりは大きくなるはずだがな 変換後のファイルが72dpiにいつの間にか落ちてたんだが?
元が600dpiだったのにどこで変わるんだ? >>838
画像の細かい技術までの所の話は正直殆ど分からない
スキャナでは最高画質設定でスキャンした どうしても市販の電子書籍や自炊代行業者みたいに、
見開きの上下のズレをなくせないや
結構奥の深い世界なんだなぁ 「俺はカラーページをこんなに高画質なのにこんなに小さいファイルにしたんだぞ」って自信ある人はどんなもの持ってるかサンプル見せて欲しい 先輩方に質問なのですが、スキャンのガラス面の内部にホコリが入って、分解してきれいにした人
いますか?
DRC225wで、いくらアルコール等で拭いても、4本くらい、消えない縦線があり(カラーの場合
めだつ)、おそらく内部にホコリが入ったのではと疑っています(ぱっと見、密閉されてるのになぜ?)
それと、電子コミックで売っていればこんな面倒で、神経を使うことをしなくても良いのですが
1番書籍数が多いとネットで出ていた DMM で 成年コミック雑誌 例えば ポプリクラブ
とか検索したら ほとんど無くて で、 これから、 少しずつ過去の 2000年前後とかの成年コミック
雑誌とか 増えてくると思いますか? 増えそうなら、いま電子化しないで待つ作戦もありなのかなぁ。
それと、一番いいのが、雑誌出版社が、雑誌データー→紙雑誌、雑誌データー→電子雑誌
と、作ってくれれば良いのですけども、無理がありそうでしょうか?
長文すみません。 バラして掃除はしたことがあるが、一台はガラス割っちゃった。
センサーは基本的に密封はされてないよ。
ガラスが外せる機種以外はエアブロワーとか使うと中にホコリが入って終わる。
そういう機種は取説にエアブロワー使うなって書いてあるはず。
成年コミックは現役作家の過去作品なら電子復刊の可能性あるだろうが、
引退済みの作家だとよっぽどの名作を持ってる作家以外は権利者(つまりは作家)と連絡取れなくて
復刊は無いと思う。
Jコミとかの方が可能性あると思う。
なので自分は引退済み作家の本をスキャンすることが多いかな。
80年代とか90年代とか、消しや題材の変化が結構興味深い。
成年マンガって記載雑誌や出版社に関係ない出版社から単行本が出るケースが見られるように、
作家が全て権利持ってることが多いように思う。
なので過去雑誌の復刊はほぼ無いと自分は見てるよ。
例示のポプリクラブなんて結構複雑な経緯あるし難しそうだ。 >>846
レス有難うございます。
僕も前モデルの125で、ダメ元で外したりして、パキッとガラスを割ってしまってます(貼り付けが
強力すぎる)。そうか、密閉じゃないんですね、ブロワはやってないんだけどなぁ。
成年コミックって複雑なんですね、単行本は、ぶっちゃけ、古本屋にだいたいあると思うからすんなり
捨てようと思えばできるのですが、ポプリ、パピポ、桃姫、アンリアル等々、雑誌は店にあまりないから
捨てれない、でかい、大量で、しかも、過去雑誌の復刊はほぼ無い、かぁ。
カラーでの縦線が目立つだけで、モノクロはそうでもないから、意を決して、
表紙、数枚のカラーを犠牲にして電子化するかなぁ。 これ縦線だらけだけど、ADFってのはこのぐらい割り切って使うもんなんだと思う
https://books.google.co.jp/books?id=IvbNkQ8N4dcC&printsec=frontcover&hl=ja#v=onepage&q&f=false
ガラスは二回割ったなあ
CANONの安いやつは
ガラス面はいじらず、爪を持ち上げれば裏側から小箱の中は掃除できるとあとでわかったが
どちらにせよケーブルが身近すぎて簡単にはメンテ不可
やるときは処分前でケーブル差し込めたらラッキーってな感じでやるね自分は オフィス用の複合機のADFでスキャンする程度の画質が目標だろうとは思うけど、
X10Cのようにクリーニング機能付ならこれほど酷いことにはならんと思うけどな。
オフィス機は補正が強くかかるってのはあるが。
でも自炊ユーザーが神経質にガラス清掃しまくるような画質は望み過ぎだろうね。
画質自体もちょっと良さ気なフラベに簡単に負ける程度だし。 >>848
ひどすぎですね、逆に、これに比べれば自分のは1割もないから、解決にはなってないけども、
うん、ありがとうございます。
ボックスのフタ部分(ガラス表面の所)を爪を解除して取って清掃しても内側ガラスの端っこに、
ほんんっの少し何かが残って(つまようじ、綿棒、等、色々やりました。)結局、ガラスを取り外さないと
、まっさら状態じゃなくて、はずす時、パキッ、終了、でした。
今の225も前機の1割もスキャンしてない(量的にはほぼ新品)のに内側にホコリが入って
ほぼ使えない(画質の意味で)状態になったしまったけども、電子化はなさそうだし、いつまでも
部屋を占領するわけにも行かないから、やるしかないなぁ。
それにしても、メーカーの修理(清掃は)はどうやってるのかなぁ、全バラ(スキャン周り)、
ガラス交換(割らないでやってるのかなぁ)、気になりますね。 >>850
DR-C125でガラスの内側にゴミがついた時は京セラの電動砥石の振動で落とせたけど
やってみるのなら超音波電動歯ブラシかスマホの角を当ててバイブレーション?
CISセンサーは衝撃に弱いので壊れるリスクもあるけどね(パナ機の分解掃除で壊したw)
まーガラス割れても代わりにアクリル板貼ればまた使えるよ DR6030も5010Cみたいにガラス外せるんだっけ? 機構ほとんど同じに見えるし外せるんじゃね
気になるなら取説ダウンロードして確認してみれば 5010Cも取説には外し方書いてなかったような記憶だったので。
ちょっと見てみるわ >>851
CISセンサーって棒ガラスみたいなやつですよね? 125の時、7回くらい、縦線が入るたびに、分解、清掃
やってて、いつの間にか割れてましたが、どういう仕組でスキャンしてるんだろう、結局ボックスに入ってるのって
あの棒ガラスみたいなのだけですよね、その上に板ガラスがあって、って感じだし。
板ガラスの替えのアクリル板も、ホムセンでこのサイズでカットして下さい、ができるかな?
どちらにせよ、センサーを割るリスクがあるから、使い潰したやつじゃないと怖くてできないですね。 CIS:コンタクトイメージセンサー
センサー自体はCMOSイメージセンサーだよ。
ただし、レンズと一体化されてて、ほぼ密着の位置にフォーカスが合うようになってる。
棒状のもの一列に並んだCMOSセンサーに合わせて作られたレンズね。
アクリルのカットはPカッターを使えば個人でも簡単に切れる。
でも個人で切ると端面をきれいにするのが難しいのでオーダーカットしてくれる通販も良いと思うよ。
ホームセンターのカットサービスではアクリルに対応してくれる率は低い印象。
アクリルだと傷がついてだんだん曇ってくるので、ダメになったら交換する方向だと思う。
ハードコートアクリルもあるけどハードコートが接着に向かないので
ハメこんで装着できるタイプのスキャナじゃ無ければ通常アクリルが良いと思う。
オーダーカットならガラスでもあるけど、普通のガラスは色が入ってるので
オリジナルのガラスの色をみて考える。
オリジナルのガラスが色の無いガラスならそういうガラスをオーダーしてくれるところを選ぼう >>856
丁寧に説明、大変ありがとうございます。いろんなレスをもらい、分解清掃する勇気が出てきました
。そもそも、センサーは以前のやつでそんなにすぐに割れた訳じゃないので、今、分解清掃
やってみます。本当にありがとう。 分解清掃、成功しました!! 縦線ノイズ5本あったのが全くなくなりました。
それはそうと、皆さん、清掃する時、アルコール、キムワイプが普通でしょうか?
僕は、ラッカーシンナー、アルコール、キムワイプですが、こんなの良いよ、みたいのがあったら
教えて下さい。 キムワイプの話はしつこいアンチが居るので面倒くさいことになりやすい。
メガネクリーナーを勧める人も居る。
自分の場合は薬剤で清掃する時はキムワイプで使い捨て、
カラ拭きのときはカメラ用で静電気対策されたクリーニングクロスを使う。
あとは除電ハケと細いノズルを付けた掃除機。
薬剤は無水エタノールとレインXを使い分け。
一冊の始めにレインX塗り、途中で清掃したくなったらカラ拭き
レインXを塗っても縦線消えなくなったらアルコールでレインX剥がし。
こんな感じ。 >>859
細いノズルを付けた掃除機、静電気対策されたクリーニングクロス、すごい良さそうです。
参考にさせていただきます。
それと、NGワード? 出してすみませんでした、以後気をつけます。 >>858
ラーカーシンナーは強すぎで塗装がハゲるので×
アセトンのように樹脂パーツが溶けたり変形はしないがただちに使用を中止した方がいい
シリコンオフの類もきれいになるが油分が抜けすぎて×
結局弱いエタノールが○
ヘキサンはまだ試してない スキャンして付く汚れなんてせいぜいがホットメルト系の糊汚れ。
しかもこびり付いただけのもの。
従って溶剤は必要ない。
アルコールを使うのは速乾性に期待しただけで、溶剤としての性能には期待していない。
自分はこんな感じだな。
溶剤を使って除去しないといけない汚れが搬送路に付くことって有る? なぜに純正汁または同等の成分の液体を使おうとしないのか それぞれの信念があるんだろう
自分もメチル(ネンアルで代用可)原理主義だし いつからキヤノンの純正クリーニングキットが存在すると錯覚していた?
C225Wのマニュアルのはお手入れは ブロアー&水を含ませて固くしぼった布で拭けと書いてあるのな
ブロアーOKとはさすがキヤノン強気すぎるわ >>861
わかりました。
>>862
プラモ用のシンナーが残っていたのがきっかけで、ローラーに付いたインク、ガラスの汚れも取れるし
楽じゃないかな? が、きっかけです。アルコールも速乾性だけの目的なんですね、なるほど。
>>865
ブロアーはありえないですね、使わなくても、少しスキャン、パソコンほうき清掃等、だけで内側
にホコリが入り、昨日まで(約3年間)使用できなくなりましたから。キャノンは自社製品テストしてるのかな?
それと、話題が変わりますが、スキャンして、どうしても斜めにしかスキャンできない場合、対処法はありますか?
2つとも縦にスキャン、両ガイドもキッチリ、見た目には斜めにスキャンしてない(動く余地が無いのに)
傾き補正なし → https://i.imgur.com/T1fdKnv.jpg http://imgur.com/T1fdKnv
補正あり → https://i.imgur.com/9IbPVc6.jpg http://imgur.com/9IbPVc6
2,3回しかUPしたこと無いので、写っているかなぁ? 左右は同じ画像です。
帯は大したものじゃないので 補正なしを今回は使いますが(それでも10分近く格闘)、
前に、きっちりスキャンしても、どうしても斜めにしかスキャンされないのがあって、40分近く、
たった1枚のフルカラーと格闘したことがあります、最後の最後にきっちりスキャンされました。
それと、補正ありで何回やっても斜めって、補正を切ったらカッチリスキャンされたりと、
補正ってなんだろう、て、ことがわりとありますね。多少の斜めはもうなれましたが、
今回の画像くらい余白とかがあると、まだ、許せないですね。 今画像をチェックしたら、左の写真は背景の色も白で、写真と、背景が同一化して分かりづらいので
右側の画像を見て下さい。すみません。 複数のメーカーのスキャナ使ってるし、
そうなると特定メーカー用資材はかえって使いにくいんだよね。
今のところエタノールで困ってないし。 斜行補正と用紙サイズ検知をバッチリしてくれる機種ってある?
なんで代行業者の仕上げてくるデータは見開きがズレないんやろ F1割高だしPFUのスキャナだけ使ってる人以外は純正の安心感を得られるわけでもないからなあ 業者は横装填してるからじゃね?
見開きが合わないのは縦方向の搬送ムラか来る伸びのズレだろうし。 ADFで光速でスキャンするタイプは用紙送り方向が間延びしたり縮んだりしてスキャンされる?
正方形が微妙に長方形にならない? される
fiはカラー雑誌の見開き合わせなんかも一応できたけど
コミックの見開き合わせはフラベ使った方がいい >>866
自分はコミックの場合は傾き補正OFFだな。
斜めの枠線を誤認識したりするからね。
自分は読んでて傾いていてもあまり気にならないし。
フチが黒ベタなページでも認識異常起こす事があるし。
文字本の場合はページめくった時にガクっと傾くのが気になるのでマイナス設定のサイズ認識とセットで傾き補正も入れてる。
文字のページとカラーやイラストのページはスキャン設定変えて別スキャンなので
誤認識しやすいページはどうせ棄てるスキャンだし。
カラーやイラストのページはコミックと同じような設定でスキャンしてる。
基本的にはスキャナが何を縦横の基準として認識しそうか考えて、紛らわしいものがあるページや本は傾き補正を切る。 >>868
富士通のクリーナーF1、良さそうですね、ただ、価格が・・。
>>869
やっぱり1台ですべてOKってわけではないんですね。
>>873、874
間延び、縮みは初耳です、長方形しかスキャンしたこと無いから気づきませんでした。
>>875
結構複雑なんですね、知りませんでした。ありがとうございます。 >>876
モモタロウでイソプロビルアルコールを注文しよう。
クリーナーとして最適 イソプロビルアルコールってオウム真理教事件で覚えた 【中国委託のSAY企画】「まさかスキャナーで読み取ってるとは・・・」年金機構甘いチェック 95万人以上のデータ入力ミス★2
http://asahi.5ch.net/test/read.cgi/newsplus/1521957998/
OCRってそんなもんだよね >>880
ここの住民なら名前部分のみ4800dpiでスキャンして傾き補正、白飛ばし、ダイナミックレンジの端強調、縮小(ry
とかのフォトショアクション作ってデータミス100件以下にできそう OCRなんて解像度上げれば良いってモンじゃないと思うが >>752,754-755
遅レスですがWSLでUbuntu入れて環境構築できました、CygwinとかVirtualBoxとか要らんかったんや
https://remoteroom.jp/diary/2017-10-12/
https://linuxfan.info/wsl-setup-guide
まだサンプル動かして遊んでるだけですが WSLならコマンドラインで使えるので
GUI被せるかバッチ組めばwinのお作法でD&D実行できそう
自炊PDF → 検索可能PDF はGhostscriptでの圧縮やめて
pdftoppm の代わりに pdfimages使えば画像を変質させずに透明テキストだけ被せられる気がする
https://marvelph.wordpress.com/2010/06/10/scansnap%E3%81%A7%E8%AA%AD%E3%81%BF%E5%8F%96%E3%81%A3%E3%81%9Fpdf%E3%82%92%E7%84%A1%E5%8A%A3%E5%8C%96%E3%81%A7%E7%94%BB%E5%83%8F%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%81%AB%E5%A4%89%E6%8F%9B%E3%81%99/
ただ hocr-tools が Ubuntu + python2.7 以外の環境で上手く動作させられずにモヤっとする
VirtualBox + Xubuntu + python2 → 成功
Ubuntu on WSL + python2 → 成功
Cgywin / MSYS2 + python2 → pipでのインストールに失敗する
python2 for windows → 作成されたPDFの透明テキスト内の日本語が文字化けする
Ubuntu + python3 → 上と同様 何言ってるか分かんねぇ
自炊にそこまで情熱捧げてんのか 趣味の一環と考えれば「追求型」の人がいてもおかしくないでしょ。
自分も今までつぎ込んだ機材や手間を考えたら、
自炊に興味ない人から見たら異常だろうと思われるだろうし。 すまん
ここは元々取りっぱなし派補正派zip派PDF派入り乱れてるから
わかってる人興味のある人に伝わればいいかなと
既存のOCR製品やスキャナ付属のソフトでのPDF作成に不満しかなかった身からしたら
googleのOCR性能で補正済み画像からPDF作れるなら「そこまで」の価値はあった
副次的効果として今までずっと隣の芝生だった分からない世界が
Windows Subsystem for Linuxであっさり自分ちの庭と繋がったというのも大きい 大学生です
自炊してocr処理したpdfの教科書を
onenoteに入れようと思っています
onenoteなら本文を横断検索できそうだからです
どう思いますか 自炊書籍を見たり読んだりするのに最適なソフトやアプリ、ハードってどんな組み合わせだろ? そんなの何を読むかによって変わるだろ
12インチのiPadが最適という人もいればkobominiを愛用する人もいる >>891
それぞれ、環境別のベストバイみたいな物があれば・・・
PCで使ってるけどビューアーって言うほど洗練された物がない気がする >>892
デスクトップならマンガミーヤ
タブレットやタッチ画面で操作するならストアのPicoViewerを推しておく >>889
ファイルとして添付するとOneNoteから直接PDFの中身の検索はできない
印刷イメージとして挿入するとPDF内のOCR情報は失われる
後者についてはOneNote内臓のOCR機能で新たに検索用テキストが作られるけど
>自 炊 し て ocr 処 理 し た pdf の 教 科 書 を
みたいな感じで日本語は1文字ごとにスペースが入るので検索ではほぼ使いものにならない
横断検索だと
・EverNoteに張り付けておく
・Googleドライブに放り込んどいて必要なときにブラウザから検索かける
・ローカルにPDFのまま保管しておいてDocFetcherのようなPDF対応のGrepソフト使う
あたりが実用的じゃないかな 同じく。WindowsタブレットならPicoviewer一択だな。
アンドロイドのPerfectviewerより機能的に上の部分が多いし。
自炊してる人なら買って損なしだと思う。 >>884
Pythonスクリプトが見にくかったので、シェルとPHPにしてみた。
シェルでcurlコマンドでGCVにOCR処理を投げて、自作のPHPでjsonをhocrファイルに変換、最後にgostscriotでPDFに変換って感じ。
WSLで使うのは考えたことなかった。
Unbuntsは苦手なのでFedoraが出たら試してみる。 すごいなあリナックスで自炊とかマゾとしか思えん
なぜそんな険しい道をゆくのか
すごいなあすごいなあ 趣味嗜好なんて他人に理解できなくて当然だろ
自分も酒やたばこをうまいと思ってる奴らの嗜好が理解できん >>899
険しくてもやるだけの価値があるから?OCRができたら便利じゃん。それも出来るだけ精度が高ければ。 >>898
よろしければ差支えない範囲でコード見せていただけないでしょうか、特に
>最後にgostscriotでPDFに変換
のあたり
自分もhocrファイル作成までは何とかわかるんですが
hocr→pdf の部分がhocr-toolsでpython依存になってしまうんですよね
ここのやり方理解できてうまいことwin用バイナリ組み合わせられれば
linuxに下りなくてもできそうな気がしてるんですが >>902
ごめん、そこ説明抜けてた、hocr-pdfでhocrからpdfに変換してます。 >>896
PDFviewer by PSPDFkit
Apple Pencilで書き込みながら使える >>903
そうでしたか了解です、無理言ってすみませんでした。
ググってて hocr2pdf というのも出てきたけど透明テキストじゃなくてテキストに置き換えるっぽい?
とりあえずhocr-pdfの代替には無理みたい
調べる過程でtesseract-ocr ってフリーのOCRツールを知ったんですが
これ、素のtesseractのWindows用バイナリ(ver4α)だと残念な感じだったのに
フロントエンド被せてある VietOCR がGoogleさんもびっくりな認識率で驚いた
カスタマイズで相当辞書を鍛えてるっぽい?
https://i.imgur.com/tj1ARCW.png
tesseract.exeでは1ページずつだけどOCRからPDF出力までできるのでVietOCR同梱のほうで
tesseract.exe -l jpn hoge.jpg hoge pdf
バッチ組んであとでgsとかで纏めればローカル環境だけでそこそこ精度のPDFが作れてしまう予感 >>905
PDFviewerって高速でページめくると落ちやすくない? >>894
ありがとうございます
onenote駄目でした
DocFetcher使ってみます >906
すげえな、まじかよコレ。
当方、もうずっと以前からxubuntu16.04上でtesseract-ocr4.00alfaを使って、
スキャンした小説のテキスト化をやっているが、最近やっとそれなりの認識結果の
テキストファイルを吐き出せるようになったというのに、これはかなわない。
本来ベトナム語用OCRソフトだったVietOCRも、以前に一度使ったことがあったけど
認識結果はとくに変わらなかったから素のtesseract-ocrでずっと使ってきたけど、
ここまで向上できるものなのか? 桁違いの認識精度だな。とくにtesseract-ocr
のくせに余計な半角スペースが全然挟まってないのが素晴らしい。
ちょっとVietOCRインストールしてくるわ。 MSのブラウザでも音声読み上げが搭載されとるし
OSに内蔵されてゆくんだろうな CANNONのWIAドライバって不便でしょうがないな
Windows10 ×64で更新したせいか
BTscanのソース選択からTWAINドライバが項目から消えて、
TWAINドライバから起動する ScanGearを呼び出せないわ
ずいぶん前からほうっておいてる
ファイヤーウォールのせいだろうが、
サイトの設定項目の説明が残念ながらどこも古くてわからんちん 909
うーむ、昨夜喜び勇んでVietOCRをxubuntu16.04にインストールした>>909だが、
残念ながら思わしい結果にはならなかった。
>>906が上げてくれた画像の左半分をサンプルにして、同じようにVietOCR5.0alfa
でOCRかけてみたが、↓こんな感じに一文字ごとに半角スペース入りまくりで(後半カット)
----------------------
光 学 文 字 認 識
光 挙 文 字 部 橿 に う が く も じ に ん し き 、Oplilldaricer ricognidom は 、
ス キ ナ ー で HR り 込 ま れ る ) を コ ン ピ ュ ー タ が 鎖 集 で き る 形 弐
ー 舩 に OCR と 賊 記 さ れ る .OCR は 人 工 知 背 や マ シ ン ピ ジ ョ ン の
----------------------
----------------------
光学文字認識
峙文零鵬(こうがくちじ仁んしき 0璽囁由・ 血「加艶「 峡皿踵柑皿 は 活字の文書の幟
ス圭ヱナーで取り込まれる)をコンピユータが編集できる形式(茎臺コー建の列)に蛮換すろ
一般に 0C翼 と略記される”OC翼 (ま Jや咄の研究分野として始まっア髑研究は統けられ
----------------------
素のtesseract-OCRだと↑こんな感じで、同じOCRエンジンでもかなり異なる間違え方を
しているから、Windows版程正解率が高くなくても手駒が増えるのなら悪くなかったんだけど、
残念ながらいつも使ってる300dpiの縦書き小説スキャンtiff画像を読ませると、文字コード
間違えてんのか? ってくらい謎の文字列になってしまう。オプションで縦書き指定にしても
ダメ。残念ながら使用に耐えない。
Windows版と何が違うんだろうね。 Google Cloud VisionのOCRの精度すごいな。
本1冊分だとちょっと時間かかるけど 傾き補正や見開き上下ズレの解消を考えたら、
やっぱり黒背景で読み取りできる高級機の方がよさそうだなぁ
おすすめのスキャナある? 予算次第でしょ
ちなみにうちの中古で買った業務機さんはときどきでっかいブロックノイズが出る困ったちゃんだ 予算と中古OKかどうかでかなり分かれるんじゃないかな。 黒背景は裏写り対策であって傾きや見開き上下ズレは直接関係ないと思う
見開きに関しては高価な業務機のほうが伸び縮みしにくいというのはあるけど
傾きは印刷が紙とずれてる場合 紙端基準での傾き補正では対応できないし
あと紙端に除去しきれなかった黒縁残るし断ち切り黒原稿は自動サイズ自体失敗するから
自力で手動トリミングする覚悟じゃないと使いこなすの難しい
白背景の家庭用機より画質はきれいだけどね ただ黒背景は漫画の回想シーンのような地色が黒のページでサイズのページで誤認識を起こすのが欠点。 見開きズレ対策は横装填する為=A3対応機ってことじゃないかな
機種にもよるだろうけど傾き補正にもたぶん使われてる。
文字列の角度と紙端の角度のちょうど中間みたいな角度に補正されることがあるし、
うちのスキャナは傾き補正入れると黒背景になるわ。
だからうちでは文字主体の原稿の場合はアンダースキャンさせて紙端を傾きの基準にさせないようにしてる。
コミックなんかだとコマ枠で誤認識しちゃうのでそもそも傾き補正はOFFだし、
うちでは黒ベタは背景の黒から浮かせた黒にしてスキャンしてるわ。 見開きが多い漫画の自炊は頭が痛い
どうしようかプランを立ててから
単行本サイズだと横装填でいいけど、愛蔵版サイズだと横にスキャンできない
と言ってもむちゃくちゃ伸び縮みするかというとそうでもない
ただ上下の高さがずれて左右ページの高さを合わせるのが大変
見開きノウハウがあれば教えて欲しい レス数が900を超えています。1000を超えると表示できなくなるよ。