自炊技術総合25 @電子書籍板
レス数が1000を超えています。これ以上書き込みはできません。
誤字のこと言ってるなら別に面白くもなんともないが
こんなので喜ぶのは小学生までだろ A3なんて言わないから雑誌に多いワイド判に対応したドキュメントスキャナを出して欲しい
Scansnampで出してくれないかな
iX510とか むしろA3でダメな理由は?
価格のことを言うなら規格外のサイズ作るほうがコストは高くなるよ 参考書とかで、「まとめ」みたいなところで枠で囲まれて背景がネズミ色にされて文字が書かれてるケースあるけど
文字には全く影響を及ばさずにネズミ色の背景だけを除去する方法とツールってある? そういえば、参考書とかって
実本では気にならなかったが
印刷の影響か斜めになってるのが非常に多いよなw ネズミ色が中間色ならレベル補正できれいに消える
ドットトーンだと場合によっては厳しい >>636
A4ワイドだって規格といえば規格
そもそも主流でもなくて現時点で量産効果が出てない規格なんてどっちにしたってコストは変わらんでしょ
それなら大きくないほうが紙送りなどの条件が良くて設計的に有利
そもそも現行のScansnapだってフリーサイズの紙をスキャンできるんだから、A3じゃないと駄目なんて
どんな理屈だ? 需要の程度の問題だろ。
現状のA4スキャナだってA4じゃなくてUSレターサイズになっている
どのサイズまでに対応するのがコストアップと需要のバランスが取れているかというだけの話。
小さいサイズへの対応はほぼノーコスト(ローラー間隔なんかの問題はある)だが、
大きいサイズへの対応にはセンサー系統の拡大が必要。
A4ワイド、つまりB4幅のスキャナが需要有ると判断されるなら発売されるだろうが、
canonのDR3080CII以降は出てきてない時点で商売にならないとメーカは判断したってことでしょ。 ちょっと待てよ?
ひょっとして畳1畳分くらいの画像でも数十枚に切り分けて何かのソフトで合成して1枚にすることってできる? B列用のスキャナなんてA3用以上に需要無いだろうな。
ましてやScansnapの価格帯なんて無理だろ。
普通に考えたらA3用のScansnapの方が先にきてるはず。
オフィス文書にB列が一般的で無い以上、業務用機のおこぼれに預かる家庭用機には難しい話。 各社の業務用機のラインナップを見ればわかると思うが、業務用機はA3用が主流。
この時点ですでにB4スキャナを開発する理由はほぼ無い。 >>640
雑誌ではなくてスキャナの規格の話
すでに製品化されてるA3ADFとちがい、A4ワイド規格のスキャナ製品は現状で存在しないので
金型部品組立ライン環境設備など全てを新しく起こして作る必要がある
需要も個人ユーザーの自炊用途に限定されてしまう
勘違いしてる人も多いけどScansnapはパーソナルユースではあるものの
”オフィスの書類を簡単にまとめます”ってのがもともとのコンセプトの製品なんで
自炊ブームが完全に下火になった今、自炊特化サイズの新型を出す意味はないに等しい
>現行のScansnapだってフリーサイズの紙をスキャンできるんだから、A3じゃないと駄目
A3機でもフリーサイズの紙のスキャンはできるよ?
A3じゃないとダメなのではなく存在しない幻のA4ワイドに固執しなくても
既存のA3製品買えば今すぐ解決できると言っただけなんだけど A3の価格破壊に挑むメーカが現れる前に自炊市場が縮小しすぎたのがいかん 逆に雑誌がA4ワイドやめろって話だよな
馬鹿が変な事やりだしやがってよ お金ないから古本自炊はじめたいけどお金ないから設備買えないジレンマ >>648
iX500 5万弱
裁断機 1万
学割でアクロバット最新版 2万弱
で自炊ライフスタート出来る
何を持って元を取るって言うのかもあれだが1000冊自炊したら十分やった気にはなれる と思う つーかデジカメもう少しキレイに写ればなあ
装置簡単に作れるのに >>651
ページをフラットにするのが難しいし、フラットにしても周辺まできっちりピントを合わすのが難しい。やっぱりラインセンサーが良いのでは? 自炊ってメリット2つじゃね?
通勤スマホと本棚撤去
異論は聞く >>649
カラーページでの縦線に酷くストレスが溜まるよw >>648
すぐ縦線入るから
毎年買い替えるくらいの予算を用意できるのがベストだわ >>652
一応裁断はしとこうよ
あとは中心と周辺との距離の違いや明るさでしょ
それはドキュメントモードとかカメラ側でソフト開発出来ないもんかなぁ
明るさは透明の箱作って光を当てる装置作って上にカメラ固定して
ISO感度下げてシャッタースピードゆっくりF値下げて 裁断前提だとそもそもカメラに固執する理由がないっていう
証明やピント合わせ用の固定冶具をDIYしてる動画とか昔つべで見たけど
素人が調整しながら作るには敷居高いわな
特にピント合わせはSV600ですら首振ってる有り様だし >>657
でも縦線出ないよ
シャッターもスマホやリモコンで外から出来るし
あとは撮影の設定数値が知りたい
距離の違いは離れて望遠で撮ればなんとかなるかも
無理か 縦線忌避のために画質落とすのはそれこそ本末転倒だよ
元々カメラ好きならデジイチ買ってあれこれ試すのもいいかもしれんが
ページめくりの手間もあるしな
縦線の出やすさは機種にもよるかと
中古で買ったDR-6010Cは埃紙粉対策してますって謳い文句だが確かに縦線は出にくい感じ
fiシリーズ系はセンサがCCDで縦線もボケ気味で薄いものなら補正の行程で勝手に消えてた
逆にどうしようもなかったのがDR-5010C
極細クッキリの縦線がひっきりなしに入るので目視で確認用しづらい
最後は諦めて手動で線消ししてたわ 確かに画質がなぁ
一眼レフとかデカいセンサー使えばクッキリ映るのかな アクロバットで傾き補正したらページ遷移が遅くなるんだな
これ失敗だわ、補正前のファイルを残しておけばよかった >>648
言っとくけどお金の節約にはならないぞ
余暇を消費することで本を全てデータ化したいという変態的欲望が満たされ、
そのおまけとしてスペースの節約がついてくる程度だぞ… 業務機買ってしまった(中古)
しかしA3対応していること以外では正直あんまり差は感じないなあ
これでも定価30万かあ
自炊の限界を見た
これでなんかいろいろ諦めがついたわ
ADFではあんまり凝ってもしょうがないなと
消耗品として割り切るしかないし
過度な仕上がりを求めるのもやめにしようと思った >>665
A3自炊したいのだけどKinkosでやるか中古を買うかで迷ってます。
中古で買った機種と値段を教えていただけませんか? 業務機だからって別にスキャンがきれいになることは無いって
スレではさんざん言われてたでしょ。
黒背景と、速度、搬送安定性以外にメリットは無いよ。
2光源の上位業務機になるとシワとか紙地繊維飛ばしに強くなるけど。 いや速いだけで画質よくならないって言われてるのは業務用複合機
ADFに万能機なしは高級機でも同じだけど複合じゃない専用スキャナは家庭用機よりは良くなるよ
(逆に言うと家庭用機の画質がアレすぎるとも言えるが)
業務機はグレードで確実な差があるので中古で何買ったか分からないとなんとも言えんけど
PFUならfi-7160以上はCCDセンサなのでカラースキャン向き
キヤノンならDR-6010C以上は画質がシャープで補正しやすい
A3だとDR-5010Cあたりは経年劣化もあるのできついかも知れない >>666
PFU fi-5530C2
2万円ちょい
3.11の頃の製品でしみじみした 最安モデル買ったくらいで言い過ぎた
ピントが甘いのははずれなのかもしれない
ワイド版ScanSnapと思えば十分満足
それにしても箱などまでスキャンしたかったら
結局A3フラットヘッドも必要になるなと CCFLだから光源まわりの寿命を考えると不安が有るな。
搬送もパッド分離だし。
価格ランクから言っても普及型A4機を大きくしただけの部類だな。 まあそうでしょう
連投すまんけどいちおう動作報告
PFU fi-5530C2(←※C2)
Windows10 64bit
BTScan
ドライバはダウンロードページにあるレガシードライバ
FUJITSU TWAIN32 Version 9.21.1600の
Ft9l18gX1_R.exe >>668
自分には業務機の差は黒背景と2光源以外よくわからんかったわw
でも「画質良い」の基準が「シートフィード機として良い」というスケールだと理解してる人と、
スキャナと言えば普通に思い浮かぶであろうフラベの画質を想定して「良い」と思う人で
評価は割れるだろうね。
カラーはともかくフォーカスというか精細度というか。
光学解像度600dpiであるというのは明確な目安だろうけど。 2007年8月発売らしいから世代的には2009年のS1500より前に発売された製品か
とはいえCCDかつ非球面レンズ縮小光学系じゃないから普及機(ScanSnap)と同じってことはないんじゃない?
少なくともS1500のようなグニャリやIX500のようなライン抜けはないはず
PFUのCCD機はセンサと紙の通る隙間をCISほど狭めてはいないのでボケやすいというのはあると思う
あと経年劣化でもその辺は結構変わってくるところかと はじめて漫画自炊するのにキンコーズ行くのはやっぱ精神的ハードル高い?ビジネスマンばっかりだよね?
おとなしく自炊の森いったほうがいいのかな…遠いけど >>674
いびきのようなすごい音がするわー
経年劣化かもしれない
でもまあなんだかんだ言っても夢のA3環境
もったいなくて通常の書籍には手持ちのA4 ADFを使用してます >>673
ADFでフラベ並みは100万クラスの高級機ですらあり得ないよw
そういう基準だったなら業務機に画質期待するなって結論になりかねないけど
PFUでいうならScanSnapと比べた場合の比較になるよね
S1500やIX500の画質を「それほど悪くない」と思ってる層だと業務機の恩恵は逆に感じにくいのかもしれない
自分はS1500からfi-6130に変えた時確実に世界が変わったと感じたけど >>672
自分もCCFLのスキャナ中古で手に入れて光源の劣化に苦労したよ
5650Cだけど裏と表で明るさが違うという困った個体だった。
すぐにセンサー系統にホコリが入り込んで清掃の手がかかったし。
>>674
普及機と言ったのは業務用A4普及機ね。
重量級のA3大型機に対して、コンパクトA3機というか。
ScanSnapのS1500より前の奴を使ったことがあるけど
ぐにょりのような本質的な劣化があるような普及と同じだとは思ってないよ。 >>675
自分なら無理
あわてるとミスや見落としが頻発するので
>>678
なるほど 店によっては24時間営業してる。使える機材を確認したほうがいいかも。
複合機はどこにもあるけど専用機は限られる。昼間でもコンビニよりはいいと思う。 電子書籍端末ってどれがいいの?
バックライト付いてないの多くて意外 >>680
コンビニでマルチコピー機を使うのがしんどいのは
待っている人がいてからみがあったり
立って作業するからだと気がついた 900ページの資格試験参考書を自炊したら400MBになった
こんなものなのか ScanSnaps1500かったら
容認できないレベルで
枠線のビビリがひどいんだけど、
ここで出てる機種買えば
ストレスフリーになれる?
線の歪みだけなんだよほんとに。 >>685
比較になるかわからんけど
自分がさっきやってた作業
グレスケ600dpiで約600ページスキャン
1.5GBのPNGファイル
↓
OCRソフトで高圧縮PDF(透明テキスト付き)
・ページ制限ありなのであとで結合
55MBのPDFファイル >>686
CANON系にすれば軽減されるとは思うけど
その代わり傾き補正とトリミングが下手
どこのを買っても一長一短かと 枠線ぐにょりに関してはS1500とラウンドスキャンのDR-C225W系が地雷
その2種避ければ一応平気
ただIX500はライン抜けがひどいとかfiはローラー跡が付くとか
エプソンもトリミング苦手とか
他のキヤノン機に関しても>688の言うような癖があったりと
どれも何かしら難はある >>687
画像保存してからpdf化って一般的なの? 線ぐにょり以外は気にならないんで
キャノンのスキャナーにします。
ありがとう。
ただ、あんまり数ないんで
ヤフオクで安値でとか厳しそうですね。 >>685
俺は白黒でやったら900ページでも100MB切るわ >>690
このスレにいる奴らは一旦最高品質で画像保存してから、好みに合わせて各種編集して最後にPDFにするらしい
俺もそれ試したけど結局は、仕上がり具合・ファイルサイズとのバランスで初めからPDFで保存する方に落ち着いた OCRなんかの画像以外のデータを収めたい場合以外は閲覧の都合でPDFにしてる人がいるくらいで
ZIPが多いと思う。
特にjpeg以外の画像はPDFと相性悪いしね。 PDFデフォルトのtiffは2値だけだから…(震え)
あとTIFもPDFもコンテナだから多重コンテナになるね
別に弊害はないが
まあフルカラーTIFだろうがPSDだろうがその気になればPDFに突っ込むことは可能だが
入れるメリットもない 最後にpdfで最適化してまとめる場合、編集補正を行う中間ファイルはRAWに近いtiffでやっても意味ない? jpegでの中途劣化を避けるための可逆フォーマットとしては読み書き速度がPNGより速いので意味はある 参考書をOCRかけて読み上げソフトに朗読させたいんだけど精度的に可能ですかね?
スキャナ買おうか迷ってる段階です >>701
俺の経験で言うなら
画像内に文字オンリー(例えば小説)なら8割以上の精度だけど
図・表・文字装飾が入れば入るほど精度落ちる
特に理科系の数式混じりの文章だと2割以下かな 誰かfi-7700買った人いる?あの高額商品の使い心地をお聞かせ下さい 7700じゃないが系列の前世代(6750)を使った感想は、
・原稿は下から読むので継ぎ足し装填ができる
・ストレート搬送なので縦の歪が比較的少ない
・2光源なので皺や紙地繊維飛ばしに強い
・フラットベッド部の2光源はそれほど紙折れ消しに有効じゃない
・フラットベッド部のドライバが使いにくい。ADF部と同じドライバ画面なので。
・フラットベッド部の読み取り不可領域の設定ができるので他メーカー機のようなアクリル棒貼り付けたりとか不要。
最終的にはフラットベッド部が使いにくすぎたので現役引退した。
自分なら7700じゃなくてfi7600+他社A3フラベを買うかな。 PFU Omoidoriの使用法を考えたい
レシートとか ADF部は文句ない性能だったよ。
自分はfi6800も持ってるのでもともとADFはそっちがメインだったから6750をメインで使ったりはしなかったけど。
6750は2光源のA3で読み取り不可領域調整ができるフラベとして手に入れたんだが、
EPSONやらのフラベ一般の操作とだいぶ違ってすごく使いにくかった。
プレスキャンの表示が小さすぎるので手動でスキャン箇所を指定するような使い方は想定してないっぽい。
自分はソフトカバーのスキャンにフラベを使ってるんだが、
折れ目のスキャンに関して言えば光源に並行して読んだES7000よりは折れ目は消せるが、
ES7000で光源に直角に読んだ折れ目よりは6750は消えなかった。
ただし6750は光源並行に読んでも直角に読んでも折れ目の消え方に差は感じなかった。
ドライバさえまともならES7000が引退してたくらいの差だけどね。 ADF+フラベの製品はスキャナ2台分のお値段乗るからねえ
ドキュメントスキャナではシェアNo.1のPFUだがフラベ性能に関しての情報はとんと見ないし
セットで買うならキヤノンの A3DR機+FlatbedScannerUnit201のほうがいいのかも
まあどうしてもA3フラベが欲しいのでなければセットにする意味もないかな
手間さえ惜しまなければA4フラベで分割撮り後合成で大きいものもスキャンできるし
A4なら画質に定評のあるGT-X8300か9000Fが3万以下で買える 解体→スキャン→傾き補正&トリミング→色補正&仕上げで1冊10時間
外注したくなってきたwどうにかならんかな
エロ漫画です 値段がバカ高い事を考えても優秀には見えるんだよなぁfi-7700 痒い所に届くだけじゃなくて不得意な事が無い特徴性 最大の問題は値段が高いことかぁ そう思うなら買えば良いんじゃない?でもADF部は7600と同じだよ?
つまりADF部に65万、フラベに25万
ちなみにダンパーはいってるけどADFが乗ったフラベの原稿カバーはそれなりに重いよ。
実質的に製品更新がされていない5950や6800と比べるとA3最新型最上位ではあるんだけどね。 6750Sとかオクで激安で買えるから、フラベ部分の使い心地を確認してみても良いかもしれない。
ただしADFは片面なのであくまでもフラベ部分の確認用だけど。 Acrobatの傾き補正で画像がボケまくるんだが仕方ないのかなぁ
けど写真編集ソフトで写真を傾き補正とかしてもボケたりしてるようには見えないんだよな acrobat standatdで傾き補正かけると強制的に解像度落とされるんじゃなかったっけ?
ググったらそれっぽい記事出てきた
自炊PDFの解像度最適化とOCRが両立しない(→解決)
https://blogs.yahoo.co.jp/alpha3166/8719658.html いろんな意味でAcrobatは文書ツールだと思うわ。
文字として理解できる体を保てるのなら画像データとしてのデータ量維持には拘らないというか。
文字自体の見た目を気にするのであれば画像用のツールを使うか、
Acrobatでは使用者が意図的にデータ削減を抑止する必要があると思うよ。 PDF以外で透明テキスト被せられる汎用コンテナがあればいいんだがな
現状存在しないのでOCR必要ならいろいろ残念だがPDFしかないねってなってしまう PDF自体は別に悪くないと思うんだけど、
Acrobatがね。 >>719
Acrobatが悪いんじゃ無くて、文字列を斜めにスキャンするやつが悪いのでは? DR-C240に付属しているeCopy PDF Pro Officeでpdfの圧縮してるんだけどAcrobatの圧縮の方が良いの? 手をかけた自炊よりは大幅に下
手抜きの家庭用ADF機での自炊よりは上
後は業者の使用機材と依頼価格、付加オプション次第。
あの面倒なスキャン作業を@100や200で請けて経費賄った上で利益まで出そうっていうんだ。
一括の自動処理でこなせる作業以外は望むべくもない。
画質を望むなら有りえない選択だよ。
もっとも当人の「高画質」の基準次第だけどね。 業者って過去に処理したスキャンデータを再利用するんじゃないのか? 再利用してる業者が摘発されたから
今は再利用してるところは無いんじゃないか?
海賊版行為の名目で刑事事件になってたけど、
再利用してる件も上げられてたと思う。 >>666
Kincosだと細かい設定が出来ない
トーンのところがまだらになったのはどの設定いじれば良いんだろう…・ トーンがモアレたのならモアレ軽減を有効にするか
スキャン解像度を上げる モアレたのでは無くて、一様の所はぼけてて、描線のそばはくっきりとなる謎現象。そもそも、いろいろといじれなかった三田店
こんな感じで部分的にもわっとする
https://i.imgur.com/5x3NGlv.jpg モアレ軽減の処理によりデータ量が増え、その増えたデータ量でjpegノイズが出る
ってところか?
自前スキャナじゃないってことで検証は難しそうだけど。
ブロックノイズが出てる時点でとりあえず圧縮率加減してみるべきだったかもね。
スキャナの機種は何だったんだろうか 三田店でA3が出来るのはコピー機なので機種まではちょっと・・・ 複合機のデフォルト(オフィス文書用線画くっきり黒強調白飛ばしきつめモアレ低減ありjpg高圧縮)
だとそういう残念な結果になりやすい
そして大抵の複合機は設定解除して画質優先にする方法が非常に分かりにくい
複数の人が入れ替わりで使う前提の複合機は
30秒〜2分放置でデフォルトに戻るリセット機能が更に邪魔をするという負のスパイラル コピー(複合機)でもメーカー名や型番は見えるとこに書いてあるかと
メーカーわかるだけでも割と傾向は見えてくる 次も利用するのならその時の為に設定の方法は調べといた方が良いだろうね。
キンコーズのWebページに写っている画像だとコニカミノルタの複合機のようだけど。
店舗チェーンの規模からいってもメーカーが揃っている可能性は有るけど、
導入時期でちがいがある可能性もあるし…
https://www.konicaminolta.jp/business/products/copiers/index.html
設定ロック掛かっていないといいけど。 >>732
kinkosは
Konica Minolta C754
とか、コニカミノルタ系の複合機を使ってます。
品質とかが気になるのなら店員さんに相談したら、一緒に解決策を考えてくれるよ。 >>666
スキャンならミニストップも良いかも。コンビニとしては珍しくカラーでも600dpiまで設定できる。スキャンの価格はA3カラーでもA4モノクロでも1枚30円。
ソースが写真・文字混在か、写真かで設定をかえられる。
ただPDFは遅いのでjpgで出力して自分でまとめる方が楽。 地域によって違うかもしれないが、
○ファミマ、ローソン、サークルKサンクス
シャープ複合機 最大400dpi
白黒コピー
B5/A4/B4/A3 10円、
カラーコピー
B5/A4/B4 50円、
A3 80円
スキャン 30円
○セブンイレブン
富士ゼロックス 200、300、400、600dpi(600dpiは白黒のみ)
白黒コピー
B5/A4/B4/A3 10円
カラーコピー
B5/A4/B4 50円、
A3 80円
スキャン 30円
○ミニストップ
RICOH MP C3004MC 600dpi
白黒コピー
B5/A4/B4 5円、
A3 10円、
カラーコピー
B5/A4/B4 30円、
A3 60円
スキャン 30円
○kinko's
KONICA MINOLTA C754e 白黒カラーとも600dpiまで
白黒コピー
B5/A4/B4/A3 9円
カラーコピー
B5/A4/B4 45円、
A3 90円
スキャン コピーと同じ料金
会員価格あり 過去の利用実績に応じて白黒1枚6円まで値引き。学割あり。 コンビニの機械はもうADFついてないだろうし、
A3フラベ替わりだな。 複合機のスキャナは文書向けに高圧縮スキャン機能が付いたりする。
スキャン画像を解析して、文字、画像、図形などを識別して置き換えることでファイルサイズを
大きく減らせるが、肝心の画質を損なうことになる。このモードは自炊には向かない。 コンビニのマルチコピー機の使用者アンケートで不満点の上位に原稿フタが重いってのが入ってたらしく、
公的文書のプリントサービス対応機にリプレースする際に各社一斉にADF無しが標準になったらしい。 有料のOCRソフトは、e typistが一番ですか?
雑誌をスキャン予定です。
600dpiにする必要ありますか?
300で十分でしょうか? OCRなんて辞書次第なんだから読ませたい文章によって違うだろ。
最適なスキャン条件はOCRのチューニング次第だから大抵はOCRソフトに推奨が謳われてる。
OCRは体験版があることが多いし試してみれば良いんじゃないか? >>747
使ってる
300〜400dpiで十分
どちらかと言うと解像度よりピントの方が重要な気がする
縦書きに強く、ルビまでOCRするからとこだわって決めたが実際はあまり必要じゃなかった
複雑なレイアウトならパナの方がよい気がする
ええタイピストではときどき図とされてしまう
二強ソフトのどちらでもいいと思う
たとえ認識率99%でも二行に一文字は間違うってことになるので、
あまり期待しない方がいい
実用上は問題ないけど気分的には結構雑だなと感じてしまう
割り切って使わないといけないと思う
縦書きには一文字ごとに空白と改行記号が入るので
むしろPDFビューアーで閲覧する際に問題が多く出る
テキスト選択がずれたり、選択範囲をコピーして検索とかよくするが
改行やスペースをないものとしてうまく処理してくれるものを探す必要があり。 PDFリーダーについておまけ
消去法でPDFリーダーでは自分の知っているのでは
Foxit Readerしか使えるのがなかった
検索結果の一覧の文字数が少ないやら設定できないとか
コンテキストメニューにGoogle検索がなかったり
いろいろ使い勝手が好きじゃないが
他のソフトでは縦書き文字では一文字しかコピーされないやら
空白が混じりいろいろ不便など
自分のベストを探してください
いいのが見つかったら教えてくださいと思う >>747
Google Cloud Vision APIが最強じゃないかな? Google Cloud Vision APIでOCRで透明テキストのPDFまでは出来るけど、そこから図とかイメージを抽出して、epub形式に持っていく簡単な方法は無いかな。
ABBYY FineReaderで手動で抽出してってのは出来そうなんだけど、果てしなく手間が掛かる。 >>748
雑誌の予定です
>>749
おお使ってらっしゃいますか!
某レビューでは、雑誌などは
パナの方がレイアウト読み込みスムーズとありましたが、
やはりそうなのでしょうか。
参考になります!
>>751
データとられちゃいそうで、、、 >>752
>Google Cloud Vision APIでOCRで透明テキストのPDFまでは出来る
良ければやり方教えてもらえませんでしょうか
OCR目当てでGoogleCloudVisionAPI登録したんだけどよくわからず
現状Keepass GoogleSyncPluginにしか使ってなくてもったいない
個人的にgoogle keepのOCR精度でPDF作れたらもう何も言うことないって思う
あれほんとまじすごい >>755
ありがとう
やっぱそっち方面の知識必要になりますか
教えていただいたURLみて頑張ってみます 炊飯器
http://www18.atpages.jp/suihanki/
半自動傾き補正&トリミング&画像補正ツール。
wikiに載ってるこのツールがリンク切れで見れない
他で落とせる場所ないですか? 読取革命買いました。
雑誌一冊、300dpiで25mbくらい。
600dpiだと、250mbになりました。
OCR時間も10倍かかってしまうのでしょうか。
まだ300の保存中ですが、
スキャン始めてから40分くらいかかってます。
600DPIですと、半日なのでしょうか、、、
何かいらない設定組み込んでしまっているのでしょうか? あれ?600dpiの方が、早く仕上がりそうです。
何故でしょう?
認識にかかる時間が大幅に短縮されました。 ChainLP v0.40-16
■何をするもの?
連番画像や圧縮画像を指定サイズにリサイズして、画像だけのLRF、PDF、ePub、Mobi、または連番ファイルを作成します。
また、青空文庫形式のテキストファイルをソースとして入力し、縦書きの画像またはフォント埋め込みPDFにすることもできます。
ChainLP使ったこと無いんだけど既にPDF化されたものを再圧縮したり
カラー画像をグレーに編集したりは無理? エプソンのDS570Wを使ってるんだけど、
給紙時に紙がたわむのか、表側上部に陰が出来ちゃう
同じ症状の人いないかなぁ https://i.imgur.com/W4vRTmX.jpg
この画質で471KB
どういう圧縮したらここまでの画質を保ってこんなに小さく出来るんだ?
https://i.imgur.com/ptULAQU.jpg
この画質で1325KB
鮮やかなままでカラースキャンがなされていつつ、同時に文字が黒くハッキリとスキャンされて、
それでファイルサイズがこの小ささ
どうしたらここまでのスキャン・圧縮が出来るの? 複数の画像をアクロバットとかで単にPDF化したばあい画像そのものの劣化は無いですよね?
jpegからPDFにファイル形式が変化することそのものが画質に影響するのかちょっと気になって… >>765
ない、と言うかソフトによりそうとも言い切れないと言うか
とりあえずコンテナの概念についてお勉強してきてはいかがでしょうか どうなんでしょうね
Acrobatでは"ファイルを単一のPDFに結合”って項目があって、そこでは完成時のファイルサイズを大まかな目安として大中小って指定出来る一方
ドラッグアンドドロップで複数画像から1つのPDFを作った場合はファイルサイズ的にほぼ変化が無いんですよね >>763
DS530使ってるけど自分も上部の真ん中が帯状に黒っぽくなる。
薄めの紙だとなる確率高いような。
該当箇所だけ補正するのは面倒なんで、
自分は漫画に影響でないように上部黒い帯が薄くなるよう全体を画像補正してスクリプト組んで一括処理しちゃってる。薄くなる程度だけど。 >>767
AcrobatというアプリとPDFというファイルは別のものとして考えないと答えは出ないよ。
PDFは基本的にただのコンテナ。いわばZIPとかと同じカテゴリ。
文書としての体裁を保つための規定が細かくあるが、それさえ守っていれば何をどう入れてもいい。
ビュワーアプリがそれを表示できるかはまた別だけど。
AcrobatはPDFをつくるためのアプリ。
Acrobatの方針として見えるのは最終的な体裁に合わせるためなら元データの維持は重視されていない。
だからデータを勝手にいじらないような設定をあえて指定しないと最終形態に合わせて勝手にデータをいじられてしまう。
もちろん元データをいじらずにPDFという形にまとめるだけのアプリもある。 >>768
ありがとう、やっぱり全く同じ症状だね
読み込み時の画質設定で対処してみるかぁ 今、複数の書籍を各フォルダに画像ファイルとして分けて格納してるんですけど
それぞれをPDF化するというのを全フォルダに対して一括してやりたいんですが
いい方法ありますか? よくわからんけどChainLPでなんとかならんの? Scansnapで縦線出るときって上の面のページが圧倒的に多い
これは両面スキャンするよりも片面を2回スキャンして繋げたほうがいいのかな
PDFファイルをページ互い違いに結合できると良いんだけど無理ならJPEGにしてから
リネームソフトで並び替えるか >>772
その複数のフォルダがひとつのフォルダの中に納まってるのであれば、
そのひとつのフォルダを指定すればまとめられるよー >>772
ごめん、勘違いしてたわ
776は忘れて
ChainLPのバッチ処理っていう機能で出来るから調べてみて 10マソ位の予算でドキュメントスキャナ買おうと思うんだけど、
オススメってありますか?
スキャンする書籍はプログラミング関連の本が中心で、図を含むモノクロ印刷です。
裁断機は置く場所が無いので代行サービスを使う予定です。 裁断代行使うならそのままスキャナまで貸してくれる業者を使って
とりあえずはどんなもんか体験してみればいいんじゃない?
とりあえずスキャンする本のサイズもわからないと機種を挙げることすらできんし、
本の量(在庫、増加ペース)がわからんと機種のグレードも読めない ソニーリーダーで買った本のDRM解除はどうやれば…
calibreに追加しようにもデータをPCに落とす方法わからない… このスレ的にはいかなる端末のいかなるデータでも
フラットベッドでスキャンすれば解決する 電子書籍アプリ立ち上げた状態の端末をフラベでスキャンするのか
キャプより斬新な方法やね
キーボード取れないノートPCだと厳しそうだにゃー コピー機でお札をコピーするとすんなり撮れない処理が入っているような
アナログ撮影の保護を解除するような話題はまたスレ違いかもしれん。
コピーするとコピーってスカシが出る紙とかあるよね たぶん光を当てたときに反射率の違いで文字が浮き上がるようになってると思われ
金属光沢と半透明のページは物理プロテクトだよな… 表示デバイスの高解像度が進むと思って、出来る限り高解像度で保存してたが、結局10インチくらいの
タブレットで読むなら、液晶が1920x1200でも3840x2400でも300dpiでスキャンしてあれば見え方に
大した差はないなって実感した 10インチの高解像度だと普通に見るなら網膜の識別能力超えるだろうね
VRゴーグルみたいに眼前に画面出すと4Kでもまだ足りないとかなるらしいが >>778
中古で1万で購入。
縦線が入りだしてどうにもならなくなったら買い替え。
だいたい毎年買い替えることになるから
予算10万で10年使える ChainLP使い始めましたが今一わかりにくいです
「漫画A」フォルダにjpeg画像が数百枚
「漫画B」フォルダにjpeg画像が数百枚
…
となってる時に一々
「漫画A」フォルダについてjpeg画像を無劣化でそのままPDF化
「漫画B」フォルダについてjpeg画像を無劣化でそのままPDF化
…
とするのは面倒なので一括で「漫画A」をPDF化、「漫画B」をPDF化としたいです 設定項目が多くてさっき試しにテストしてみたんですがファイルサイズが小さくなってて無劣化になっていない…
そもそも一括処理以前の問題として、単体で処理するのも方法が分からない状況 もしかしてChainLPって詳細設定>画像>本文>クオリティ で値100にしてても処理の過程で再エンコード・圧縮してる? ChainLPは画像の簡易加工やリサイズをする前提のソフトなので素のjpgをそのまま再格納って設定はなかったはず
複数書籍の一括処理はBatchLPでできる
漫画だったらPDFにしないでjpgzip(cbz)にまとめるほうが扱いも手軽だよ ではJpeg画像を無劣化でそのままPDF化、しかも複数フォルダを一括で出来るソフトってありますか? PDFのツールなんて探すのが面倒なくらいたくさんあるんだし
適当なのはワードで検索して出てきたツールをとにかく試してみたらどうかね?
PDF絡みで無劣化が条件に入ると本当に無劣化かどうかで揉めやすく
最終的に使う本人が判断する事になるんだよね。
というかこういう一括処理はバッチファイルとかスクリプトで何とかする方が早いんじゃないかね。 >>785
普通紙でやる技術もある。目に見えない小さなドットを埋め込んでウォーターマーク(すかし)を入れる。
それをデジタル機でコピーするとモアレのように浮き上がる。
ちなみにカラーコピーではどの機械で出力したかまで分かるので悪用しないように。 scan snap ix500で勉強ノート(ルーズリーフ)を300枚ほどスキャンしようと思うんだけどレンズどれぐらい汚れる?
スキャンし終わったら布で拭こうとは思ってるんだけど、その後に通常書籍をスキャンするのに支障でるかな? まずはそのノートには何で文字を書いたのか次第では?
仮に鉛筆のようなもので書いていたとしても
スキャナのガラス面はそれなりにきれいにできるが、
樹脂製の搬送路やローラーに付いた黒鉛成分汚れは落としにくいとおもう。
なので後からスキャンした本を汚すかもしれない。
http://www.pfu.fujitsu.com/imaging/downloads/manual/cloud_win/ix500/jp/troublecloudpc/topic/document_dirty.html
これによると鉛筆書きの場合はやっぱりそれなりに影響あるようだね。 シャーペンでノート取ってたけど濃いめの芯使ってるから鉛筆とほぼ同じ
搬送路やローラーについた黒鉛が原稿に移るとは考えてなかった PFUのドキュメントスキャナのローラーは汚れやすいよ
普通の印刷物のインクでもローラーに付くしローラー経由で原稿も汚れる
エタノールか純正の掃除液は必須 安紙漫画雑誌であんなことになるのに
鉛筆だなんてとてもじゃないが恐ろしくて 非破壊しようとハンディスキャナ買おうかと思いますがおすすめってあります?
amazonのAibecyというのがスキャン端が短いので買おうかと思ってるけど
レビューが一個もないので不安 消毒用エタノールは廉価だけど使うなよー
酒税対策で塩がいっぱい入ってるから
ガラス内に白い粉が吹く 一時期使ってたが別に粉なんてふかなかったけどな。
マツキヨで買ったヤツだけど。
酒税対策もイソプロパノール配合でクリアだし。
あとは苦味成分入りのもあるね。
塩の入った消毒用アルコールって、機械の金属部品にも悪影響あるだろうし
出来れば避けたいから具体的に製品名とか教えてくれると助かる そもそも酒税対策で混ぜ物って食品ではないことにするって方向が多いのに、
食品でもある塩を混ぜて酒税対象外になるのか?
塩化ベンザルコニウム配合のものもあるけど、これのことかな?
こいつらは消毒薬として売られてる物ばかり引っかかるけど、
消毒用エタノール銘で売られてるものの中にもあるんかな? やっぱ200万近くするスキャナを使ってる代行業者の品質にはかなわないや スキャナの品質よりもその場で状態を確認して適宜補正できる方が重要 >>808
それってどこ情報?
エタノール 塩 でググってもエタノール沈殿しか出てこないし
一般に「消毒用エタノール」と呼ばれるものは酒税対策されてないはずだけど
http://general.kenei-pharm.com/learn/influenza/2918/
http://general.kenei-pharm.com/faq/ethanol/
無水エタノール
エタノール濃度99.5v/v%以上、酒税対策されてない、高い
消毒用エタノール
エタノール濃度76.9〜81.4v/v% 残りの成分は水、酒税対策されてない
消毒用エタノールIP
エタノール濃度76.9〜81.4v/v% 飲用不可能にするためにイソプロパノールを添加(酒税対策) 残りの成分は水、安い 消毒液を消毒用アルコールと勘違いしてるだけじゃね?
店舗の入り口とかにおいてある手の除菌用アルコールには塩化物入り物があるし。 >>813
料理用酒には酒税法回避のために食塩が入ってるよ
もちろん清掃用や消毒用にはならない 折角だからシャーペンで書いたノートをスキャンし続けるとこんな汚れの影響が出てくるってサンプルアップしといた
https://i.imgur.com/FY6Bgiu.jpg
iX500で白黒で1200dpiかつ濃さ5でスキャン
シャーペンで書いたノートを300枚ほどスキャンした辺りでこのような汚れの影響が出てきた
まるでマジックペンのにじみみたいになってる
ミクロに散らばった黒鉛が影響してるのだろうか? >>820
なら塩の入った「消毒用アルコール」を挙げてくれ 安いのがいいのならまあ使ってりゃいいんじゃん
自己責任で 大した価格差じゃないからわざわざ消毒用なんて買わないが、
塩が〜とか粉吹くとか根拠不明のネタには気になるからな。
無水でも酒税対策されたものもあるし。 酒税対策されていないメタノール使ってお酒つくれそうだな
やったら駄目だが >>819だけどさっきピックローラを拭いたら黒鉛びっしり取れた
でも汚れ落としたらまた普通にスキャン出来たわ フルカラーの雑誌サイズをそれなりの品質保って1ページ800kB以下に押さえる方法教えて欲しい >>826
モアレ低減させて網点潰してノイズ除去で均す
jpg設定は サンプリング比 4:4:4にする(重要)
品質の値はファイルサイズと画質見ながら適当に調整
最後にjpegtranなどで最適化する EPSONのスキャナって黒背景にできないんだな
黒背景でオーバースキャンしてエチルトランにかけたら傾きガッツリ補正できるって知ったから期待したのに >>830
そうなのか
そうなったらやっぱり業務用のスキャナにする意味あるんだな 背景黒だとセンサーのキャリブレーションが出来ないからね。
一時的にでも白にしてキャリブレーションする機構が必要になる。
つまり余計なコストがかかる >>828
サンプリング比4:4:4にしたら元サイズの3倍になったんだが なんか設定おかしくなったせいかRalpha使うとファイルサイズがもとより大きくなるようになってしまったぞ
死ねよ Ralphaで変換したら、縦×横って意味での大きさが10倍になってしまったんだがなんで?
画面上部の「大きさ 比率(%)」って所は「100%」のままいじってないんだが
バグ? jpg to jpgで補正もリサイズもせず4:4:4で再サンプリングだけしたの?
それ全然意味ないよ
低画質の狭い箱に詰めるために捨てられたデータは高画質の大きい箱に入れ直してももう取り戻せない
ScanSnapなんかだとスキャンの段階で4:2:0にされちゃうしな
完成版で画質とファイルサイズ減の両方を取りたいならスキャンの段階ではケチっちゃダメ
600dpiできれば可逆で保存して網点潰してきちんと均してからリサイズする
補正リサイズ後のデータなら元がjpgでも4:4:4で再サンプリングする意味はたぶんある
Ralphaの設定戻したいならRalpha.ini捨てるかリネームして初期化すればええ
デフォルトだと品質90サンプリング4:2:2だから
どっちにしろIX500とかでスキャンしたjpgよりは大きくなるはずだがな 変換後のファイルが72dpiにいつの間にか落ちてたんだが?
元が600dpiだったのにどこで変わるんだ? >>838
画像の細かい技術までの所の話は正直殆ど分からない
スキャナでは最高画質設定でスキャンした どうしても市販の電子書籍や自炊代行業者みたいに、
見開きの上下のズレをなくせないや
結構奥の深い世界なんだなぁ 「俺はカラーページをこんなに高画質なのにこんなに小さいファイルにしたんだぞ」って自信ある人はどんなもの持ってるかサンプル見せて欲しい 先輩方に質問なのですが、スキャンのガラス面の内部にホコリが入って、分解してきれいにした人
いますか?
DRC225wで、いくらアルコール等で拭いても、4本くらい、消えない縦線があり(カラーの場合
めだつ)、おそらく内部にホコリが入ったのではと疑っています(ぱっと見、密閉されてるのになぜ?)
それと、電子コミックで売っていればこんな面倒で、神経を使うことをしなくても良いのですが
1番書籍数が多いとネットで出ていた DMM で 成年コミック雑誌 例えば ポプリクラブ
とか検索したら ほとんど無くて で、 これから、 少しずつ過去の 2000年前後とかの成年コミック
雑誌とか 増えてくると思いますか? 増えそうなら、いま電子化しないで待つ作戦もありなのかなぁ。
それと、一番いいのが、雑誌出版社が、雑誌データー→紙雑誌、雑誌データー→電子雑誌
と、作ってくれれば良いのですけども、無理がありそうでしょうか?
長文すみません。 バラして掃除はしたことがあるが、一台はガラス割っちゃった。
センサーは基本的に密封はされてないよ。
ガラスが外せる機種以外はエアブロワーとか使うと中にホコリが入って終わる。
そういう機種は取説にエアブロワー使うなって書いてあるはず。
成年コミックは現役作家の過去作品なら電子復刊の可能性あるだろうが、
引退済みの作家だとよっぽどの名作を持ってる作家以外は権利者(つまりは作家)と連絡取れなくて
復刊は無いと思う。
Jコミとかの方が可能性あると思う。
なので自分は引退済み作家の本をスキャンすることが多いかな。
80年代とか90年代とか、消しや題材の変化が結構興味深い。
成年マンガって記載雑誌や出版社に関係ない出版社から単行本が出るケースが見られるように、
作家が全て権利持ってることが多いように思う。
なので過去雑誌の復刊はほぼ無いと自分は見てるよ。
例示のポプリクラブなんて結構複雑な経緯あるし難しそうだ。 >>846
レス有難うございます。
僕も前モデルの125で、ダメ元で外したりして、パキッとガラスを割ってしまってます(貼り付けが
強力すぎる)。そうか、密閉じゃないんですね、ブロワはやってないんだけどなぁ。
成年コミックって複雑なんですね、単行本は、ぶっちゃけ、古本屋にだいたいあると思うからすんなり
捨てようと思えばできるのですが、ポプリ、パピポ、桃姫、アンリアル等々、雑誌は店にあまりないから
捨てれない、でかい、大量で、しかも、過去雑誌の復刊はほぼ無い、かぁ。
カラーでの縦線が目立つだけで、モノクロはそうでもないから、意を決して、
表紙、数枚のカラーを犠牲にして電子化するかなぁ。 これ縦線だらけだけど、ADFってのはこのぐらい割り切って使うもんなんだと思う
https://books.google.co.jp/books?id=IvbNkQ8N4dcC&printsec=frontcover&hl=ja#v=onepage&q&f=false
ガラスは二回割ったなあ
CANONの安いやつは
ガラス面はいじらず、爪を持ち上げれば裏側から小箱の中は掃除できるとあとでわかったが
どちらにせよケーブルが身近すぎて簡単にはメンテ不可
やるときは処分前でケーブル差し込めたらラッキーってな感じでやるね自分は オフィス用の複合機のADFでスキャンする程度の画質が目標だろうとは思うけど、
X10Cのようにクリーニング機能付ならこれほど酷いことにはならんと思うけどな。
オフィス機は補正が強くかかるってのはあるが。
でも自炊ユーザーが神経質にガラス清掃しまくるような画質は望み過ぎだろうね。
画質自体もちょっと良さ気なフラベに簡単に負ける程度だし。 >>848
ひどすぎですね、逆に、これに比べれば自分のは1割もないから、解決にはなってないけども、
うん、ありがとうございます。
ボックスのフタ部分(ガラス表面の所)を爪を解除して取って清掃しても内側ガラスの端っこに、
ほんんっの少し何かが残って(つまようじ、綿棒、等、色々やりました。)結局、ガラスを取り外さないと
、まっさら状態じゃなくて、はずす時、パキッ、終了、でした。
今の225も前機の1割もスキャンしてない(量的にはほぼ新品)のに内側にホコリが入って
ほぼ使えない(画質の意味で)状態になったしまったけども、電子化はなさそうだし、いつまでも
部屋を占領するわけにも行かないから、やるしかないなぁ。
それにしても、メーカーの修理(清掃は)はどうやってるのかなぁ、全バラ(スキャン周り)、
ガラス交換(割らないでやってるのかなぁ)、気になりますね。 >>850
DR-C125でガラスの内側にゴミがついた時は京セラの電動砥石の振動で落とせたけど
やってみるのなら超音波電動歯ブラシかスマホの角を当ててバイブレーション?
CISセンサーは衝撃に弱いので壊れるリスクもあるけどね(パナ機の分解掃除で壊したw)
まーガラス割れても代わりにアクリル板貼ればまた使えるよ DR6030も5010Cみたいにガラス外せるんだっけ? 機構ほとんど同じに見えるし外せるんじゃね
気になるなら取説ダウンロードして確認してみれば 5010Cも取説には外し方書いてなかったような記憶だったので。
ちょっと見てみるわ >>851
CISセンサーって棒ガラスみたいなやつですよね? 125の時、7回くらい、縦線が入るたびに、分解、清掃
やってて、いつの間にか割れてましたが、どういう仕組でスキャンしてるんだろう、結局ボックスに入ってるのって
あの棒ガラスみたいなのだけですよね、その上に板ガラスがあって、って感じだし。
板ガラスの替えのアクリル板も、ホムセンでこのサイズでカットして下さい、ができるかな?
どちらにせよ、センサーを割るリスクがあるから、使い潰したやつじゃないと怖くてできないですね。 CIS:コンタクトイメージセンサー
センサー自体はCMOSイメージセンサーだよ。
ただし、レンズと一体化されてて、ほぼ密着の位置にフォーカスが合うようになってる。
棒状のもの一列に並んだCMOSセンサーに合わせて作られたレンズね。
アクリルのカットはPカッターを使えば個人でも簡単に切れる。
でも個人で切ると端面をきれいにするのが難しいのでオーダーカットしてくれる通販も良いと思うよ。
ホームセンターのカットサービスではアクリルに対応してくれる率は低い印象。
アクリルだと傷がついてだんだん曇ってくるので、ダメになったら交換する方向だと思う。
ハードコートアクリルもあるけどハードコートが接着に向かないので
ハメこんで装着できるタイプのスキャナじゃ無ければ通常アクリルが良いと思う。
オーダーカットならガラスでもあるけど、普通のガラスは色が入ってるので
オリジナルのガラスの色をみて考える。
オリジナルのガラスが色の無いガラスならそういうガラスをオーダーしてくれるところを選ぼう >>856
丁寧に説明、大変ありがとうございます。いろんなレスをもらい、分解清掃する勇気が出てきました
。そもそも、センサーは以前のやつでそんなにすぐに割れた訳じゃないので、今、分解清掃
やってみます。本当にありがとう。 分解清掃、成功しました!! 縦線ノイズ5本あったのが全くなくなりました。
それはそうと、皆さん、清掃する時、アルコール、キムワイプが普通でしょうか?
僕は、ラッカーシンナー、アルコール、キムワイプですが、こんなの良いよ、みたいのがあったら
教えて下さい。 キムワイプの話はしつこいアンチが居るので面倒くさいことになりやすい。
メガネクリーナーを勧める人も居る。
自分の場合は薬剤で清掃する時はキムワイプで使い捨て、
カラ拭きのときはカメラ用で静電気対策されたクリーニングクロスを使う。
あとは除電ハケと細いノズルを付けた掃除機。
薬剤は無水エタノールとレインXを使い分け。
一冊の始めにレインX塗り、途中で清掃したくなったらカラ拭き
レインXを塗っても縦線消えなくなったらアルコールでレインX剥がし。
こんな感じ。 >>859
細いノズルを付けた掃除機、静電気対策されたクリーニングクロス、すごい良さそうです。
参考にさせていただきます。
それと、NGワード? 出してすみませんでした、以後気をつけます。 >>858
ラーカーシンナーは強すぎで塗装がハゲるので×
アセトンのように樹脂パーツが溶けたり変形はしないがただちに使用を中止した方がいい
シリコンオフの類もきれいになるが油分が抜けすぎて×
結局弱いエタノールが○
ヘキサンはまだ試してない スキャンして付く汚れなんてせいぜいがホットメルト系の糊汚れ。
しかもこびり付いただけのもの。
従って溶剤は必要ない。
アルコールを使うのは速乾性に期待しただけで、溶剤としての性能には期待していない。
自分はこんな感じだな。
溶剤を使って除去しないといけない汚れが搬送路に付くことって有る? なぜに純正汁または同等の成分の液体を使おうとしないのか それぞれの信念があるんだろう
自分もメチル(ネンアルで代用可)原理主義だし いつからキヤノンの純正クリーニングキットが存在すると錯覚していた?
C225Wのマニュアルのはお手入れは ブロアー&水を含ませて固くしぼった布で拭けと書いてあるのな
ブロアーOKとはさすがキヤノン強気すぎるわ >>861
わかりました。
>>862
プラモ用のシンナーが残っていたのがきっかけで、ローラーに付いたインク、ガラスの汚れも取れるし
楽じゃないかな? が、きっかけです。アルコールも速乾性だけの目的なんですね、なるほど。
>>865
ブロアーはありえないですね、使わなくても、少しスキャン、パソコンほうき清掃等、だけで内側
にホコリが入り、昨日まで(約3年間)使用できなくなりましたから。キャノンは自社製品テストしてるのかな?
それと、話題が変わりますが、スキャンして、どうしても斜めにしかスキャンできない場合、対処法はありますか?
2つとも縦にスキャン、両ガイドもキッチリ、見た目には斜めにスキャンしてない(動く余地が無いのに)
傾き補正なし → https://i.imgur.com/T1fdKnv.jpg http://imgur.com/T1fdKnv
補正あり → https://i.imgur.com/9IbPVc6.jpg http://imgur.com/9IbPVc6
2,3回しかUPしたこと無いので、写っているかなぁ? 左右は同じ画像です。
帯は大したものじゃないので 補正なしを今回は使いますが(それでも10分近く格闘)、
前に、きっちりスキャンしても、どうしても斜めにしかスキャンされないのがあって、40分近く、
たった1枚のフルカラーと格闘したことがあります、最後の最後にきっちりスキャンされました。
それと、補正ありで何回やっても斜めって、補正を切ったらカッチリスキャンされたりと、
補正ってなんだろう、て、ことがわりとありますね。多少の斜めはもうなれましたが、
今回の画像くらい余白とかがあると、まだ、許せないですね。 今画像をチェックしたら、左の写真は背景の色も白で、写真と、背景が同一化して分かりづらいので
右側の画像を見て下さい。すみません。 複数のメーカーのスキャナ使ってるし、
そうなると特定メーカー用資材はかえって使いにくいんだよね。
今のところエタノールで困ってないし。 斜行補正と用紙サイズ検知をバッチリしてくれる機種ってある?
なんで代行業者の仕上げてくるデータは見開きがズレないんやろ F1割高だしPFUのスキャナだけ使ってる人以外は純正の安心感を得られるわけでもないからなあ 業者は横装填してるからじゃね?
見開きが合わないのは縦方向の搬送ムラか来る伸びのズレだろうし。 ADFで光速でスキャンするタイプは用紙送り方向が間延びしたり縮んだりしてスキャンされる?
正方形が微妙に長方形にならない? される
fiはカラー雑誌の見開き合わせなんかも一応できたけど
コミックの見開き合わせはフラベ使った方がいい >>866
自分はコミックの場合は傾き補正OFFだな。
斜めの枠線を誤認識したりするからね。
自分は読んでて傾いていてもあまり気にならないし。
フチが黒ベタなページでも認識異常起こす事があるし。
文字本の場合はページめくった時にガクっと傾くのが気になるのでマイナス設定のサイズ認識とセットで傾き補正も入れてる。
文字のページとカラーやイラストのページはスキャン設定変えて別スキャンなので
誤認識しやすいページはどうせ棄てるスキャンだし。
カラーやイラストのページはコミックと同じような設定でスキャンしてる。
基本的にはスキャナが何を縦横の基準として認識しそうか考えて、紛らわしいものがあるページや本は傾き補正を切る。 >>868
富士通のクリーナーF1、良さそうですね、ただ、価格が・・。
>>869
やっぱり1台ですべてOKってわけではないんですね。
>>873、874
間延び、縮みは初耳です、長方形しかスキャンしたこと無いから気づきませんでした。
>>875
結構複雑なんですね、知りませんでした。ありがとうございます。 >>876
モモタロウでイソプロビルアルコールを注文しよう。
クリーナーとして最適 イソプロビルアルコールってオウム真理教事件で覚えた 【中国委託のSAY企画】「まさかスキャナーで読み取ってるとは・・・」年金機構甘いチェック 95万人以上のデータ入力ミス★2
http://asahi.5ch.net/test/read.cgi/newsplus/1521957998/
OCRってそんなもんだよね >>880
ここの住民なら名前部分のみ4800dpiでスキャンして傾き補正、白飛ばし、ダイナミックレンジの端強調、縮小(ry
とかのフォトショアクション作ってデータミス100件以下にできそう OCRなんて解像度上げれば良いってモンじゃないと思うが >>752,754-755
遅レスですがWSLでUbuntu入れて環境構築できました、CygwinとかVirtualBoxとか要らんかったんや
https://remoteroom.jp/diary/2017-10-12/
https://linuxfan.info/wsl-setup-guide
まだサンプル動かして遊んでるだけですが WSLならコマンドラインで使えるので
GUI被せるかバッチ組めばwinのお作法でD&D実行できそう
自炊PDF → 検索可能PDF はGhostscriptでの圧縮やめて
pdftoppm の代わりに pdfimages使えば画像を変質させずに透明テキストだけ被せられる気がする
https://marvelph.wordpress.com/2010/06/10/scansnap%E3%81%A7%E8%AA%AD%E3%81%BF%E5%8F%96%E3%81%A3%E3%81%9Fpdf%E3%82%92%E7%84%A1%E5%8A%A3%E5%8C%96%E3%81%A7%E7%94%BB%E5%83%8F%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%81%AB%E5%A4%89%E6%8F%9B%E3%81%99/
ただ hocr-tools が Ubuntu + python2.7 以外の環境で上手く動作させられずにモヤっとする
VirtualBox + Xubuntu + python2 → 成功
Ubuntu on WSL + python2 → 成功
Cgywin / MSYS2 + python2 → pipでのインストールに失敗する
python2 for windows → 作成されたPDFの透明テキスト内の日本語が文字化けする
Ubuntu + python3 → 上と同様 何言ってるか分かんねぇ
自炊にそこまで情熱捧げてんのか 趣味の一環と考えれば「追求型」の人がいてもおかしくないでしょ。
自分も今までつぎ込んだ機材や手間を考えたら、
自炊に興味ない人から見たら異常だろうと思われるだろうし。 すまん
ここは元々取りっぱなし派補正派zip派PDF派入り乱れてるから
わかってる人興味のある人に伝わればいいかなと
既存のOCR製品やスキャナ付属のソフトでのPDF作成に不満しかなかった身からしたら
googleのOCR性能で補正済み画像からPDF作れるなら「そこまで」の価値はあった
副次的効果として今までずっと隣の芝生だった分からない世界が
Windows Subsystem for Linuxであっさり自分ちの庭と繋がったというのも大きい 大学生です
自炊してocr処理したpdfの教科書を
onenoteに入れようと思っています
onenoteなら本文を横断検索できそうだからです
どう思いますか 自炊書籍を見たり読んだりするのに最適なソフトやアプリ、ハードってどんな組み合わせだろ? そんなの何を読むかによって変わるだろ
12インチのiPadが最適という人もいればkobominiを愛用する人もいる >>891
それぞれ、環境別のベストバイみたいな物があれば・・・
PCで使ってるけどビューアーって言うほど洗練された物がない気がする >>892
デスクトップならマンガミーヤ
タブレットやタッチ画面で操作するならストアのPicoViewerを推しておく >>889
ファイルとして添付するとOneNoteから直接PDFの中身の検索はできない
印刷イメージとして挿入するとPDF内のOCR情報は失われる
後者についてはOneNote内臓のOCR機能で新たに検索用テキストが作られるけど
>自 炊 し て ocr 処 理 し た pdf の 教 科 書 を
みたいな感じで日本語は1文字ごとにスペースが入るので検索ではほぼ使いものにならない
横断検索だと
・EverNoteに張り付けておく
・Googleドライブに放り込んどいて必要なときにブラウザから検索かける
・ローカルにPDFのまま保管しておいてDocFetcherのようなPDF対応のGrepソフト使う
あたりが実用的じゃないかな 同じく。WindowsタブレットならPicoviewer一択だな。
アンドロイドのPerfectviewerより機能的に上の部分が多いし。
自炊してる人なら買って損なしだと思う。 >>884
Pythonスクリプトが見にくかったので、シェルとPHPにしてみた。
シェルでcurlコマンドでGCVにOCR処理を投げて、自作のPHPでjsonをhocrファイルに変換、最後にgostscriotでPDFに変換って感じ。
WSLで使うのは考えたことなかった。
Unbuntsは苦手なのでFedoraが出たら試してみる。 すごいなあリナックスで自炊とかマゾとしか思えん
なぜそんな険しい道をゆくのか
すごいなあすごいなあ 趣味嗜好なんて他人に理解できなくて当然だろ
自分も酒やたばこをうまいと思ってる奴らの嗜好が理解できん >>899
険しくてもやるだけの価値があるから?OCRができたら便利じゃん。それも出来るだけ精度が高ければ。 >>898
よろしければ差支えない範囲でコード見せていただけないでしょうか、特に
>最後にgostscriotでPDFに変換
のあたり
自分もhocrファイル作成までは何とかわかるんですが
hocr→pdf の部分がhocr-toolsでpython依存になってしまうんですよね
ここのやり方理解できてうまいことwin用バイナリ組み合わせられれば
linuxに下りなくてもできそうな気がしてるんですが >>902
ごめん、そこ説明抜けてた、hocr-pdfでhocrからpdfに変換してます。 >>896
PDFviewer by PSPDFkit
Apple Pencilで書き込みながら使える >>903
そうでしたか了解です、無理言ってすみませんでした。
ググってて hocr2pdf というのも出てきたけど透明テキストじゃなくてテキストに置き換えるっぽい?
とりあえずhocr-pdfの代替には無理みたい
調べる過程でtesseract-ocr ってフリーのOCRツールを知ったんですが
これ、素のtesseractのWindows用バイナリ(ver4α)だと残念な感じだったのに
フロントエンド被せてある VietOCR がGoogleさんもびっくりな認識率で驚いた
カスタマイズで相当辞書を鍛えてるっぽい?
https://i.imgur.com/tj1ARCW.png
tesseract.exeでは1ページずつだけどOCRからPDF出力までできるのでVietOCR同梱のほうで
tesseract.exe -l jpn hoge.jpg hoge pdf
バッチ組んであとでgsとかで纏めればローカル環境だけでそこそこ精度のPDFが作れてしまう予感 >>905
PDFviewerって高速でページめくると落ちやすくない? >>894
ありがとうございます
onenote駄目でした
DocFetcher使ってみます >906
すげえな、まじかよコレ。
当方、もうずっと以前からxubuntu16.04上でtesseract-ocr4.00alfaを使って、
スキャンした小説のテキスト化をやっているが、最近やっとそれなりの認識結果の
テキストファイルを吐き出せるようになったというのに、これはかなわない。
本来ベトナム語用OCRソフトだったVietOCRも、以前に一度使ったことがあったけど
認識結果はとくに変わらなかったから素のtesseract-ocrでずっと使ってきたけど、
ここまで向上できるものなのか? 桁違いの認識精度だな。とくにtesseract-ocr
のくせに余計な半角スペースが全然挟まってないのが素晴らしい。
ちょっとVietOCRインストールしてくるわ。 MSのブラウザでも音声読み上げが搭載されとるし
OSに内蔵されてゆくんだろうな CANNONのWIAドライバって不便でしょうがないな
Windows10 ×64で更新したせいか
BTscanのソース選択からTWAINドライバが項目から消えて、
TWAINドライバから起動する ScanGearを呼び出せないわ
ずいぶん前からほうっておいてる
ファイヤーウォールのせいだろうが、
サイトの設定項目の説明が残念ながらどこも古くてわからんちん 909
うーむ、昨夜喜び勇んでVietOCRをxubuntu16.04にインストールした>>909だが、
残念ながら思わしい結果にはならなかった。
>>906が上げてくれた画像の左半分をサンプルにして、同じようにVietOCR5.0alfa
でOCRかけてみたが、↓こんな感じに一文字ごとに半角スペース入りまくりで(後半カット)
----------------------
光 学 文 字 認 識
光 挙 文 字 部 橿 に う が く も じ に ん し き 、Oplilldaricer ricognidom は 、
ス キ ナ ー で HR り 込 ま れ る ) を コ ン ピ ュ ー タ が 鎖 集 で き る 形 弐
ー 舩 に OCR と 賊 記 さ れ る .OCR は 人 工 知 背 や マ シ ン ピ ジ ョ ン の
----------------------
----------------------
光学文字認識
峙文零鵬(こうがくちじ仁んしき 0璽囁由・ 血「加艶「 峡皿踵柑皿 は 活字の文書の幟
ス圭ヱナーで取り込まれる)をコンピユータが編集できる形式(茎臺コー建の列)に蛮換すろ
一般に 0C翼 と略記される”OC翼 (ま Jや咄の研究分野として始まっア髑研究は統けられ
----------------------
素のtesseract-OCRだと↑こんな感じで、同じOCRエンジンでもかなり異なる間違え方を
しているから、Windows版程正解率が高くなくても手駒が増えるのなら悪くなかったんだけど、
残念ながらいつも使ってる300dpiの縦書き小説スキャンtiff画像を読ませると、文字コード
間違えてんのか? ってくらい謎の文字列になってしまう。オプションで縦書き指定にしても
ダメ。残念ながら使用に耐えない。
Windows版と何が違うんだろうね。 Google Cloud VisionのOCRの精度すごいな。
本1冊分だとちょっと時間かかるけど 傾き補正や見開き上下ズレの解消を考えたら、
やっぱり黒背景で読み取りできる高級機の方がよさそうだなぁ
おすすめのスキャナある? 予算次第でしょ
ちなみにうちの中古で買った業務機さんはときどきでっかいブロックノイズが出る困ったちゃんだ 予算と中古OKかどうかでかなり分かれるんじゃないかな。 黒背景は裏写り対策であって傾きや見開き上下ズレは直接関係ないと思う
見開きに関しては高価な業務機のほうが伸び縮みしにくいというのはあるけど
傾きは印刷が紙とずれてる場合 紙端基準での傾き補正では対応できないし
あと紙端に除去しきれなかった黒縁残るし断ち切り黒原稿は自動サイズ自体失敗するから
自力で手動トリミングする覚悟じゃないと使いこなすの難しい
白背景の家庭用機より画質はきれいだけどね ただ黒背景は漫画の回想シーンのような地色が黒のページでサイズのページで誤認識を起こすのが欠点。 見開きズレ対策は横装填する為=A3対応機ってことじゃないかな
機種にもよるだろうけど傾き補正にもたぶん使われてる。
文字列の角度と紙端の角度のちょうど中間みたいな角度に補正されることがあるし、
うちのスキャナは傾き補正入れると黒背景になるわ。
だからうちでは文字主体の原稿の場合はアンダースキャンさせて紙端を傾きの基準にさせないようにしてる。
コミックなんかだとコマ枠で誤認識しちゃうのでそもそも傾き補正はOFFだし、
うちでは黒ベタは背景の黒から浮かせた黒にしてスキャンしてるわ。 見開きが多い漫画の自炊は頭が痛い
どうしようかプランを立ててから
単行本サイズだと横装填でいいけど、愛蔵版サイズだと横にスキャンできない
と言ってもむちゃくちゃ伸び縮みするかというとそうでもない
ただ上下の高さがずれて左右ページの高さを合わせるのが大変
見開きノウハウがあれば教えて欲しい なんとかなったわ
自分用にメモ
BTScanを管理者として実行
ソースにTWAINも無事表示された。
さっきまで受信の規則やらなんたらをいじって諦めていたので、
簡単すぎてちと笑った。
もう少しでVueScan買うところだった オレはA5の本を横装填しても上下ズレが生じるよ
なんかScanするときの設定が悪いのかな
ちなみにEpsonのDS570W DR-M260買うのと、
中古の業務用買うの、どっちが幸せになれるかな。
コンピュータ系技術書6割
カラーのコンピュータ系雑誌3割
漫画単行本1割
ぐらいな割合で。 見開きは素直にフラベ使った方が楽な印象
>>921
有用な情報thx
BTScan使えるのかありがたい
家族が持ってる900F借りたときにハマったのでこういうレポは助かる 横装填するのはズレ防止じゃなくて連結辺の間延び防止じゃね? >>912
>906のサンプル画像はこちらのを借りてます
https://github.com/dinosauria123/gcv2hocr/blob/master/sample/jpn/jptest2.jpg
WSLに入れて試してみたけど、よく見たら同梱はwin用exeのみっぽい?
公式ページのInstallationには Linuxでは別途 tesseract本体とベトナム言語データ入れろって書いてあるね
win用の同梱版はexeも言語データも素のものとはサイズ違い過ぎて謎
それぞれtraineddataを交換するとエラー吐いて止まる
https://i.imgur.com/2gApWiM.png
なおこのαカスタムTesse4.0は 縦書き対応してない模様
ちなみに 下のViet4.7.1 by Tesse3.0.5 (αじゃない最新版)は 公式と同一の言語データだった
https://i.imgur.com/LqXRr5s.png Gimpで画像を90度変えて画質100で出力しただけなのにファイルサイズが2倍になったんだけどなんで?
ただ単に画像を90度変えたいだけなのに 設定100で再圧縮したらそりゃ容量増えるだろ
回転だけしたいなら無劣化回転を謳うツール使え 品質100で2倍で収まるならむしろ少ないほうだろう
白黒君はいい加減 不可逆圧縮がどういうものかくらいは理解したほうがいいと思う 横スキャンと縦スキャンでOCRの精度って変わるの? それは付属ソフトでスキャンと同時にPDF化するって意味?
ならおまけソフトで精度を気にしても仕方ないよ 予算6マンぐらいで業務用スキャナ買いたいんだけど、
オススメとか鉄板ってあるの? >>926
自己レス
Viet5αのメニューから取得した言語データはここのtessdata_fastのjpn.traineddataと同じものだった(compで確認)
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
tessdata_fastのページの下のほうに書かれてるけど縦書き用は言語データが分かれてた
jpn_vertmをダウンロードしたら一応行けたけど縦はまだ未チューニングで従来と精度変わらないぽい
https://i.imgur.com/Jg5KqkK.png
コマンドラインからは jpn+jpn_vert で辞書切り替えなしで縦横両方いけた
時間むっちゃかかるけど
-- cmd_ocr.bat (tesseract-ocrフォルダに配置) ---
@echo off
set TESSDATA_PREFIX=%~dp0
"%~dp0tesseract.exe" -l jpn+jpn_vert %1 %~n1 %2
----------------------------------------- もしかして白黒でも1800~2400dpiなら写真集でもすっげー綺麗にスキャンできるの?
今iX500の白黒1200dpiでスキャンしてまぁまぁ不満無くまぁまぁ妥協出来るいい感じに取れてるんだが。
すっげー綺麗って言う表現だけだと大ざっぱすぎるけど
言ってみたら高画質フルカラーから色だけを抜いた みたいな? まずは印刷による表現の仕組みを勉強した方が良いよ
仕組みもわからずに表面だけの返答を得ても、
その手段で正解かどうかは当人の基準に掛かっているから最終的には自分で答えを出すことになる。
グレスケと2値の件で体感したでしょ。
印刷は基本的に極小の点で表現される。
印刷の仕様にって点の細かさは様々であり、
カタログや写真集などのカラーの高精細印刷では400線などの精細度がある。
線数というのは印刷の精細度の単位であり、dpiに直すとその2倍に相当すると言われる。
つまり300線なら600dpi。この精細度で印刷原稿と同等。
さらに印刷の点とスキャン画素の完全一致は不可能なので、印刷よりも細かいスキャン解像度が必要になる。
これが下回るとモアレになる。
カラーの2値化をきれいにするのはdpiの問題ではない。
高dpiが必要なのは確かだが、カラー写真印刷を微細な色インクの点で表現しているように
2値の点の集密で表現することは可能だが、
単純に高解像度でスキャンすればOKとかいう話ではなく
印刷インク色の点を、黒の点の集密にどう変換するかのアルゴリズムが影響する。
そんな処理をスキャナ内蔵のプロセッサー、しかも廉価機の予算で搭載されたプロセッサーに任せるのは
画質へのこだわりを放棄しているようなもの。
カラースキャンして演算力有り余るPCで変換するのが最も近道だと思うよ。
もしくは高性能な画像処理プロセッサー搭載をアピールしてる業務機を使うか。それで納得できるかは知らんけど。 >>936
いってることの30%ぐらい理解出来た
原理部分の事言ってるみたいだけど、そんな事言われてもなんの改善策もおもいつかんわ
結局は良いソフト・ハード買えって言ってるようなもんやん
Ralphaは使ったけどトーンカーブ一々毎回いじるの面倒だし、作業工程増えるし、ファイルサイズ増えるし、その割にそこまでよくなるわけじゃないし
そもそも俺まだ本が300冊以上残ってるから1冊1冊に時間なんてとても掛けられないし
汎用的手法で流れ作業のようにやっていきたいし だから拘りと妥協のポイントを各自で見つかるしかない
自炊とはそのポイントを見つけることが全てと言ってもいいくらいだ。
拘りたいのなら金や手間をかけろ。
掛けられないなら妥協しろ。
そういうもんだ ならできないことは諦めて我が道を貫くしかなかろ
人に助言など求めずに
そもそも人のアドバイス聞く気がないのに何故他人に助言を求めるのか
答えてる人説明するだけ無駄にされてでほんと可哀想 IDなしはNGにしとけ
詳しくはこのスレのレス100あたりから読めばわかる だ〜〜〜か〜〜〜〜ら〜〜〜
アドバイスが抽象的すぎるんだよ
自分が説明した気になって満足するだけじゃダメなんだよ
俺が欲しいのは、>>935の 中 の画像の文字と 右 の画像の写真を合わせたような仕上がり
そのための具体的アドバイスが欲しいの
>>936の原理みたいな事言って自己満足に浸られても俺の願望は叶わない 写真屋とまでいかずともRalphaやレベル補正も面倒となるとこれはこの3枚の中で妥協する以外仕方がないと思うぞ
今までは600dpiカラー補正無しスキャンを原本に技術の構築されてきたからその方向でなら改善の可能性はあるかもしれないが
グレスケかつお手軽にとなるとこの時点で終了かと
後は手間をかけるかどうかの判断だな
一応可能性としては、neatimageを使って写真部分のノイズを減らしつつシャープ効果で文字をくっきりさせることが出来るかもしれんが
neatはプロファイル設定さえできればあとはソフト任せでいけるので1手間増やすだけ
プロファイル設定を作るのが面倒だが生臭でいくならソフト自身にオートで作らせるかデフォルト使ってシャープ効果強めるだけで妥協 手間も金も頭もかけられないのなら諦めろといってるだろ。 >>943
ありゃりゃなんの参考にもならんお前のレスを自己満足に浸ってるって言われてキレちゃったかww ありゃりゃ
このすれって>>946こいつみたいな何の根拠も無い程度の低い悪口言ってる小学生居たんだ
このスレって割と会話の成り立つ奴が多いだけにお前みたいな奴の存在って意外だな 右がいいわな
ディスプレイ買い替えたらまた違うのかもしれない >>938
部屋を広くしたいのがスタート地点だから
自分の場合は仕上がりはあきらめた!
スピード第一 アマゾンで中古価格が1円の書籍を手間暇掛けて電子化してる時ってちょっと悲しくなる時あるよな そろそろ次スレだし 対白黒君用のテンプレ纏めといたほうがいいな
ワッチョイはこのままなしでいいんだっけ? アレですぐ分かるけど、擬装しほうだからワッチョイ付けてもいいかも すみません、この画像の原因が分かる人いらっしゃいますか? DRC225Wです
→ http://imgur.com/jRGTszb わりといきなり出ました、何回やってもでます。
このエラーが出る前、いつも、4枚くらいずつスキャンしてるのですが、ほぼ毎回、紙詰まりエラー
がでたり、この直前くらいに、左半分は、裏写り防止をしてるみたいに白っぽくなり、右半分は
普通だったりと、意味不明なことがおこってました。 センサー系のトラブルかな? 頻発の時点で修理依頼だが、一応ドライバ入れ直して様子見 よく「修理するぐらいなら買い直した方が長い目で見れば安い」って聞くけど >>932
あんまり期待しないほうがいいなとは思う
いたれりつくせりではないから
うちのはオートクロップがアホの子だったので、
サイズを定規で測り、最初にミリで入力しておく癖がついた
結果、気持ちよく揃うようになった
業務機ならではだなあって思う >>933
VietOCR-5α用の縦書きモジュールjpn_vert.traineddataの検証、サンクス。
tessdata_fastとか、英語のソースから見つけ出せるってすごいな。
早速xubuntu16.04上のVietOCR-5αでjpn_vert.traineddataを試してみた
ところ、横書き用のとは共存できないのか、リネームしてjpn.traineddataの
ふりをさせることで、半角スペースまみれとはいえ、縦書きの画像から見事
それなりの認識結果が得られた。
正直、正解率からいえばblacklistでNG文字を設定し、jpn.unicharambigs
を改造して後処理パターンを修正したjpn.traineddataを使用した現行環境
の方がややマシだった。
とはいえ選択肢が増えるのは良いことなので、メニュー→コマンド→一括OCR
でフォルダ内のtiff画像200件超えを連続処理させてみたところ、相変わらず
020.tif辺りから開始して、最後まで行ってから001.tifに戻ってOCRする
謎行動だったが、何故かjpn_vert.traineddataではない方を使った時と同じ、
日本語になっていない認識結果が得られた(泣)
認識後の後処理に正規表現を使ったリストが使えるらしいのは魅力だが、
残念ながらLinux上ではまだVietOCR-5αは使えないようだ。
あと素のtesseract-ocr4.00αにjpn_vert.traineddataを食わせてみたが、
リネームしようが、jpn+jpn_vertに指定しようが、エラーになって使えなかった。 >>953
ワッチョイありがいいのならIP表示までやった方がいいよ 5chに金払ってID消してるやつはIPもワッチョイも消せるから無駄だよ 消してる奴は避けるという目印にはなるけどね。
IDだけでもできるけど >>961
それは書き込む人が激減するから絶対反対 しかし業務機のフルカラー300dpiは爆走だなあ
満足できるかはまた別として 自炊愛好家オフ会って無いん?w
お互いの自炊を自慢し合うみたいなwww そのまま交換会に発展しそうで危ないからやってたとしても表には出てこないだろ >>960
ubuntuにも入れてみたけど最新ソースからビルドで行けたよ
英語はchromeの自動翻訳まかせ これなかったら今更linuxデビューなんて絶対できんかったわ
まあスレも残り少ないしいい加減うざがられそうなので続きはOCRスレの方で
【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net
http://egg.5ch.net/test/read.cgi/software/1470745451/
あと>884 自己解決したので誰も興味ないだろうけど報告だけ
hocr-pdfの日本語文字化けは標準出力由来だった
ファイル出力に対応したfork版と差し替えで解決 https://github.com/zvezdochiot/hocr-tools.git いま、Kobo H2Oを使ってるんだけど、
電子化するか迷ってるA5サイズのマンガを寝る前に久しぶりに読んだから、
紙媒体の本が目も疲れないしページも自由に前後できるし本が楽しくて仕方なかった。
今の状態で電子化すると本を読む楽しさが劣化してしまう気がしてきた。
優秀なリーダーなら解決できるだろうか?
もし、お薦めのリーダーがあれば教えて欲しい。 紙本で読むことに価値を感じてるならスキャンなんてしないほういいんじゃね? >>970
了解
つか、その板のレス番4〜29まで長々と籠城してたの、オレ。
Linux+tesseract-ocrネタでバレバレだろうけど。 >>972
大引と束を追加して頑張ってたけど部屋にもう本を置く場所がない
それに地震が起きて本が分銅みたいになって揺れると家そのものが危険になりそうだから重量を減らそうと頑張ってる
ただ、最近紙で読むと楽しさが倍増したから、良いリーダーを買えば同じ楽しさが再現できるのではないかと思って質問した感じ
テキスト読むならどれでも同じような感じだけど、マンガと小説では感じ方が結構違う
大きい画面がいいかも とりあえず、手持ちの本を全部電子化。
でも紙で読むのがすきだから、
よみたい本の読みたい部分だけをプリントして、
よみ終わったら破棄する 自分なら読む本はそのまま残して、今後いつか読むだろうけど
今は捨てられない本は自炊する。 すみません、先輩方にお聞きしたのですが、予算7万くらい、なるべく中古なしで
キャノン以外でおすすめのドキュメントスキャナーありますか?
DR125、225Wと使ってきましたが、まともに斜め補正が機能しなくて
キャノンは糞だと思いました。
最低限、まっすぐ読み取る(補正する)やつがほしいです。縦線ノイズは
この分野の宿命だと諦めます。 >>977
DS-570W持ってるけどダメだなぁ
やっぱり黒背景じゃないと厳しそう 自動傾き補正は
コミック
→枠線を基準と誤認するので本質的に難しい
文字本
→文字列のみを基準としてくれればそこそこうまくいくが、
紙端も基準にされると印刷の傾き(文字列)と影響しあって失敗する
ページ全域のイラストや写真
→紙端基準にするしかないが、黒背景の方が確実に紙端を認識できる。
こんな感じでどこも一緒じゃないかな?
自分はコミック中心だからかもしれないが、
搬送の安定した中型以上の業務機で傾き補正OFFってのが、
傾きが少なく安定したスキャンを目指した自分の今の結論。
うちでは原稿サイズ+2mmでスキャンしてるが、紙端がスキャン範囲外に出ることはほとんどない。
+1mmだとたまにはみ出る ピックアップの時に傾いたまま斜めに入っていくんじゃないかなとおもうのいで、
斜行対策として自分は原稿ガイドまわりに手をかけてる。だと思う。
小口研磨された本とか裁断に失敗して裁断面が荒れた原稿の場合に斜行しやすいんだけど、
裁断面と反対側に軽い重しを置いて軽く抵抗掛けたり、
紙が薄い原稿の場合は原稿ガイドと干渉して浮き上がったりする場合にも
やっぱり重しを置いて浮き上がりを抑制したりしている。
原稿ガイドに引っかけて吸い込まれないような形にアクリル板を切っただけの重しだけどね。
自分のこの手間は後工程で角度補正はしたくないっていう方針から来てるが、
角度補正が許容できるのならスキャンの時の補正には期待しないのが楽でいいんじゃないかな? 傾き補正に上限設定がないのが前から不思議だ
45度とか90度とかそこまで曲がって吸い込まれるわけなかろうに
3度以上の傾きは検出しても無視するとかにできればいいのに ix500だと補正オフでも
紙を斜めに入れてもちゃんと補正されるので
適当に放り込むだけでいい
補正オンだと追加でランダムで90度回転する機能だから気が抜けない >>982
サイズ混載とかで適当に放り込んだ原稿に対応するようになってるんだろうけど、
リミット制限が有ればだいぶ使いやすいとは自分も思う。
紙端を認識したうえでそこから5度以上は無視するとかやってくれないかね。
スキャン影の塗りつぶし補正機能が有る以上は紙端の認識はできてるはずだから、
その内側から基準を探すだけで行けると思うんだけど。
>>983
それは傾き補正じゃなくて原稿の向き補正の機能では? レスありがとうございます。
まっすぐ読み取るのって意外と?難しいんですね。素人目に見て、例えば真っ白の原稿
でも、一応は白い原稿をスキャンできてるわけで、その上辺、下辺を平行にすれば、
横は裁断の程度で少し隙間が空くけども真っ直ぐスキャンでき、画像の枠線うんぬんは
関係無くできそうですけどねぇ‥、研磨された中古本はわからないが。
キャノンはホントひどかったですよ、たった1枚の週間漫画のカラー、ぱっと見、まっすぐなのに
斜めのスキャン結果が連発、補正切ったらまっすぐと、意味不明でした。
それと、表はまっすぐ、裏ななめ、とかもね。
ix500のアマゾンレビューだと、斜めるレビューが1個くらいしかなかったけども
S1500→ix500 がだいたい6年位。待って、より良くなったのを買おうかな? fiの中古のどれ買ったら良いのか分かんね
黒背景ってのに対応してるのがいいの? ドキュメントスキャナという用途を考えると
原稿紙端を基準にスキャンする場合と印刷を基準にスキャンする場合の両方を考える必要があるからね。
だから印刷内容から基準を探してこようとする。
コミックのようにワク線や斜めの文字列を見つけるとそれに合わせようとしたり、
角度の違う複数の基準らしきものから基準を作り出して合わせてきたりもする。
変な角度に回転させられた場合は何を基準にされたのか確認してみると良いよ。
その機種の補正のクセみたいなのがわかってくれば使い分けもしやすくなって、
不本意な角度補正に遭遇する率が下がるし。
大抵の人はコミックでは角度補正と原稿サイズ認識はOFFって所に到達すると思うけどね。 ちなみにスキャナの評価として斜めと言われるのは原稿を斜めにスキャン搬送してしまう『斜行』を指すのが一般的。
スキャン画像を補正機能で間違った斜めにされてしまう症状は、
本来の機能目的である文字列の認識と文字列基準の角度補正が出来ていれば
原稿が悪いという評価が多いんじゃないかな。 斜め補正はスキャン時OFFでえちる使うからあんま意識してないが
キヤノン機は斜行しやすい印象はあるな
ラウンドスキャンの125、225Wならなおさらだろうとは思う
>>984
scansnapは傾き&原稿の向き補正でひとつのオプション
どっちか片っぽだけ有効にはできなかったはず サイズ自動判別だと傾き補正が常に実行されるってことだけど、
サイズ自動判別をOFFにすれば読み取りモードオプションの文字列の傾きを自動的に補正するって機能が整除できるようになるんじゃないん?
初めて知ったけど傾き補正って5度までって制限がついてたんだね。 PFUのPaperStream IPって癖が強くてちょっと初心者の自分には難しいねー
クロッピングや傾き補正を使用すると
おせっかい機能で背景色や黒で画像の中まで塗りつぶされてしまう
だから使用しない設定つくっておかないといかんね
これ各モデル共通の仕様で普通? エッジを四角く認識するみたいなオプション無い?
PaperStream IPドライバじゃなくて富士通twainドライバのほうだけかな?
機種固有機能かもしれんけど。 機種によって個性がいろいろあるから
複数あるとはかどるな
ゴルフはやったことないけどクラブもいっぱいあるもんね このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 91日 9時間 30分 50秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。