自炊技術総合36 @電子書籍板
キヤノン、PCレスで使えるタッチパネル搭載ドキュメントスキャナー「imageFORMULA Sca…
ttps://internet.watch.impress.co.jp/docs/news/1591372.html Scansnapがもうちょっと横幅広いA4変形の雑誌サイズに対応してたらなぁ
A3までいらないけど、A4に対してもうあと2cm幅広の原稿をスキャンしたい 実際はレターサイズまでだから、A4プラス1cm弱くらいはギリいけるけどね。
それでもあと1~2cmあったらなあと思いながら、泣く泣くエッジを切り落としてる。 A4のドキュメントスキャナってどの機種もレターサイズくらいまでじゃないの? Adobe Scanを試してみたが色むらが多かった 楽譜の時にA4より大きくて困ったけど、
楽譜ってマージンありまくりなので、A4まで切っても平気だった >>606
閾値いじるより
AIでつくるもんなんじゃないの?
スキャンって・・・ ノイズ除去とか清書みたいな下処理部分はAIが便利に使える分野だな
世の中の人はあんまりそんなことする必要が無いんだけど、
自炊とAIは相性がいい 横線もAIが消してくれればいいいのに・・
前後の情報から予測するの簡単そうな気がするんだがな 消してくれなくても良いからせめてチェックして見つけて欲しいよね 横線が何のことか判らんけど
罫線くらいなら余裕で消す >>732
さっき人力チェックを兼ねて漫画読み返してたわ
思ったより少なかった・・
>>733
君、自炊したことないでしょ? いや俺スルーしちゃったけど、自炊だと縦線ていうのが通じやすい >>729と>>733を混同していて
自炊してないっぽいなと思ったんだわ
横に出るか縦に出るかはスキャンする向きによって変わるけど
自分が横線ばっかり見てるもんだから、横線と書いてしまったがあれは縦線だったか・・
あと今更だが>>606書いたの俺だわ 遅くても確実にスキャンしたいならフラべ一択かなと思ってるんだが先輩の意見を伺いたい。
ちなみにDR-2510Cを持ってるが、最近は借りた本しかスキャンしないので当然非破壊。
CANOSCANLIDE400を考えてるんだが、これで本のスキャンしてますていう情報がググれないわ。
CANOSCANLIDE400てダメなの?
本をスキャンする頻度は月1ぐらいで暇な時間はある。
スマホのスキャンアプリも試したけど、上から取る系のイマイチ出来に満足できない。
ホムセンでアクリル板で押さえると少しはいいのかな。
CANOSCANLIDE400は安いので買おうと思ったけど、6月下旬まで入手出来ないてことで少し萎えた。
不要になったDR-2510Cてまだ売れるかな? 借りた本が傷まないようにオーバーヘッドタイプを買えクズ 借りた本スキャンするなとは言わないけど
オーバーヘッドじゃないと傷むからなぁ 思い切り開くだけでも本は痛む
90度開いてスキャンできるのが理想 以前90度開いてスキャンする治具?かなんかあげてた人いたよね >>738
著作権がない本もあるお
自作の詩集とか >>736
Scansnapのユーザーは多いからね
そこに合わせると通じやすい
まぁ原稿を横にしたら横線にはなるんだけど
縦線は念入りにチェックして見つけた時には再スキャンして、それで完璧だと思ってスマホで読書したときに見つけてうわーてなる
スキャンの傾きなんかもチェックしてるときにはこれくらい良いかなと思っていざ読書すると気になったりする
紙の本だと印刷の傾きあまり気にならないのにね >>737
canoscanlideはガチでオススメしない
色再現性能が下手するとscansnapにも劣る
環境があるならやってみればわかる
白黒原稿のみを取り込むならその限りではないが
フラべにこだわるレベルならEPSONのGTXレベルはないと話にならない、というより無意味といったほうが良いか
裁断しない前提ならそれも一考してもいいけどわざわざ人力でやるなら高画質を一回で取り込むほうが精神衛生上いいぞ
フラべ人力は死ぬほどキツいとだけ言っておく https://youtu.be/bXp8D0lc_as
これどう?良さげなんだけど
ちなみに見開きもちゃんと読み取りできるみたい 本を取り込んだ画像結構歪んでない?
既存のこの手のアプリと大差ないような・・
OCRと指消せるのに価値を感じるならアリかもしれんけど そのうちOCRが完璧になって、文字を画像で読むことはなくなるかもしれんな
OCR元の画像は歪んでようがどうでもいい >>751
それくらいでも結構イライラするよな。
2つの異なるアルゴリズムでOCRして、差分を取って補正するとかしないと。フォントによっては同じ文字を常に間違えたりするし。
Aと4を間違えるとかOと0を間違えるとかみたいな感じで似た漢字を間違えられると目視で気づけないけど、なぜか検索できないとかになるし。 >>752
Oと0もだけどロと□とか一とーとか〈とくとか――あるよね
スキャンの縦線みたいな、イライラするのもわかる 1文字だけ見せられたら人間でも区別できんがな
前後との整合を考えるから間違わない
ある程度は辞書でどうにかなるけど、その先はAIしか無い タブで読めればいいからOCRの優先順位は低いわ、俺は 画像補正くらいの労力でOCRできたらするでしょう? ScanSnapだけどPDFでOCR ONなら取り込むと同時にやってくれるけどそういう話ではないのか
精度はまずまずくらいで使い物にはなる とっくに来とる
有料か無料かの違いで、やっと無料になってきた OCRって言うけど、OCRの読み取り精度が上がって個人の自炊で実用水準に達して、かつ図やレイアウトは元のまま、それとくっつけてファイルにして吐き出す
なんてのが、個人でサクッと使える未来がすぐに来るとは思えないわ、俺は
google様やmicrosoft様のリッチな環境と機材でAI処理させればできそうな気はするけど、目先画像化で特に困ってないし、歪んだ図とか縦線より受け入れ難い、俺は >>758
PDFにOCRした透明な文字重ね合わせるやつでしょ?
あれは多少間違ってても致命的ではないから個人で使う分には実用水準だと思うけどね 単純なOCRはできたとして
リフローするには構造の情報も必要なんだよな
どこがタイトルで、どこがチャプターの区切りか
そのへんを文字の大きさとかスペースとかを指定して判断させようと頑張らなくても、
もう全部AIがやってくれる bunkoOCRで青空文庫に変換しAozoraEpub3でEPUBに変換する方法もある。 Gemini の1番上のやつもOCRは大馬鹿だった。
課金して損した
これでもGpt-4oと同等と言うんだからGpt-4oもたいしたことないと予想される 喫茶店で読書は禁止って風潮になったけど
タブレットで眺める分には睨まれない時代 余計なことができないように本だけ持って喫茶店に行くんだから、
タブレットなんかあったらゲーム始めるだろ 普段デスクトップPC使ってるから
スマホだけになるだけでもやれる事に結構制約がかかって
たまにそうなると普段と違うことができていいなと思っている 先に切られるので自分から切る必要はほぼないですね・・ スキャナ画像の重複部分の情報を活かして結合する専用ソフト
良さげなのなんか無いかなと色々調べてたけど
EPSONはEpson ScanSmartに「合成貼り合わせ」機能がデフォルトで付いてるんだね
https://faq2.epson.jp/smart/Detail.aspx?id=52205
>「合成貼り合わせ」では、2枚以上の画像の重なり部分を自動検出して合成します。
原稿台の読み取り範囲より大きなサイズの原稿のスキャンに適しています。
これってICEと比べてどうなんだろう?
ちなみにキヤノンは単純貼り合わせしかなさそうに見える
https://ij.manual.canon/ij/webmanual/ScanUtility/W/LiDE%20400/1.1/JP/SU/Su-PAGE4.html みんな重複部位を検出させて合成、を共通認識の基本として考えてるみたいだけど、それって前提としてどんな状況なの?
1. 同じ資料が2枚あって、オーバーラップ部分を残して左右に裁断・スキャンしたものを結合
2. 1枚の大きな資料を折り曲げて、キャリアシートに挟んでスキャン。これを折り曲げる位置を変えて2回繰り返してスキャンしたものを結合
3. 1枚の大きな資料をフラべで左右にはみ出させてスキャン。はみ出し方を変えて2回繰り返してスキャンしたものを結合 ScanSnap ix500だけど300dpiなら863mmまでスキャンできるの知った
[Scan]ボタンを、青色点滅するまで3秒以上押して、原稿をスキャンします。
www.pfu.ricoh.com/imaging/downloads/manual/ss_webhelp/jp/help/webhelp/topic/ope_scan_long_document.html みんな重複部位を検出させて合成、を共通認識の基本として考えてるみたいだけど、それって前提としてどんな状況なの?
1. 同じ資料が2枚あって、オーバーラップ部分を残して左右に裁断・スキャンしたものを結合
2. 1枚の大きな資料を折り曲げて、キャリアシートに挟んでスキャン。これを折り曲げる位置を変えて2回繰り返してスキャンしたものを結合
3. 1枚の大きな資料をフラべで左右にはみ出させてスキャン。はみ出し方を変えて2回繰り返してスキャンしたものを結合 長尺物を読み取れた部分だけ保存する裏技があるのかな 聞いてどうすんねんっていう
次のステップで別の質問をしたいんだろうけど、後出ししないほうが会話がスムーズ 774じゃないけど重複部分が無いから使えなくね?て素朴な疑問があるわ
折り曲げたら折り目の処理が大変そうだし Q. 切っちゃうと重複部分ができない気がするけど、重複部分ってできるの?
A. できません >>774
3
重複部分を取るならフラットベッド一択
2はADFでしょ
原理的に歪みが出て重複部分が一致しないから精度的にイマイチになるし
重複部分を取るために何度も折り曲げたりしたら原稿が痛む
ADFで大きな原稿を読むのであれば
重複部分は無視で左右に裁断するか二つ折りで自動結合を使う
あと1のような同じ原稿が2枚あるってシチュエーションはほぼない epsonもjpgファイルを入力とした自動重ね合わせツールとしてフリーソフトで公開すれば感謝されるのに 折り曲げてADFスキャナーに通すか
スマホアプリでスキャンかな
くっつけるって発想がなかったし
そこまで質が必要でかつ大きいものに当たったことがない 結合シートに挟んで両面スキャンして
のやり方って、折った紙をスキャンという時点で端がうまくいかないし、
スキャンされない部分も結構大きいし、
単に切るのが面倒くさい程度の用途にしか使えない 自分は単純にくっつけて、結合画像の任意部分を範囲選択して移動貼り付けって感じ。
画像結合時に位置あわせっていう考えはないなあ? シートの挟めって書いてあるけど
シートもそこそこの値段するから挟みすらしないで流してるわ
canon機ね うちのIX1600はシート挟まなくてもいけるけど
シート挟まないと高確率で搬送中に斜めになって歪むので結局A3キャリアシート買った
そこそこいい感じにスキャンできるようになったから中央部が欠損していい原稿はA3キャリアシートでスキャンしてる
>>776
エクセレントだけ360mm止まりなのが困るわ
本のカバーが1枚で読み取れないんだよね ここは779みたいなタテジワネズミがいなければ本当に有意義な場所になると思うんだよなぁ
重複部分を使った結合処理って、位置合わせの部分は公開されてる有名なアルゴリズムを敬意を払いつつまるっと使うでいいとして、その先のオーバーラップ部分をどう処理するかがキモだと思うんだけど、何か良い方法あるかな? なんかツール作ろうとしてるの?
自力で問題解決できない人には無理だよ >>790
ありがとう。自力で解決した上でさらなる改良と技術向上のためにここで話題提起しているのです。790のような自意識だけのタテジワネズミとは中身が違うのです 位置合わせの部分に角度調整は付いてるの?
位置と角度が決まれば自動的に答えが出そうだけど スクリーントーンとかあるページを回転しても滲まないアルゴリズムはないですか >>795
位置合わせは平行移動+角度調整
片側or最大値or最小値が簡単で良いんだけど、オーバーラップ部分のエッジに違和感が残っちゃうんだよね なので、加重平均的にグラデーションを付けて移行させるようにするとまぁ許せなくないかなってところなんだけど、多分ちゃんとしたソフトはもっとエレガントな方法を使ってるはずだから行き詰まってる 画像の線分抽出して線分が正しく重なり延長が一直線になるように並行移動と回転をするというのが基本かな
エッジ部分に線分がないと精度が落ちるけど人間が目視でやっても同じなので気にならない 画像結合で完璧な仕上がりを目指すならややはりHuginが良さそう
https://hugin.sourceforge.io/tutorials/scans/en.shtml
こいつも本来はパノラマ画像合成用のソフトだけど
スキャン画像結合のチュートリアルのページと結合練習用のサンプル画像までご丁寧に用意してあるから用途として十分想定されていると言えるのではないか
MS ICEと比べて設定項目が細かく弄れるのもいい サンプルをICEとMosaicJで結合してみたけど、どちらも何の不満もない
自動でいけるのならICEが一番楽
ICEは自動すぎて融通が効かないので、
ICEが誤解しないように中間ファイルを作って、みたいなことをするくらいなら、
MosaicJで半自動の方が楽
MosaicJですら不満が出たらもっと細かい設定ができるツールの出番 >>798
位置合わせに関してはSIFTを使ってるから文句はないんだけど、その先の「信号値をどう料理して繋ぎ目を自然に誤魔化すか」ってところね >>801
つなぎ部分は両方から重みづけ3次補完するだけで良いのでは? それ以上の精度だしようがないし… >>802
重みづけ三次補完ってのは、例えば左右に分割した画像Aと画像Bを繋げるとして、オーバーラップした部分の画素値を(画素値A+画素値B)/2して算出してから、オーバーラップ部分に限定して例えばバイキュービック補間するってこと? 単純な方法だよ
画像どうしはドットバイドットで重なるわけではなく半ドットずれとか回転とかある。スキャナでは考えなくても良さそうだけど写真とかなら拡大縮小とかもある
なので最終出力座標に対応する画素値を元の画像から3次補完で計算する。3次補完にはいくつかのアルゴリズムがあるので画像にあった方法を使う
2つの元画像なら2つの対応する補完値がでるのでこれらを重み付けで混合する。重み付けの方法にも複数あるので適切なのを使う。単純にやるならそれぞれのエッジからの距離の2乗とかの簡単なものでも良い
スキャン画像ならあまり考えなくても良さそうだが写真とかならそれぞれ画像に明るさの違いがあったり色転びがあったりするのでこの辺も自動的に割り出した重みづけパラメーターで色空間の変換をする なるほど、位置合わせの最終段階で使う補間のことね
エッジからの距離で重み付けは既にやってるから、基本的にはこれが定石なのかね 位置変換と色空間などの変換で両方の画素ができるだけ一致するとこまで持って行くのが本質なので混合は最後の誤差消しくらいの意味しかない そんな簡単に決められない次元で、
どっちも正解っぽいけどどっちにする、という二択を迫られる
だいたい重なってるけど、片方にだけ何か映ってる
それはノイズとして削除すべきなのか、積極的に残すべきなのか >>807
片方だけに写ってる理由が白飛び黒落ちなどの光学とかデバイス精度理由とかなら露出とかを揃えれば自然と解決する(要は残せるものだけ残せば良い)
どうやってもノイズと区別つかないやつは放置で(そのまま消えて残っても)良い。それはノイズや計算誤差だ。もしノイズでなければ撮影/スキャンミスということになるのでなおさらアルゴリズムで解決してはいけない 大事なのは入力に忠実であること。入力が変なら出力は変でも良い。むしろ変じゃないといけない。
綺麗に絵作りをしてはいけないし、ノイズ除去とかもしてはいけない。それは別の工程。
元画像にない絵作りしたいのならAIを使え 「最高過ぎる」「すげー!」 ChatGPTに“手書きメモ”をアップすると…… 仕事がはかどる“衝撃の機能”に歓喜の声(1/3 ページ) - ねとらぼ
ttps://nlab.itmedia.co.jp/nl/articles/2405/22/news098.html webpだと>>569とあるけど
理解が浅いんだけど4:4:4以外だと輝度は保たれるけど
色の正確性が下がるもんだと認識してるんだけど
ということはグレースケールだとwebpにしても色って大きく劣化はしないの? 結合するのに色々良さげななソフトが出てきてるんだなというのは分かるけど
結局のところICEでも継ぎ目がわからないくらい正確に繋げられることが多いし
UIも猿でも使えるくらい簡単でわかりやすくて優秀なソフトだから
結局ICEがあるからそれで良くね?ってなってしまうな iOSのPanelsってアプリでzipで束ねたwebp開けたわ
有料だとcomicshareはiOS16以上だとavifも開けるらしい、試してないけど
おまいらはどうやって自炊本読んでいるよ? どうやっても快適にはならんので、外で読むのはkindle paperwhiteにazw3入れたのだけだな 傾き補正、白抜き、サイズ統一、結合など一つのソフトでできないものかな linuxのミニマリズムとは対極の思想だな
部品を組み合わせて目的を達成しようという考えと、
目的に必要な部品の組み合わせ毎に専用アプリを作ろうという考え 他板でlinux信者の布教活動を見せられてるからクライアント用途でlinux使うやつの印象はなんとも >>815
それって効率悪くないか?
複数冊作業する時はCのスキャン、Bの補正値割り出しと目視チェック、Aの実補正とフォーマット変換みたいな感じで3冊並行作業してる
一つのソフトでやろうとすると同時並行がめんどくさくなりそう ICEなどの自動結合ソフトでの綺麗な結合法
・フラットベットスキャナを用いる
・なるべく高解像度(600dpi以上推奨)の無劣化形式でスキャンしリサイズとエンコードは結合後に行う
・厚い雑誌などを用いてスキャナガラスにしっかり密着させて良いコンディションでスキャンする
・スキャン部の端に掛かって原稿が浮いた部分は結合前にトリミングする
・本などのページの継ぎ目など、スキャンする度にコンディションが変わりやすい部分は結合ソフトに入れる前に片方トリミングしておく あまり画質にこだわらないスマホ読み用への変換処理は1本のアプリで自動化出来るように進めてる。
(余白トリミング→サイズ調整→余白トリミング→減色→保存)×複数画像
を一発で。