自炊技術総合34 @電子書籍板
レス数が1000を超えています。これ以上書き込みはできません。
せっかく遵法精神を備えた正しき者たちの集いなのに窃盗に誘導するなよ 日本語が不自由でスマンが関連スレの代わりに何と書けばよかった? >>8
お前本当に日本語が不自由だな
呼び名の問題じゃなくって、あれをここで紹介しちゃいかん、という話 >>9
スレチな話題になったときに>>3と誘導するだけで便利と思ったのだがな 気持ちはわかるが、あそこはここの精神とは矛盾するので良くない
スレチは内容毎に対応変えるのが良いと思う
前スレの盗人にも三分の理に対してはボコって追い出すのが良い。3を紹介したらふらふらと犯罪にはまり込むやつが出ないとも限らんから DRM解除はCalibreの本質ではないし(非公認のプラグインがあるというだけ)
自炊した書物の管理をCalibreでやってる人間もいるので
まっとうに使うなら全くスレチではない
とつられてみるテスト 「自炊技術総合」
そんなに難しい日本語ではないはずだが... >>14
世の中、日本語が理解できない馬鹿は結構な率で存在するんよね... 前スレの続きなんですが、scansnapの内部掃除はIPAが良いのでしょうか? scansnapのゴムの部分ってすり減るのに消耗品高い杉だよね。昔、レンタル屋の借りてかなりすり減らして返却したけど、買う気にならん。 ツルツルの紙(表紙カバー)でのスリップ事故(スキャン結果で一部伸びが出る)が増えてきた
さすがに推奨20万スキャンに対して45万超えてるから仕方ないか…
ローラー変えないと。 読みたいのに紙でしか売ってないということも少なくなってきて、
スキャンするのはレシートとか書類とか読めればいいのばっかりなので、
壊れるまでこのまま行けそう
壊れたら次はix100みたいな奴でいいや とじ太くんって買ったほうがいいかな
今ドライヤーで表紙と中身を分離して
それを接着剤ギリギリで裁断してix1600でスキャンしてるんだが カメラモジュール2台と板とガラスで見開きスキャン撮影とかやれんのかな? ぱらぱらっとやってる動画から生成してしまう技術があったような ソフトの話、ここでいいですか?
スキャンしたやつが検索できるとすごく便利でいいなとソフト購入。自動読取でうまく判別できず変になったのを修正して保存したら透明にならず本文に重ね書きになって困ってる。
(ソフトは読取革命v16、本文は和文縦組みの図表入り) >>28
サポートに聞け
親切に教えてくれるよ
但し正規購入品だけだけど OCR のテキストも別管理でもっておけばいいんじゃね? 透明になっても不便だと思うけどな
テキストファイルの方が明らかに取り回しがいい
透明にするのは、精度が低いから目で探してねという甘えに過ぎない 割れに染まった彼らには面白い
魂の白き翼は黒に染まることはあっても白に戻ることは無い PDF Eraser Pro v1.9 2022年12月5日 まで無料
・PDF のテキストや画像の削除
・PDF にテキストや画像を追加
・PDF のページを削除
Promo Code'PDF-ERASER-2022'
ttps://freesoft-100.com/plus/20221122.html 電子書籍を買った側が完全にデータの形で所有できる日は来るのだろうか…?
映画とかドラマとかの映像にも言えることだけど。 映像は何回もは観ないから。
音楽は繰り返し聴くが。
本は数年から数十年単位で忘れた頃に見返すね。 >>38
PDF形式でDLできるストアがあることを知らんのかーいw 紙の本だと女子と本の貸し借りして仲良くなれる
電子書籍だとこれがやりづらい >>26
作ってみたけど
@ 本が上手く広がらん
@ ガラス面が照明でテカる…で断念した
デジカメ…コンデジよりスマホ…激安中古のカメラを使ったほうが割安でピント調整とかが楽に出来るよ、、超有名メーカーなのが二千万画素が数百円とかで有る
A4を300dpIで撮ると、約一千万画素必要になるからね 裁判記録が捨てられたー問題で困ってる人に、スキャナという便利ものがあるよと教えてあげたい 自炊したデータのリーダーは
リーダーは何を使っていますか ミーヤもいろいろ不満あるから、全部解消したいいのがありそうな気がするのに
一時期はポストミーヤを探していろいろ試してたけど、結局いいのは無かった
多分、需要が少ないんだろうな
webで直接読むかスマホのアプリで読むのが圧倒的多数 WindowsタブレットでPico Viewerを使っているな。AndroidのPerfect Viewerとかより余白カットの精度が高いし、使い勝手もよい。 UI部分作るとかいちばんやりたくない、、、
何の言語が楽なんだろう >>49
長押しで開くと言うタッチ操作に向いた機能があれば良いのにって思ってる
更新してくれないかなあ >>46
いや夢はこれだよ
http://ishikawa-vision.org/vision/BFS-Auto/index-j-thum.html
サンワのはOpticbook 4900に独自Driver乗っけたてことか?(Book Pavillion) >>53
自レス。今サンワのDriver落として確認した。4800だった。なんでやねん。 裁断した紙を自動でクリーニングしてくれる装置があったら自炊ってめちゃくちゃ楽になると思う
3万円くらいなら買ってもいいんだよな ADF機構を上手く使えばそういうのって作れるかもしれんとは思うな
スキャナー通しても紙の粉は出るし
静電ブラシなりつけて掃除に特化させれば 電子化してから全ページの汚れをAIなりが判断して電子的にクリーニングするなんて物は
ないのかな? 写真集や学術本、ムック本などは大きいけど、それを寝っ転がってストレスなしに読める
14〜15インチくらいの大きなタブレット探してるんだけど、少ないねぇ。
ニーズ無いのかな?? プリンター掃除用に粘着性のあるシートがあった気がする。 >>62
15インチのUSBタッチパネルモニター(スマホにもつなげる奴)持ってるが実際かなり使いづらいと思う
使おうとする環境で動くか確認して試してみてはどうだろうか おまいら、出張してコメントしたのか
エッジ幅が約2mmで綴じしろの影が映らずにページの端まで読み取れる非破壊ブックスキャナ
https://m.srad.jp/story/22/12/13/1211249 >>62
10インチタブでも重いぞ、デカすぎて片手では持てないし
儂は8インチを読書リーダーにしているがこのあたりが限界だね 漫画を読まなくて活字がリフローできればかなり小さくていい
ずっと前はニンテンドーDSで読んでた 10インチなら普通スタンド使うよベッドでなら自在アーム
操作はBTゲームパッドかBTマウス 俺の感覚では10インチは手で持って許容範囲だった。
充電器兼スタンドもあるので併用だけど。 室内なら32インチディスプレイの方がいい
モバイル機器は電車の中とかで使うもの もしかして統合失調症の人でテストしてる...
って真っ先に思った 需要ないと思うがopticbook4800が動いている環境で4900と交換するとそのまま動く。(=Book Pavillionで運用できる) 独り言
H2にうかつにUPするとフォルダの参照が死ぬがOnedriveとの同期を切れば復活する。 >>77
基板を変えたとしかオフィシャルの記述がない。
筐体、SCAN速度、画質等私は差を体感できない。
(ソフトを変えれば変わるかもしれない)
各部品は4800発売から10年以上たってるから変更されてるでしょ。 むしろ自炊をし過ぎて、スマホの500ギガのメモリーでは持ち歩けなくなった
自炊じゃepubに出来ないから…100:1では場所を取りすぎる どうしても持ち歩きたかったら、1TBのmicroSDカードを使うとか。
iPhoneなら知らん。 スマホに入れておく版は表紙や白紙を削ったり縮小したりトリミングしたりと工夫してたな。 スマホで読んでたのはほんの一時期だけだな
kindleにバックライトが無くて昼休みに電気消されると読めないから
バックライト付きのを買い足してからは常にそれが最適 >>80
1t入れてる
あと、持ち歩き用に解像度落とした版作ってる 端末に合わせてdot by dotで作るもんじゃないの lenovo legion y700読書用に使ってるわ
やはり8インチが至高 >>83
iPhoneは本体にmicroSDカードスロットがない。 一日250冊自炊とかって人はすごいわ
俺は10殺でも息切れしてんのに スマホで読む理由が、スマホしか持ってないからか、出先だからかによるな >>91
背割りして、裁断して、スキャンだから
スキャンはカラーの300dpiだと文字がボケるから400dpiで読み取るとPCが負けて良く待たされる
他の用事も有るから10冊が精一杯、頑張っても20冊くらいかな 俺は普通のコミックで1時間10冊が限度
最終的な目視チェックは別なので実際にはもっと掛かる
画質に影響しない部分で可能な限り手間削ってるので、これ以上急いだら画質に影響する
とにかく数が重要で、kindleくらいの画質で十分ならいくらでも速くできるんだろうけど 皆さん早いですなあ。
私は漫画の見開きとかののどの部分の絵をなるべく残したいので、解体だけで一冊30分ぐらいかかってしまうため、1日4、5冊が限度です。 読む時にスキャンするから1日1冊だな
頑張れば30冊くらいできると思うけど、時間が勿体ない 見開きにきちんと対応しようとすると解体1冊30分ですら早いよ、凄い
アイロンで糊を溶かしてティッシュに吸わせてバラバラに、とかやってるんでしょ?
俺はそこだけは諦めて普通に裁断するようにしてる。片手落ちなのは自覚してる
iPad縦持ちでの読書がメインだから見開きに拘ってないんだよね 解体はとじ太くんを使ってますね。
自炊しているのが四コマ系メインのため、のどまで絵が書かれているページはさほど多くないのでその程度の時間で済んでいます。
のどに絵がないページは普通に裁断していますし。
ですが、見開きが多い少年漫画とかだと、解体だけでかなり時間を食われますね。 >>91
250冊なんてただスキャンするだけで縦線とかゴミとか無視しないと無理だな
色々諦めが必要だわ スキャナ2台使って個人最高記録が1時間に15冊なので、250冊とか無理やろ!
飯も食わず寝もせずに1日中やったんか? 1時間15冊なら250冊で16.7時間だから、寝れるし食事もできるな >>102
平均速度でなくて、最高速度な。
最高速度をずっと維持するのは無理。本によってかかる時間が違うので。 >>102
一時間で15冊だと1冊あたり4分になるが
儂の古いスキャナーとPCでは無理、200p程の雑誌で十五分程かかるんだわ >>107
雑誌は面積が広いしカラーなので時間がかかるね。
面積の小さい文庫とか少年コミックの類を白黒でスキャンすると速い。紙送りの速度限界もあるので縦ではなく横向きでスキャンするとさらに速い。(小技)
私はこれに2台目のスキャナと別PCを準備してカーバーやカラーページのスキャンを並行作業してる。これでようやく時間15冊。 自炊するような覚悟がある人間が200dpiで満足するのだろうか? 世の中いろんな人がいる
kindleと同レベルの画質で満足してる自炊民が前スレにいたし >>109
儂は妥協して400dpi、コレでも文字が読み難い場合がある
600dpiにバージョンアップしようかな、NAPも発注したし容量を食っても何とかなるか kindleは基本はテキストなので画質とかはないんだけど、
コミックとかは縦1920ピクセルくらいになってる
特に困らない >>113
Kindleはスキャンなんてしてない、原稿の元データだから絶対に勝てないよ 俺の知らない凄い技術で元の本のブツブツを消せるのかなと 簡単な方法だとスキャナドライバの粒状感軽減やモアレ除去をON
あとから加工するなら ぼかし+アンシャープマスク あたりかな 基本は全体に同じ処理をするので、そこは残して欲しかった的なことが起きがちだけど、
AIならそこらへんも理解してやってくれそうだな 発想を変えてスクリーントーン除去する方法を探したら良さそうなソフトを見つけた
Screentone-Remover
ttps://github.com/natethegreate/Screentone-Remover 網点除去はオリジナルの維持を重視するか否かで賛否ありそう どうせ見る時に縮小すれば潰れるし、600dpiだの1200dpiだのを等倍で見れるデバイスなんかないのでスキャンしたやつそのままで保存しとけばいいよ。 >>125
オリジナルを保持した上でなら可、かなあ
保持データが倍になるが、気にするようなら自炊道なんて走らないだろうし >>124
パラメーターの自動設定が便利だな
>>125
オリジナルのとらえ方だな
印刷前のデータがオリジナルって考えだから消したい スキャンした本の図表を見たら、カスカスキレ切れ「再スキャンしないと駄目かな」と廃棄本置場から探し出してきて
念の為に10㌅タブで確認したらキレイに仕上がっていたわ
モニターの解像度も大事やわ >>130
やっぱし600dpIでやり直した、カラー部を別にして文字部はグレーモードで
モノクロやグレーは速いわ 網点も気になるけど、蛍光ピンクってほんと再現むずかしいね
そもそもスキャン時点でくすんだ桃色っぽいし…、それを彩度上げても少し明るくなるだけだし(色の調整してもあんまり??)
蛍光色の表現が好きなんだが紙の本(カラー)を見た通りに…って無理かあ スキャンした色を蛍光色に変換するソフトが望まれている そもそもLEDで蛍光色は表示できないので単に明るい色に変換するくらいしかできない。 逆だろ
蛍光色はディスプレイで表示できるけど印刷できない 蛍光の写真はLEDでも蛍光カラーっぽく見えるよ
ttps://article-image-ix.nikkei.com/https%3A%2F%2Fimgix-proxy.n8s.jp%2FDSXZZO7484094017082021000000-PN1-2.jpg?ixlib=js-2.3.2&w=550&h=388&crop=focalpoint&fp-x=0.5&fp-y=0.5&fit=crop&auto=format%2Ccompress&ch=Width%2CDPR&s=9d1331544977a2880952b416a4956952.avif 蛍光色はスキャン時のプロファイルをAdobe RGBにして
Adobe RGBカバー率の高いモニターで表示しないと見えないんじゃないかな
(うちの環境では埋込みプロファイルをAdobe RGBにしたらsRGBモニタでも一応蛍光っぽい表示にはなった)
箔押しは半透明のクリアファイルに挟んでフラベでスキャンすると黒くならずに撮れる >>141
「半透明のクリアファイル」とあるけど、「比較的白濁が強めのクリアファイル」ってことで合ってる?(白濁が弱いと上手くいかないので「半透明」の文言で修飾した) >>118
具体的に使用したフィルターと数値を教えていただけないでしょうか?
検証してみたいです ( ・∀・)つ〃∩ ヘェーヘェーヘェー
物理的には何が起きてるんだろう エロマンガは電子だけ黒塗り修正とかあるから紙版を買って自炊するしかないですね マンガならNLmeans_lightをフルパワーで十分な気がする 一日一冊、土日七冊やって自分が生まれてからの日数分スキャンするのが目標 スキャナ掃除しないとな
まず内部へのアクセス確保しないと…
ガラスはガラス洗剤のたぐいよりアルコールの方がいいよな
ミラーは拭く派? 自炊ペースを購入ペースが上回って増える一方だわ
一生自炊が終わりそうにない 夜なべ仕事だと思えばオケ
無聊の慰めに毎晩少しずつやっているうちに思いがけず捌けている(といいな‥) 今日ブックオフの日だから大量に自炊する本購入してきたわ 本自体が売れないからな
必然的に古本の量も減る
電子書籍は便利だけど売り飛ばせないことに気づいた時にはもう遅い 電子書籍の生殺与奪を握られてる感はすごいよな
紙本も生きのこってほしい 本来はもっと自由なものなんだけどな
プロテクトかかってないzipなりpdfなりをダウンロードできます、で何も困らない
紙の本と変わらない代金払ってるんだから、永久に使える権利を買ったと見做すのが妥当
プロテクトは違法な利用を防ぐ為ではなく、単純にその方が儲かるからに過ぎない プロテクトをかけるなら、権利処理が独立していて、
・配信サーバ
・ビューア
が別々に選べたらいいんだけど、現状どこも会社ごとだからなあ。
電子書籍買いまくってるけど。 >>160
使ってる電子書籍サービスから、
「20xx年x月x日にサービス終了とさせていただきます。
再ダウンロードのご利用期間は20xx年x月x日とさせていただきますので、・・・」
なんてアナウンスが来たらがっかりだよなあ 電子書籍はいろんなこと考えたら手間はかかっても紙の本から自炊に限るとおもってる。除く漫画ね。 DRM解除できることを確認してからしか買わないので、今のところ被害の可能性は無いが
そんなことしてる人ばかりじゃないだろうし drm 解除は一応非合法なんで見つかる可能性がほとんど無くてもやりたくないな。 しかしサイズがなぁ、200頁の雑誌一冊がカラー400dpiで400MBだよ あっという間にテラバイトだよ >>167
カラーの雑誌を大量に保存したい人には自炊は向かない
まあその場合は権利関係のリスクは割り切るしかないよね
電子化した本をいろんなアプリで使いたい時は自炊でPDF 化したものが便利だけど、そういう使い方をしない場合には 既製品の電子書籍の方がいいと思う >>168
電子化なんて最近だろ、読んで貯めに貯めた半世紀分も有るんだ、しかも何種類も
みんなPDFなのかな儂はJPGで、今やってる本は裁断後に巻頭カラーとセンターカラーページを纏めてカラースキャン、他はグレーで読取り、jpgだとこの処理がしやすいんだ、最後にzipで纏めている
300dpiだと文字が読みにくかったから400dpiしたんだが…コレで倍の量になる
モノクロなら300dpiでも読める様になるが写真等がエライことに、、 非エロの一般漫画は電子書籍で買って、エロマンガと同人誌は自炊してる。 >>169
俺はむしろ半世紀分の中から電子化するものを厳選しそれを老人ホームに持っていくっていう基準で選んでる
残りは捨てるつもり
紙のままだと絶対老人ホームに持っていけないしね
パソコンとHDDは持っていけるから
本分検索もできるようになるし >>167
1TB2,500冊なら1台に1万冊入るでしょ
なんとかなるさ >>163
サービス終了はスクショ連打解禁の合図だわ 今HDDのボリュームゾーンは6TBだよ
4TBも6TBも値段変わらない >>172
その1万冊に何時でもアクセス出来るようにNASを導入して、、金が掛かるわーー
そして暇があれば裁断とスキャン、、読む間が無いよーー 特養に入ってもamazonで古本買うくらいの自由はあるだろさ
つうか認知症やら排泄やら行動が自力で困難になるから仕方なく入れてもらうわけで
その段階では読書などしなくなっているのではと思ってしまった
意地悪で言っているわけではないけどさ >>177
置き場所の話
特養ってどこの貧民の話だ
俺が入るのは高級老人ホームだよ その老人ホームにはペリーローダンとグインサーガが揃っているのかな。 高価な老人ホームより安くても気ままに生活する方がいい 漫画の場合zipとpdfどっちがいいのかな
なんかpdfだと割れっぽさがある(偏見)からzipにしてるんだけど、
zipだとNASから一冊まるごとデータ移動させることになるから、いまいち使いづらい
そういう使い方では非圧縮でフォルダに突っ込んどくのがいいのかもしれんけど、それはそれでデータ移動とか重くなるし 今年の書類今年のうちに
溜まった書類をスキャンしてたらS1500から異音がする
ローラーがベタベタでいろいろやってたら完全に駄目になった
ローラー発注して今年はもう終わり >>189
ベタベタ…加水分解かな?
儂は紙送りがヤバくなって…二枚送りが増えた、ローラーが1万円以上する聞いて
五千円の中古に買い換えたよ、新しいからアタマの回転も速くなってそうで…おかげて快調や 5000円で買えるなら十分ありだな
前にも分解したけど大変だった >>191
ES-510…2013年発売だから10年前の機械で2万枚だったから買ったんだ
同じ業者が何台も出してたからリースバック物だと思うが
何台もスキャナーを置く顧客とは?、しかも2万枚と使ってない部署とか? お役所、、税務署とかかな? >>193
年末の大掃除として、
本の断捨離をして感じかな スキャンして捨てるのは断捨離ではない、というのは重要な事実
単にコンパクト化しただけで捨ててない
それどころか読まない本に余計に時間を掛けているので、何もしないよりなお悪い 何故そう解釈できるのか判らん
断捨離でないものを断捨離と言うなというだけの話
個人的には断捨離には反対
物は捨てるべきではない さぁて今日は普段行かないブックオフでも巡って自炊弾補充しようかね >>199
手放すことと捨てることを区別できるようになろう 256GのSSDに自炊図書PDF約1300冊を入れてスマホで持ち歩けるようになった。
だが、更にまだあと4倍程入るのであった。 お正月なのに、裁断済の16冊をスキャンしてしまった、、
遅ればせながら「明けましておめでとうございます、、」 お正月たくさんスキャンできましたか?
よい自炊ライフを 2012年に始めて累計24721冊だった
雑誌の抜粋だったりも含む数値なので実際にはもう少し少ないけど
我ながらやりすぎている 2011/6から2011/9までの3ヶ月で4000冊だったな
同時進行でビデオテープやカセットテープもデジタル化した
役立っているかというと、滅多に参照しないので人生の一部分を切り取って捨てたようなものだけど、
少なくとも部屋は広くなったし、参照可能というだけで意義は大きい 自炊の環境はあるけどイマイチモチベーションが進まない
自炊した本はよく見るので苦労に見合う成果は得られるのは分かってるんだが
縦線と傾きとの戦い、見開きページの調整、スキャン後の画質調整、腰が重い、、、
裁断は苦じゃないのにな 見開きページの調整って欠落した絵の補完か
苦になるよな ドキュメントスキャナが欲しい。。。
裁断機も。。。 S1500のローラーが届いたので交換しないと
激しくめんどくさい >>210
三つ折りとかな折込図面も面倒くさいぞw とりあえず切り分けて一緒にスキャンして後で並べ直す
折込チラシやハガキは見落とすと機械が止まるし 本のときは気にならないけどスキャンするとなぜか気になる斜め印刷
意外と本ってきっちりまっすぐ印刷されてるわけじゃないのね 逆。スマホやタブレットで見ると余計に印刷の傾きが気になるよ
俺は画像処理で傾き補正を自作した 傾き補正の有無でどれくらい違うかサンプル作ってみたよ
自前で全部実装したけど、これ無しで自炊は俺にはもう無理ってくらい出来が良いという自画自賛
https://i.imgur.com/2bw9ILG.png
https://i.imgur.com/mKVZw0P.png おそらく左が傾いてるんだろうけど俺なら左でも充分許容範囲だわ >>218
https://qiita.com/suzuna-honda/items/32920191f775cb2f26bf
アルゴリズムは公開してるから自作してねって感じ、ソフト提供はサポート面倒だからやらないかな
この傾きが気にならないならそれはそれで本当に幸せだと思う
細かいアラが気になってもう何年も自炊の画像処理やってるけど未だに完成の目処が立たないよ >>217
全く違いがわからん
こういうのが気になって芸術家の域だな 公開してもらえないのは残念だけど、eTilTranで検出角度がおかしい時は内部演算プレビューを見るという知識が増えた 線分検出だと枠線ありのコミックとかはうまくいくんだけど、文字だけの小説とか枠のないイラストの傾き補正は難しいんだよな。
下手をしたら集中線とか背景の壁みたいな線分に合わせて傾き補正したり。 枠があるから気になるのだから、枠を削除してしまうのはどうだろう >>220
サポートなしの自己責任で公開してもいいんじゃないかな
というかお願いします >>220
現状のままスレ民向けに公開して頂けないだろうか
サポートなしの自己責任で 自己責任のサポート無しと言っておいても文句言う輩は必ず現れるからなあ バグレポートは感謝するべきものなんだけどな
大抵は見当外れのクレームなので鬱陶しいだけ 枠のないイラストの自動補正は諦めてるけど、そもそも気になったことが殆どないから別にいいかな
小説は↓のように自動補正できてるよ
https://i.imgur.com/WReZQNP.png
https://i.imgur.com/DE3UwUT.png
↓はデバッグ用の画像、緑色の線が実際に傾きとして採用されたもの
赤い線≒枠線ではない漫画の中身、ってことをちゃんと判定出来ているのよ
https://i.imgur.com/ElAAjIy.jpg
https://i.imgur.com/EQvVMCR.jpg >>217
うーむ、全然気にならんなあ。雑な感覚でよかったと言うべきだろうか。
でも周辺の余白を全部切り落とすと途端に傾きが目立つ。
自作の余白切り落としツールに組み込んでみたいという気も起きてきた。 売り物とか公開するとかならクオリティに拘るのもありだけど、
自分しか使わないものにあんまり時間かけても
うまく自動化すれば時間はかからないし、そのプロセス自体は楽しいだろうからいいんだけど、
コスパが悪いことが最初から判ってるので趣味としてしか実現しない 知識ないから横目で見てるだけだけどDTP技術とプログラミング出来るひとが自炊してんのね
裁断は質問わなきゃ素人でも出来るとして
微妙なレイアウトのズレ気にするとか現代の職人芸だね >>233
儂なんてさっきスキャンしたのが10度ほど傾いてた、が面倒くさいから其のママにした
原因はハガキを除くのに失敗したからやろな、ハガキは綺麗にスキャンしてくれてたわw 原稿自体の傾きは気にするけど、原稿の内容の傾きは気にならないなあ 半分故障したスキャナーをだましだましスキャンしたけど新刊までの間ができたから修理だした。
修理代とか手間取る考えると電子直接買った方が安いかもしれないけどもう趣味になってるからいいや >>217
自分でスキャンした場合はこの傾きは気になる
ただ他人がスキャンした他人の本なら許容できる 手間をかけて補正したほうが身につく感じがする
無料配布のゲームより買った方が真剣にプレイするような感覚かな
eTilTranから15年、アルゴリズムは進化してるんだなあ >>229
間違えるのは枠なしで背景線だけある場合ね、枠がセリフ部分とかのみで短くて、別に長い線がある場合とか。
本当に絵だけなら傾いてるかすら分からないから気にならないけど、セリフとかが斜めになってると気づく。 それで文字列の方向を手がかりに傾きを自動補正するプログラムを作るはめになった。 補正のアルゴリズムがほぼ完全になったら、
それは加工ツールではなくビュアーに搭載すべき
たまに間違ってても、その場でちょいちょいと回してやればいいだけなので、
完璧である必要はない ビューア側だと画質や処理負荷が問題なりそう
加工時の高解像度な段階で補正したいわ 過去にもそう思って失敗を続けてきた歴史がある
CPU負荷の問題なんかすぐに解決するんだから、取り返しの付かない処理は先延ばしにすべき >>214
印刷と言うより折り畳んで切るときにズレが出る >取り返しの付かない処理は先延ばしにすべき
これはその通り
だから俺の環境では、「スキャナから取り込んだ素材画像」を保存して残しておいて、
「閲覧用の画像」に加工/最適化した状態を改めて出力してビューワには後者を投げている
ビューワでいちいち加工なんてしてたら、処理負荷の問題もあるけど
例えば傾き修正のアフィン変換だけでも画質劣化するので、なるべく解像度が高い状態で行いたいが
ビューワの段階で素材同等の解像度を持っておくのはストレージ/メモリ効率が最悪なのであり得ないという問題もある、>>242が正解
>>220のリンク先にその辺りのことも書いてあるよ CPU性能と同時にストレージもRAMも上がっていくよ
ビュアー限定のアドバンテージとしては、読んでる間に次の処理ができるので、
負荷なんか気にしなくていいというのもある マシンスペックが上がっていくから最適化の必要はない、みたいな議論はそれこそ1980年代くらいからずっとあってね
結局「その世代に合わせた品質を求められるから最適化は必須」って結論が出ちゃってるんだよね
流石にちょっと周回遅れかな、辛辣でごめんね >>248
スキャンデータ100%の品質で扱えるから最適化は不要な時代になった
どちらかというとスキャン時に失われる発色などが問題 スキャナの性能が物言うので品質にこだわるなら紙を取っておくべきだな
スキャナから取り込んだ素材画像は相当劣化してるし
DVDとブルーレイくらい差が出るでしょ 動画や音声の圧縮みたいな世界に入っていくな
比較して違いが認識できれば劣化しているのでNGとしてしまう
比較せずに単体で不満がなければそれでokとすべき 他人と共有出来ないものだし結局は自分が納得できるか出来ないかが判定基準かな 自炊一年生は素材画像を残しておいた方がいいな
カラー本の黄ばみを取るのに黄ばみを真っ白にレベル補正して満足していたが
のちに配信された電書と比較したらものすごく青っぽい
当時の自分はよくこれで満足してたなと >>252
そうそう
自己満足の世界
コレクションでありがち 色の補正なんてディスプレイや、それこそ眼鏡のレンズによる違いだってある。
自分が満足できりゃいいのよ。 見開きがつながってないスキャンしたような電書があるけど素人のスキャンでは話にならないくらい高画質
機材の差は埋まらんな >>242
スマホ、タブレットならSoC任せ。
WindowsだとDirectX?
DirectXを使った画像ビューアって、Hamanaくらいしかない?
Macは知らない。 >>253
スマン最初の頃は、スキャンした紙くずを其のママをグシャっとゴミ箱へ捨てて、、出来たのをモニターで見たら、、orz
以後綺麗に纏めて輪ゴムで留めているよ >>258
輪ゴムは溶けるので長期保存にはむいてない。知ってるかもしれんが一応忠告。 >>259
落ち着いたら廃品回収に出す予定、バラけてても本とかな古紙枠なのかなぁ 裁断の切れ端も古紙で出してるけどちゃんと持って行ってくれるよ 国立国会図書館は、令和3年度にオープンソースのOCR(光学式文字認識)処理プログラム #NDLOCR を開発し、GitHubでソースコードを公開しています。商用・非商用を問わず自由な利用が可能です。 NDLOCRについては国立国会図書館月報2022年11月号の特集記事でも紹介しています。
/NDLJP/status/1610557944952946688 >>263
公開されても自分でユーザーインターフェイスを作れる実際の利用者はまれでしょう
せっかくの技術を有効利用するためには、ユーザーインターフェースをどうやって提供するかという工夫がいると思います UIが云々というかコード書ける人間がこのスレにはほぼいないでしょ 既存のOCRアプリだってコアな部分は他社提供だったりするんじゃない?
NDLOCRも開発に金のかかるコア部分を自由利用で提供することで外回りを自由に追加して利用できるようにっていう
BtoBtoCみたいなかんじでしょう。
公費を使う以上はある程度の民間への刺激要素も必要でしょうし。 >>264
説明を読んだ限りだけどCLIで使えるみたいだよ ソースが分割されているからレイアウト認識や傾き補正だけを使うというのも出来そうね。
フォルダ構成みた感じコマンドライン実行で各処理を行った画像が生成出来るのかな。
興味はあるがパイソンって使ったこと無いんだよなあ。 epson scan 2のファイル名って自由に付けられないの? ちなみにWindows 10 1903以降なら、コマンドプロンプトにpythonと入力して、
入っていなければMicrosoft StoreのPythonの画面が表示されて、そこからインストールできるよ。 NDLOCR は CLI でも使えるけどそれも docker コンテナ前提だし、基本はサーバーにインストールしてweb経由とかで使う設計になってる。
自分でサーバー建てる知識があれば普通に使える感じだけど、そうじゃないとハードルは高いかも。 >>273
こういうところまでハードル下げてもらわないと技術が無駄になってしまう。国会図書館のデジタル化でけては恩恵が低い 自分が無能なのに...
と煽ってみる
ごめんなさい、ごめんなさい。 よく分からんけどmain.pyを実行するだけでは動かないの? requirements.txtに書かれているソフトを用意するのに四苦八苦してるところ pip install -r requirements.txt
で入らんか? 雑誌を全てタブレットに入れようと思うんだけどお勧めないですか
用途は自炊した雑誌の閲覧で、かつ書き込みをしたいのだけれど 何をお勧めして欲しいのか分からない。
タブレットの機種なのか、ビューアアプリなのか、ファイル形式なのか。 なるほど雑誌だな
ジャンプがいいのか文春がいいのかって話だ >>277
依存するツールやライブラリが多数あって 複雑なので main.py が動くようになるまでが大変といったところ。
依存関係を解決しやすくするために docker を使って環境を構築し、その中で main.py を動かす感じ。
もしくは javaで書かれたWebUI を起動して経由でアクセスする。
普段からサーバーの構築とかやってる人には余裕だけど、やったことない人や、むりやり手元のPCで動かそうとかするとひと手間かかる。 NDLOCR
・クローン
git clone --recursive https://github.com/ndl-lab/ndlocr_cli
・Docker Desktop for Windowsのインストール
https://docs.docker.com/engine/install/
・ターミナルからdockerコンテナのビルド
cd ndlocr_cli
docker\dockerbuild.bat
とやったけどdockerコンテナのビルドに失敗してうまくいかなかった
GPUが750tiだから対応してないのかな
数GBダウンロードするので回線が細いと時間かかるね
環境は
Windows 11 22H2
GeForce GTX 750 Ti
RAM 16GB >>284
雑誌だと中綴じか無線綴じか、カラーページや折り込みが多いかどうか、紙質はどうか、とかで判断だな。
A4を超える大型の雑誌は最初から手を出さないのが無難。 >>286他、そこそこ忙しく専門的な知識がある人でもうまくいかないのに技術を公開してても役に立たない
公的資金を使うプロジェクトはほぼ自己満足 そのうちうまいことラップして使いやすくしたのを作ってくれるよ
そんな人が一人いればいいんだから これソフトウェアなのにクリエイティブコモンズライセンスなのかよw >>290
その工程が一番面倒かつ本人にとってはあまり意味無いのよね >>271
保存ファイル名の入力欄をクリックして、開いたメニューから設定を選択。 https://i.imgur.com/aZgXpQ1.png
ここまでしか設定できない
YYYYMMDD_hhmmss?? という感じ
やりたいのは、
YYYYMMDDhhmmss 286氏に触発されて…
NDLOCRの中の自動傾き補正ツールだけを取り出して動かすのを試してみた
環境: MX Linux 21.1 x64 (Windowsホスト下のVirtualBox仮想)
RAM: 3GB
synaptic package managerを使って
python3-opencv, python3-skimage をインストール
ターミナル内で以下を実行(展開場所の名称ndlは好みに応じて変更ok)
mkdir ~/ndl
cd ~/ndl
git clone https://github.com/ndl-lab/deskew_HT
これで準備完了。使用法はターミナル内で以下を実行
cd (処理したい画像のある作業ディレクトリ)
python3 ~/ndl/deskew_HT/run_deskew.py 001.jpg -o output001.jpg NDLOCR。よく見たらGPU使ってるじゃん。
NVIDIA機でないと動かないんじゃ、ますます敷居が上がる。
所詮はお役所のやることか。 >>297
Windows 11 python3.11で傾き補正は動いた
Scikit-imageをここから入手してインストール
https://www.lfd.uci.edu/~gohlke/pythonlibs/
https://i.stack.imgur.com/ils0K.png
これとか設定を詰める必要がありそう
-a ANGLE_ACC, --angle_acc ANGLE_ACC
傾きの探索を何度単位で行うか。default: 0.5[deg]
0より大きいSKEW_MAX以下の値を指定する。小さくするほど処理時間は増加。 >>298
OCRに使っているTensorFlowがGPUを要求するんだけどCPU版もあるから… うちのGPUはTensor Core無いんだよな
自宅でAIできると便利な時代がそろそろ来そうだし、次はTensor Coreありにしよう >>300
ちょっとぐぐったら、TensorFlow-DirectMLとやらがAMDやIntelのGPUに対応しているらしいが、
DirectXを使うのでWindowsとWSL向けになるとかなんとか。 軽くソース読んでみたけど、傾き補正はまあ定番のエッジ検出+ハフ変換だった
kakulalynがオリジナルでこっちはまあpythonで傾き補正書くならこうなるよねっていう至って普通のもの
ただそこからNDLOCR用alyn3とかいって謎の書き換えを行っているのが謎
オリジナルにはANGLE_ACCなんて意味不明なパラメータ存在しないし
なんていうか、大変やねえ >>300
layout 検出に MMDetection とか使ってるようだから CUDA 無しだとまともに動かんのでは? 裁断機の受け木を買ったよ…888円、コレでキレイに切れるやろ NDL OCR 試したいんならマニュアルからリンクにある Google colab で使うのがお手軽だった。
nvidia の GPU 有料だけど、お試してで無料でかなりの量使えるし、その後も1000円で100コンピューティング・ユニット購入できて、1ユニットで200ページくらいOCRできる。
使用もクリック数回で初期化して、Google Drive を入力元と、出力先に指定してクリック1回で実行なので専門知識なくても使える。
欠点としてメモリが足りないのか、PDFが100ページくらいなら動くけど、200ページだと失敗する。 あと1万ページくらいOCRした感想として、
・認識精度は思ったより良好だが、難しい漢字は〓になる
・ノンブルや柱が本文とは別に認識されるのは便利
・オプションでルビの認識はできるが出力が親字と結びつけられていない
・割注とかにも対応してる模様
・でもルビや小さな文字の認識制度が良くない
・空白を無視する(?の後の全角空白とかを勝手に詰める)
・あくまで文字を txt と xml で吐き出すだけなので、透過文字埋め込みPDFとか欲しい場合には埋め込みプログラムは別途必要
・XML出力は文字単位なくて行単位なので、埋め込み処理の位置合わせが困難。場合によっては無理
といった感じ。 佳代さんがN.Y. 行く場合のビザってどれになるの。
短期の観光旅行でもいいのかもしれんが。 >>311
OCRってePubの様にしてくれると思ってたら、不細工な箇条書きに為るだけやった
本一冊通せ無いやん、PDFかJPEGのデカイファイルにするしかないわ、手間vsデカイHDDで、、HDDの買い増しと >>311
詳しい説明ありがとうございました。
自分が OCR で一番困っているのは日本語の縦書き文章と図表の横書きの注書きが混在している時に区分けをしてそれで正しく縦書きと横書きで認識してくれないことです
経験があるなら教えてほしいのですが NDL ではこれらの問題もうまく処理できるでしょうか
後透明文字を PDF に重ねるプログラムの作り方で参考になるような資料をご存知でしたら教えてください >>317
OCR そのものではないけれど OCR の活用で密接に関連している技術であることは間違いない
それに文字位置検出は文字認識時に同時にやれるような気がしない? pdfに文字を入れるのはOCRが不完全故の妥協案みたいなもんな気がする
ちゃんとテキスト化できればもう失われる情報はフォントの種類くらい
元画像なんか捨ててしまって構わない 100%完全に認識できるなんてありえない
数文字不明なだけで元の文章の意味が分からなくなることは結構ある
元画像を捨ててしまったら正しい文字がわからず正しい文章も分からなくなる
精度が高くなっても透明文字による重ね合わせというの必要だと思う >>320
いやフォント情報とか文字サイズ情報とか文字色とか網掛けも重要だろう。
そういうのも一緒に認識してくれるOCRがあれば良いんだけど。 >>316
私の試したやつだと縦書きと横書きはほぼ完璧に認識した。 pdfの見た目を生成するソースファイルがあったとして、
その情報にまで完全に戻してくれるならそっちの方がいい
とにかく画像捨てたい >>323
ありがとう
310の方法で私も試してみます ScanSnap ix1600に付いてきたKofax Power PDF Standardはなかなか精度が良いと思う OCNに限らずスキャンしても原稿捨てられない
舐めるようにチェックして問題ないこと確認して満足できるまでは durodex 200dxと180dxとっちがいいですか? 大は小を兼ねるので200DXがおすすめ
180DXは1.5mm厚、200DXは1.8mm厚でたった3mmしか変わらんけど1.8mmギリギリの本って結構多いから分割の手間が減る いま10000円ぐらいの中華裁断機使ってるんだけど
200DXに4万出す価値ある? 価値なんて自分が感じられるかどうかなんだから
他人に聞いてる時点で価値は無いと思うよ 200DX使ってる。
不器用だから中華裁断機は怖い。 本は大きさがあるから制限があるけど、
HDDの整理しようとか思い立つと永久に終わらない ヤフオクでガキの頃読んでた漫画100冊セット格安で手に入れたこれでしばらく弾には困らないな
まぁ1回読んでそれ以降読み直すことはないんだろうけど Google Photoのドキュメント画像の平面補正トリミングはすごいな
これさえあれば、もはや安い書画カメラは要らんわ 漫画はどんどん読めるしな
そのせいですぐに棚が埋まるので安くてもほいほい買えない
漫画読みは最初から電子化されてるか自力で電子化するかの二択 ヤフオクでやたらと気が合う人たまにいるな
やり取りのテンポがぴったりで
お互い褒め合ったりw 金が欲しくてオクに出す訳じゃない、という側面があるしな
燃えるゴミに出してしまうとこの本はここで終わってしまうので、
次の持ち主に渡っていって欲しい
自分も古本で買ったなら特に 裁断した時点で終わってると思ってるから処分してるなぁ
中古で買ったものをさらに流すと堂々巡りになるから新品買われる機会減らしてしまいそうだし 漫画はもうエロ漫画だけやな、自炊する価値があるのはな
エロ漫画は電子と紙で修正が違うし、電子で売ってるとも限らないんだよな そのうち読めなくなるとか、勝手に差し替えられるというリスクもある >>346
自炊する価値のあるエ****無修正の物ってあるんかい? 漫画サイトによってはパンチラでさえドデカい黒マスクされてるんだよねぇ
あれ逆にエロいわ >>344
せやかて解体した本をヤフオクに流すって事は
おそらく自炊した後の本であって、それってどうなのよっておもったりもしなかったりもする 正直電子化すら怠った絶版書籍は保護されるべきではないと思うが
あくまで個人的な思いだが >>352
著作権的にも自炊はグレーらしいが…自炊だけならホワイトだが、信用して無いからグレー呼ばわり
裁断済≒自炊済を流すのは真っ黒なんだ、だから儂はヤラない >>354
真っ黒な理由は何? 道徳の話をしてるの?
法律的には白って弁護士が解説してるの見た記憶があるけど。 法的にはコピー機でコピーしたあとの本を売るようなもんなのかな
オクで売るとか現実的には時間の無駄だしそんなことよくやるなと思う 後ろめたい気持ちがあるかどうかは個人次第だろうが
そういう特殊なレアケースの人を例に出して
自炊全般にダーティーな印象をすりつけられるのはいい迷惑だな
つうかみっともないと思うね
自分はね 借りた本を非破壊で自炊するのだって私的利用する分には法的に何ら問題ないしな
ましてや自分で買った本を自炊して、オリジナルを売り払ったとしてなんら他人に咎められるいわれはない
なにせ自分のものなんだから 自炊 … 合法
裁断済みの本を売る … 合法
裁断済みの本を売るなんて面倒なこと俺はやらないで速攻捨てるし、
ページ抜けの保証のしようがない裁断済みの本の購入もする気はないよ。 P2Pでポエム交換してるとか抜かしてた奴らと、裁断済みの本売っておいて自炊はしてませんって言ってる奴らは同類だよな 著作権法自体はアナログ時代の基準で出来ているので、コピーは劣化を伴うという考えが根底にある。
なのでコピー=劣化の伴った自分のためだけのものという解釈が通りがち。
なのでコピーを手元に残して原本を手放すことを明確に禁止していない。コピーを譲渡した時点で罪になる。
一方デジタルになって無劣化コピーができてしまうので
デジタル媒体に対して慌ててコピーによる著作者の権益侵害という考えになり
著作権料負担のあるブランクメディアなどが出てくるようになった。
ソフトウェアはバックアップという利用上当然の行為との争いの結果、
コピーは不許可出来ないとなり、原本と統一保管という妥協点が出来た。
たしかソフトウェアのバックアップ議論は裁判になったはず。 実際、自炊している人間にやたらと攻撃的な人はいるな
なんでか知らないが 経験則やヒューリスティックスで処理すると違法になりやすいからね
頭を使って考えよう やりたきゃオークションのスレなりでやればよい話だから
スレ違い
ここ自炊技術スレだし 自炊後の裁断本の売却は合法だと言う弁護士の説明のリンクをテンプルに貼っとけばいい
定期的に素人の非合法説が湧いて出るのは鬱陶しい いやその弁護士の説明信じてどっかと係争して損失出したらどうすんだよ
持論を述べただけで判例とかないだろ
弁護士なんて我田引水で割といい加減だぞ 弁護士は公平ではないという大前提がある
金を積まれて無理やりにでも依頼者を勝たせるのが弁護士
自炊反対派に都合の良い解釈を書けと頼まれれば躊躇いなく従う 著作権法をちゃんと勉強したことがあるから、こんなもん議論の余地もないんだが
なぜか定期的に変なの湧くよな [問1]文中の( )にあてはまる語句を答えなさい。
金持ち( )せず
[答え]自炊 >>374
>>376
一般論としてはそうだが自炊本の売却に関するインタビューをどっちかの派が金だしてしゃべらせているという解釈に無理があるだろう。
一般論を適用すべき状況かどうかの判断ができない時点でお前ら終わってるよ 無責任なものをテンプレに貼ろうとするんじゃないと言うのが俺の意見だが
反論されたら人格攻撃って時点でおまえの話は聞く価値ないと思われるだけだぞ >>380
では、訴訟されたことがなく判例はないので自己責任で、というヘッジクローズを入れとけばいいだろ(笑)
判例がないことが全てを語ってると思うが、それがわからんみたいだな(笑) わからんな
テンプレに載せるというのは大体の場合スレの総意ということだが
おまえの意見に賛成する奴はどれほどいるのか 裁断本を売るような人なんて日本で数えられる人数しかいなのでは
そんなレアケースについて話をしてもしょうがない アホが時々湧いてくるだけだから、載せときゃ総意に近くなるよ
でも僕は反対だと言う頑固者は絶滅しないけどな じゃ俺は反対を表明する
理由は何度も言うが無責任だからだ なんの役にも立たない不快なだけの話
誰だよこんな話題出したのは 裁断本販売の話は法律スレへ
にでもしたら?
ここ技術スレですよ? 本を終わりにしたくないという思いは、次の人に売るよりも、
ネットにばら撒く方が効率的に達成されるけどな 表紙カバーをカットしてスキャンしている人いる?
カットせずスキャンして必要に応じて加工すればいいと思うんだけど、あえてカットしてスキャンしている理由が知りたい。 >>391
単に裁断とスキャンの手間を減らしてるだけや >>391
同じく
加工よりカットの方が楽だからカットしちゃう >>391
スキャンする前にサイズを本体とあわせておいたほうがあとが楽というだけ 折るよりも切って平面に近づけた方がきれいにスキャンできるから カットはしてないが、
カバーはフラベを使っているので必然的に面積不足
折り目を目立たなくするためにスキャンの向きも重要
結果として1枚のカバー画像にはならないな。 折り目の影響で色が飛ぶことがあるからかな
切る手間とトリミングする手間を天秤して後者にしてるけど切った方が綺麗にできる
https://i.imgur.com/PV964YG.jpg >>391
うちのスキャナだと大型本はサイズ的に切らないとスキャンできない。
文庫やコミックはそのままスキャンして、自作ツールでデータ的に分割してる やっぱ金とか銀とか反射する表紙はみんなあきらめてるの?
透明度高めのクリアカバー挟んでスキャンする感じ? >>391
雑誌がメインだから記事が大事なので、表紙ごと裁断して、表紙とカラーぺーだけカラーでスキャン、中身はグレーでスキャン
最後にドッキングして完成 >>400
裁断するやり方でも表紙くらいならマクロレンズで撮ればいいんでない?
一眼といわずともスマホで十分な気がする >>391
カットしない。
A3フラットベッド(A3よりちょっと大きいのを使ってる)に入る表紙カバーはそれでスキャン、
入らないのはA3 ADFでスキャンしてる。
20kg以上あるようなA3 ADFスキャナだと、折り目がついたまま突っ込んでも
綺麗に平らにスキャンできるのがいい。 A3フラットヘッドスキャナがあれば、レコードジャケットだっていけるは >>402
ありがとう!
スキャナー以外の機材使うのは頭になかったわ ヤフオクは毎回ストレスだな
ある日突然これまでの決済方法が使えなくなっていたり
それで落札者が悪者になってしまうことがあったり
不信感だらけ
しっかり告知をしたり改善したりもする気ないしな
そういうギャンブル感が人を引き付けるのかもしれないが だいたい本の表紙とかだし中身じゃないから気にしてないわ反射素材
ADFスキャナに反射素材モードとかありゃいいのにね >>409
> いつかはやりたいリグ組んで一眼で撮影
スマホのカメラを利用した書画カメラを制作したんだが、ページ捲りが面倒臭いから、、スマホの充電スタンドに為ってる パシャ、ピーピーピーピーピー
いいねえ、もう1枚めくってみようか
パシャ、ピーピーピーピーピー >>409
リグだけならミスミでアルミフレーム注文すれば安価にすぐ作れるよ
レリーズとマクロレンズとボディはそれぞれ2台ずつ同じものをジャンクでいいんだけど、給電撮影機能は必須 一時期一眼レフでやったけど結果は良くなかったな
三脚据えて2灯で無反射ガラス使ってマクロレンズ使った
カメラはニコンD850でレンズはタムロンSP90
でもマクロレンズなくても最短撮影距離が短めな中望遠で良かった
無反射ガラス使うとシャッキリしないのでレタッチかなり必要でかえって手間がかかったな >>413
セクシーとエロの違いは汗のあるなしだとアラーキーが説明してたは アレ除去と見えて、モザイクやボカシの除去のことかと思った。 きょうの日記
WEBページをPDFにすると画像が切れるのも気に入らない
PDF依存もいかがなものかとフローテキストも視野に入れつつ
そろそろビューアーも入れ替えようかとマイクロソフトストアを物色
epub兼PDFビューアが多数あり狂喜乱舞
でもバグバグだったり検索機能さえなかったり文字の選択さえ出来なかったり
さらにPDFも開けないものだらけ
試しにepubファイルで読書してみたものの
文字のサイズを変えるぐらいしか用がない
結局PDFが便利でいいじゃないかと思って一日を無駄にしたは fiだけど普通にあるぞ
誤爆するしどうせ最終的には目視での確認が必須だから使ってないけど 実家の親の本棚から絶対に今じゃもう売れそうにない「福沢諭吉全集」を裁断自炊処分 昭和の民って、なぜか文学全集やら百科事典やら持ってるよな
全部で10万以上は確実にしそうなやつ 俺も小学校入学時に15冊セットの百科事典貰ったわ
実家帰れば未だにある 祖父の家の応接間の棚には分厚い本がたくさん入ってた
田舎だから昔はネットどころかTV放送すらろくになくて知識=本だったんだろうな 百科事典や全集をタナに飾っとくことが見栄を張る時期だったことがあったからね 実際、居間に置いてある百科事典で調べものをすることもあったしね。 調べものは図書館を使ってたな
百科事典って書いてるようで書いてないんだよね ガキの頃は外で遊ぶような子供じゃなかったから百科事典は知識を満たすいい遊び道具だったな
ファミコン来てから見向きもしなかくなったけど 平凡社の世界大百科事典のepwingは今でも使っていて、wikipediaよりも詳しいことが判る
ぐぐれば何でも判る時代になったというのは幻想で、今でも書籍でしか判らないことが大半 >>429
すこぶる便利な時代になって
新聞テレビは不要な人だらけ
書店、CDショップも跡形もなく消えた
でもみな賢くなった感じがしないのはなぜなんだぜと 普通にネット使って賢くなりそうな記事なんてサイエンス位のものだし 文章なら多少間違えてもOCRだからで済む話だろ
数字はまず間違わないので、困るのは住所とか氏名くらい
OCRで名寄せしようという試みが無謀なので、そこは諦めて人件費かけるしか
それ以外のテキストは、判ればいい >>436
ようわからんのだけど、何で最初からデジタルデータで入力しないの
取引先からも何でデジタルデータでもらわないのかな
デジタルデータだともらった方が改竄できるから? >>436
確認作業もAIにやらせたらいいとおもうの 過去の書類とかのデジタル化かと思ったら現在進行の話なのか
頭悪いとしか
そんなんを母集団にするから変な結果になるんだよ >>438
コロナの発生届はPDFとかエクセルを印刷して手書きが前提。
ネットでフォーム入力も出来るけど、そのIDをもらうのに2週間かかる。
IT後進国を痛感する。 パソコンに詳しくない人がいることを想像できないアホがいるな。 >>443
アナログネイティブ世代は引退して席を譲ってくれ 若い子がPC使えるかっていうと意外とそうでもないらしいがな
タブレット世代は逆にPC使えないらしい 新卒とかみんなパソコン使えないんだよな
それは日本特有の話で、アメリカや中国やインドの大学生はみんなPC使いまくり
日本だけなぜかデジタル苦手 >>443
国に出す補助金の申請用紙の雛形…フロッピーを市から貰ったんだが
箇条書きの書き込み枠に記入すると、、立派な申請書類に為るスグレモノ
開けて見たらExcelだったw、やり方は理解出来たがよく作ったものだよ
Excelはアイデア次第で万能なんやなと思い知ったわ
後任に聞くと、やり方は同じだがプリントアウトしての提出になったとか
誰かが提出したUSBメモリーにウイルスが付いていて、市役所全体に蔓延したとか、、紙ベース最強w >>448
米国は古くからタイプライターの国だから、小学生でも宿題とかタイプライター…PCで打って出すんだと
日本は習字の有る国だからね、文化の根本が違うんだよ
娘は小学生の頃からブラインドタッチが出来ていたが、儂は未だに出来ないんだわ、コレが年寄りのPC嫌いの原因かと思うよ 日本人は英語を筆記体で書けるけど、アメリカ人はもう年寄りしか書けない いや?
筆記体なんてもう20年前から学校で教えてないから
30代以下のほとんどは書けないと思うよ わし26才だけど、中1のはじめに筆記体自体は習った覚えがあるけど、本当に進学してもそれっきりで周りも解答用紙には普通に書いていたと思うな
理由は考えたことなかったけど、汚いとテストでちゃんと読み取ってもらえずバツつけられるからだろうか?
書くどころか読むのも無理だわ筆記体 >>450
57歳の俺は26歳のときに買ったマッキントッシュクラシック2が人生最初のキーボード。いまではVBAもPythonも出来るぞ。C++も多少わかる。
甘えるのもいい加減にしろよ。 >>457
儂は72才やで算盤と計算尺世代や、電卓も成人してから出回りだしたんや
しかも幼少の頃に大病をして、リハビリして、今はエミュレータで動いてる様なものなんや、おかげでストⅡの様なのも上手くできんのや >>461
AI に記憶と人格を移す自炊技術の話かな >>461
俺の母親は78歳だけど、Windowsを使ってるぞ。甘えるな! 私の伯父は94歳だが、Windowsのワードで同窓会の会報とか作っているぞ。まあ、元編集者だから慣れてたのかもしれんが もうその歳までくると遺産のスキャンデータをどうするか悩む時期だよね
お棺にハードディスク入れて貰うか 昔造ったフィギュアを3Dスキャナーで取り込んでデジタル化した。
これも自炊かな? そういうスレあるのかな
最近割とメジャーな技術だけど ダーレは180DXで十分だった、部屋軽くなって快適 毎回の引っ越しで一番問題であったコミックと映画と芝居の紙媒体約2000冊全てをスキャンし、PDF化したら、256GのSDカードに入ってしまった。
それもスマホの中に。スキャン画像マスターは持ち運びできる1TのusbHDDに入れた。
これで自身の終活のための第一歩を記す。 バックアップとしてネットに置いて
自分でも持っておきたい >>471
正副予備バックアップ。それぞれをどれで担うかという問題
みなさんはどうしてます? HDDとUSBメモリ(ポータブルSSD)
フラッシュメモリとSSDは稀に一発で逝くことがあるからHDD必須 単にバックアップとして使うのか、日頃からアクセスするかで違ってくる >>473
HDDx1のNAS…宅内配信用
HDDx2の外付けHDDをミラーで、コチラがメイン
その代わりPCは500GBのミニPC 下の画像のように余白の多いページをスキャンすると黒い斑点のような汚れが
でてしまうんですが、これはそういう仕様なのでしょうか
Scansnap IX1500、白黒、スーパーファイン設定でスキャンしています
https://imgur.com/vcbp1YU
文字が多いページはキレイなのに、余白が多いページだけ斑点がでるので
気になっています >>479
lightroomとか買ってjpgを一括処理するか業者に頼む 白黒の閾値を計算する時に黒い部分が少ないと斑点が浮き出るまで行ってしまう 仕様だったらどうしようもないですね
内部の汚れが原因なのかと掃除もしてみたのですが、仕様なら諦めがつきました
ありがとうございました そもそも白黒でスキャンするのが信じられない
取り返しの付かない処理は極力先送りが原則 このスレで白黒スキャンで満足する人がそこそこと理解したわ >>484
ほんとそれ
いやまあ「読めりゃいい」ってレベルの人がわざわざ自炊なんて面倒なことをするんだな、って学べたのがこのスレの収穫 グレースケールスキャンは使うけど、白黒スキャンは使わないなあ グレスケカラーを分けてスキャンからレベル補正して減色PNG
俺の中ではこれが「読めりゃいい」ってレベル 細かいこと気にしてる間に一冊でも読む方がいいと思うけどな、納得いくデータができた頃には読む時間が無いなんてことになりそう
BOOXとかだと設定で消せるし カラーでスキャンしたまま何もしない、というのが一番手間かからない 挿絵が多い本はグレースケールでスキャンしました
文字主体の本は文字がくっきり出るので白黒のほうがいいかなと思って
まだ自炊始めたばかりなのでグレースケールで再スキャンするかもしれません >>487
専門書やビジネス書が対象なんで、モノクロスキャンがデフォルトで、スキャン後ページを確認して図が見にくいページだけグレイスキャンでやり直して図の部分だけ切り取って合成してる。
モノクロをデフォルトにした理由は、グレースケールだと裏写りが発生する場合があること、モノクロの方が文字が綺麗、E インク端末で読むときはファイルサイズが小さい方がいい、という理由。
グレースケールをデフォルトにしてコントラスト強めとかスキャン後にファイルの最適化や縮小も試したけれど、結局今の状態に落ち着いた。
図が多かったりカラーページが多い時はもちろんカラーやグレースケールでスキャンしてる。
コミックの自炊ならモノクロはあり得ないだろうね。 あれここの住人の使ってるスキャナーってScanSnap ix1500が多いのかって勝手に思ってだけど違うのかな 例えばグレスケ化一つとっても、Rチャンネルだけ残すのか、RGBからHSVに色空間変換して明度を取り出すのか
Luminanceを用いるのかで品質に大きな差が出るし、本の材質によって最適解は異なる
Rチャンネル残すのは昔、自炊の画質について気にする人達には定番の手法だったね。このスレのレベルじゃ話題にすらならないけど
ま、気にしない人はスキャナの適当補正だけでいいと思うよ 私がグレイスケールでスキャンするのはスキャン速度を上げるため。
カラーだとUSBの転送速度がボトルネックになるので、データが小さいグレイスケールを使用する。
そのためグレイスケールの仕様はハード内蔵のものになるので自分では調整できない。 満足の度合いは人によって違うから。
自分は数千冊スキャンするので、1冊1時間とか補正してられない。 補正なんていつでもできるしな
暇が無限にできたらやるかも 補正なんてボタン一発で一括加工出来るようにしてるからなあ
手動で1ページずつやるしか選択肢がないなら、まー現実問題として無理があるよね >>491
A面B面でトーン違うもんな
ばらばらに >>494
儂は安い中古のエプソンのDS-510、、 プログラミング得意そうな人がちょこちょこいそうだから聞いてみるけど、scansnapの縦筋軽減処理ってどうやってると思う? やっぱりそんなもんなのかな
縦筋の存在認識と位置認識はどうやってると思う? ある縦列を構成する全ての行の要素(色or明度)が一定値以下にならない、って条件だろうか
明度に絞って閾値も最低輝度+αもしくは雑に白+αを基準にしてしまってもそれなりに検出出来そう いくら技術的な話題を振っても全く食いついてこないので
>>502の言う通り自炊技術総合スレじゃなくて素早い解体技術スレです いまのところ実装してるのがグレスケ限定で縦数ピクセルの閾値以上で検出的なシロモノなんだけど、全ての縦列ってすると一部だけ黒塗りのページで検出できないし、現状の縦数ピクセルだとデカメのオノマトペの枠なんかで検出しちゃうので行き詰まってるんだよね
明度とかで分けるのはカラー版に使えそうなのでいいこと聞いた 507の「最低輝度」というのは表現が良く無かった
十分伝わってるとは思うけど
ある列が上から下まで一度も明るくならないって考えれば良いと思う 紙への印刷は方向が少し傾くし、裁断でもスキャンでも完全な垂直は出ない。
解像度にもよるけど、印刷の線は一定以上の太さを持つ。
よってY軸が完全に揃った細い線は縦筋でほぼ間違いない。最終的には紛らわしいのを自動ピックアップして人間に判断させる。 >>511
私がやってる検知処理の話ね。
スキャン時に自動で見つけてるので補正じゃなくて、掃除して再スキャンするのが普通。
後から見つけた時のために、周辺のドットから失われた部分を推測して再現するプログラムも書いたけどあまる使って 裁断した本…ページが全部同じ幅ではないからガイドに余裕を与えてるし、紙送りローラーも均質に送ってくれないし
紙が若干斜めに送られるのなんて当然だから気にしてたら作業が捗らん
1冊分を通したらザッと見て、クシャやヒゲで誤検知してるのをやり直すだけでどんどん進めているよ なるほど
ちょっと細かく聞きたいんだけど、それってわりと粗大な紙粉で、グレスケでいうとやや濃いめの灰色ぐらいの縦筋想定ですか?例えばコントラスト補正なしscansnapで白背景信号値=240で黒塗り=50として、縦筋=200とかの
で、縦1列全pxが閾値210以下の列は縦線として、左右pxから信号値もらって補完みたいな? >>515
縦筋ノイズが中途半端な色かもしれないし印字された文字と被ることも考えるなら2値化して判定の方がいいのかもしれないね いま出てるアイデアだと
@1列完全に揃ったら縦筋→傾き補正オフ状態で完全に揃った縦線pxが数100px続いたら検知疑い...の条件ならいけるか
A2値化すると存在検知はシンプルになるけど、位置認識が甘くなるので補正にはもう一手間必要
Bさっきのアルゴリズムだと白背景に馴染む細くて薄い一番厄介な縦筋は検知できないし、そもそも黒ベタページで常に誤検知
ひとまず現状の方向性で間違ってない、というかそれしかないことはわかった べた塗か否かを判断してべた塗なのに一列そろったノイズがあったら縦筋ノイズとする 縦線検出ソフトがあると良いね
フォルダの中の画像全て又はPDFの全ページ一気に
少し厳しめの判定の方が取りこぼしがない
最終的には人間が目視で判断する 同じサイズの白と黒の色紙を間に何枚か挟んでスキャンすればいいよ 縦線の始まりや終わりなど1ページ内に半端に生じた縦線の対処が難しいね。
ページ全体~複数ページにわたる縦線は画像の上端とか下端を切り取って並べれば
人間の目でも普通に一発で判断できる。
でも静電気対策したりガラスの撥水剤をスキャナのセンサーガラスに塗布してスキャンすると
縦線も1ページ未満で終わることが多いから判別が難しくなるけれど。 >>520
あると良いね、確かに
君が作って公開したら喜ばれるよ? 。。。φ(ー`)メモメモ・・・ボキ!!☆(□`;)!!・・・(-_-)あ~あ~・・・ 縦線消してって日本語で指示するだけで解決してくれるAIかもーん モザイク消して!
黒斜め線消して!
白抜き補完して! B5の漫画雑誌のスキャン用として検討してるんだけど、
おすすめのスキャナーって現行機だとどの辺りになります?
スキャン対象としては白黒ページ、2色カラーページ、フルカラーのページって感じ。 Panasonicのドキュメントスキャナーの吸い取りゴムは蟻で互換品が売られているので心配無用だ 古い雑誌を裁断しようとしたら、、ホチキス留めだった…200冊くらいあるんだよ
途中からホチキス無しになるんかなぁ
ホチキスを外さず、深めに裁断するか、、 のどに情報がないなら深めの裁断でいいけどそうでないならホチキス外すべき 古い雑誌ならあんまり折り目深くまで印刷してないような印象 ラジオペンチでホチキスの先を起こして、背から引っこ抜いたり
真中のページでホチキスの左右をそれぞれ裁断したりした そういや俺もNewtonスキャンするとき芯外したなぁ
50冊ほどだけどけっこう面倒だったわ 裁断機、簡単に刃こぼれするから本当に気をつけてね
断面は汚くなるわ裁断に力は要るようになるわで最悪よ 以前ギリギリに攻めて刃こぼれさせた時は 研ぐのが大変だったからね 自分で研いだよ、先ず厚板にネジ止めして、更にそれをテーブルに固定して、砥石でゴシゴシ 裁断機だと高い(9千円位)けど研ぎなおしと調整ををメーカーでやってくれないか? 見開きスキャンの影消しソフトないかなShadowCutはうまくいかなかった images2epub.pyというスキャンデータを固定レイアウトのepubに変換するスクリプト便利だな 変換するのはpaperwhiteで読みたい時だけだから、未だにChainLPで必要十分 やや古めの白黒の本を裁断してOCRかけてPDFにする作業を大量にする際、予算15万前後までで一番いいのはどれなんでしょうか。
できるだけ綺麗にスキャンしたいので、ds-970かdr-m260あたりがいいのかと迷っていますが、epsonはここではあまり評判がよくなさそうですね。 最難関はOCR部分だな
AIでないOCRはあまり期待しない方がいい >>551
AI の OCR って何があるの?
一般ユーザが使えて PDF に透明文字を重ねることがある aiocr って見たことないんだけど OCR部分と文字を重ねる部分は別のツールでやっても良いんだぜ。 別のツールで重ねようとするなら文字と一緒に座標とかの情報も要るけど、
そこまで出力するならついでに重ねろよ、になる
完璧なテキストが得られるならそれがpdfでどこにあったかは知る必要が無い
結局、OCRが不完全だから詳細は目で確認してね、という逃げでしかない どんなOCRでも完璧ではなくて、必ず読み取りミスが交じる。理想論をいっても仕方ないな。そもそも文脈読まないと区別できない文字もある。
1. OCRで認識したテキストと座標を読み出す
2. 読み取りミスした箇所を手作業で修正する
3. 修正したテキストをPDFに埋め込む
というのが私の手順。賢いOCRを使うと2.の修正が楽になる。 >>556
1. そういう機能のあるOCRを使う。XML出力とかそういう機能名。
3. そのためのプログラムが 1. に付属してたり、ネットに転がってるの拾ってくる
私は 3. は自作した。 python の reportlab ライブラリ使うと楽。 >>557
3.のPDFは縦書きも位置情報付きで埋込み可能です?
hocr-pdfを使ったものは何年も前からOCRスレで公開されてるんだけど
hocr-pdfライブラリが縦書きに対応してなくて作者氏もお手上げの模様
1.に関してははGCVとか縦書きでもちゃんと座標取れるんだけど >>557
1ができてかつ AI で認識するような OCR はあるんですか?片一方ができる OCR はあると思うんですけどポイントは両方できる OCR ですよね。
さらに日本語の縦書きアルファベット混在をきちんと識別できる AI 機能が付いているという条件だと ないんじゃないですか >>559
Google Cloud Vision API >>560
やっぱりGoogle Cloud Vision APIになるんですかね。Google Cloud Vision APIでAI 付き OCR を利用するための手順を分かりやすく書いた資料をご存知だったら教えてください
あとはPythonはまだ知らないですけど必需品ですよね
この際勉強をするしかないですね google CloudのUIしょっちゅう変わるから最新の手順がどうなってるのかよく知らんけど
Qiitaあたりでキーワード入れたら出てくるんじゃない?
GCVのOCRを元にPDF作るツールは以下、縦書き未対応
【文字認識】OCRソフト【 自炊 】
https://egg.5ch.net/test/read.cgi/software/1470745451/168-189 縦書きに対応するために 3. を自作した。
最近は NDL を改造して 1. に使えないか試行錯誤中 (デフォルトだと位置情報が行単位で今ひとつ) jpgみたいな不可逆圧縮だと精度が大幅に落ちるんだっけかocr? >>565
そうなのか
そうだったのか…
自炊完遂する前にお前に出会いたかったぜ AIなら関係ないだろうな
読めるかどうかの話だから
画像的に重ね合わせたりする場合は、縁が中間の階調になってたりすると判定できない
解像度もかなり必要 >>566
ノイズが目に見えるほど圧縮したのか
品質90以上なら全然余裕だと思うけど >>564
jpg画像からだと認識精度が低かったので、二値階調のtifで再スキャンしたら、
飛躍的と言っていいくらいOCRの認識率が向上したな。
まあteseeract-ocrのVer.3の頃の話だが。
画像変換ツールでjpg→tifだとダメだったが、カスレ気味のjpgスキャン画像を
濃くする手段ってないかな。 >>562
だよねえ。
久しぶりに使うとエラー出まくりで焦るよね。 EPUB3.3でwebpが正式に採用されたから脱jpgを考えてもいいかな 裁断した本が冷えてるとスキャナーの紙送りが上手くいかん、PCルームで1日放置したら機嫌が治ったわ、乾燥したほうが良いのかな 乾燥した方が静電気は起きやすいけど、
トライボロジーなくっつき方は乾燥してる方が有利な筈 加湿器付き空清機で適度な湿度を保ちつつ縦線の原因になるホコリや最近飛び始めた花粉も減らしながらやってるわ 静電気除去ピストルが職場にあって、面白いくらい効くけど結構高いな ガンマどうしようかな
デフォルトでは2.2だけど眠い
文字がかすれてる
1.0の方がはっきり見えるけど色がどぎついし、細かいところが潰れてたりする 早稲田大学 早水桃子研究室さんはTwitterを使っています
ついったー/hayamizu_lab/status/1628022108939747328
「紙の丸まりや反射を抑えてスマホで綺麗に撮るための透明な板が欲しい」と看板ショップ楽天市場店さんに相談したら、なんと自ら実験して3mm厚のノングレアアクリル板という裏メニューを作って頂けました??ガラスより低反射&割れないので安心??A4サイズならクリアファイルにスッキリ収納可能です テキトーなアクリル板とは違うのかな
反射して使えなかったわ 最近自炊を始めた初心者です
使っているうちに機材はある程度劣化していくと思いますが、スキャン品質も結構変わりますか?
まだ機材が新しいうちに大事な本や、綺麗に取っておきたい本から自炊した方がいいでしょうか
ちなみにスキャナーはエプソンのDS-531です CMOSセンサが劣化するのかという話
多少はするだろうけど、問題にはなってないから人間には判らないだろう
機械的に壊れるとか傷が付くとかもっといい機種が出るとかで製品寿命が終わる 消耗品の交換や清掃をするのが前提だが、
機材の劣化に伴う故障が起きても、
読み込み品質が低下するということはないと思う やってるうちに技術が向上するから大切な本は後回しにした方がいいよ みなさんありがとうございます
スキャン品質は特に変わらなさそうですね
確かに物理的に壊れる方が早そう…
大事な本は後回しにします スキャンが劣化するよりも自分が劣化(許せる範囲が最適化)するのが早い 老眼で細かいところが見えなくなるから、細部はどうでもよくなる。
読む気力がなくなってどうせ開かないのは分かっているから、多少のことはどうでもよくなる。
溜め込む情熱もなくなるから、処理数も減る。
残された時間を思うから・・
(´・ω・`) 質問です。自炊初心者です。
自炊したpdfをKindle端末で読んでいる方はいらっしゃいますか?
私は漫画以外の字だけの電子書籍の読書はKindle端末で読んでいるのですが、自炊したファイルは、Kindle端末よりもサイズが大きい四六判やハードカバー以上などは字が潰れてしまうのです。
タブレットでは綺麗に表示されます。
Kindle端末で綺麗に表示されないのは諦めるしかないのでしょうか?
このスレの猛者の方、ご教示いただけましたら嬉しいです。 >>592
すみません、記載しておりませんでした。
2020年10月に購入した、Kindle Oasis 色調調節ライト搭載 wifi 32GBです。 あ、高い奴だ
こういうのは雑に作って端末で縮小して見るんじゃなくて、
最初から端末を限定して拡大も縮小もせずにドットバイドットで表示させるのが定石
そうすれば、データをPCで見て読めれば端末でも読めることは確約される
小さすぎて老眼鏡が要るとかは別の話 kobomini用にdotbydotで作ってからその技術を忘れてしまったのでずっとkobomini使い続けてる… >>594
アドバイスをくださり、ありがとうございます。
「最初から端末を限定して拡大も縮小もせずにドットバイドットで表示させる」
↑
Kindleに限定して、等倍で表示できたら最高です。
今は、裁断してScanSnap1600でスキャンしてPDFにしているだけです。
どのようにしたらKindleに合わせてPDF化できるのでしょうか?
電子化されていない本をKindle端末で読めると思って、ワクワクして9万円かけて自炊セットを購入したのに、肝心のKindleで潰れてしまうので、ドッと落胆していました。
もしKindleに最適化できるのでしたら、本当に嬉しいです。 Kindle Oasis 色調調節ライト搭載 って、Amazon公式には、
7インチ
300ppi
としか書かれていないけど、誰か解像度分かる? あ、もしかしたら、そのドットバイドットでファイルを作ると、ファイルサイズがとても大きくなりますか?
現在は、大きくても1冊100MBくらい、最高でも200未満かなあ、くらいに思っておりますが、比較にならないほど大きくなってしまうでしょうか…?
しかし、そうだとしても方法は知っておきたいです。 必要最低限になるから小さくなる方向かな
うちでpaperwhite用に作る時は、ChainLPでmobiファイルを作る >>599
こんなドンピシャなソフトがあったのですね!
詳しくは調べて試してみますが、今まで作ったPDFをこれで小さくしたら綺麗に表示されるということでしょうか? >>597
300ppiって自分で言ってるじゃん
ppi = 1インチあたりのピクセル数 Kindle Oasisのピクセル数を調べないと
第9世代と同じ 1264x1680? 1インチあたりの300ピクセル?
7インチだと300x7で2100ピクセルしかないぞ…? sqr(1264^2+1680^2)=2102.4
だからほぼぴったり 1264x1680だと2123520ピクセルあるじゃん 画面サイズでいう7インチとは、画面の対角線の長さのことだよ
対角線の長さと、縦横比が分かれば、三平方の定理使って縦横の長さも分かる
で、縦横比が4:3なら、>>602 で大体合ってるやろ 何か変なこと言って混ぜ返そうとして失敗した人だから触らないであげて 自炊に関してはまず「手持ちの書物を電子化したい」と思ったらまずはスキャナで
PDF化保存して、その後で色々便利な読書方法とかの情報を集めるのがいいね。
コピーして色々試せるんだし。そうじゃないといつまでも自炊に踏み切れない。 自分はとにかく紙の本を捨てたかったから600dpi jpg最高画質でスキャンしてそのあと何もしてない
それ以降は電子版購入してるけど結構画質悪いからスキャンしたのも画質落としてもいいかな?なんて思ったり これからは300dpiでいいかな、なら判るけど、
過去のを圧縮しても時間かかるだけで何も得しない 最初からpdf、ってデメリットしか感じないな
とりあえず画像で持っておけば後からOCRでもpdf化でも好きに出来るんだし まあ、jpgをまとめただけのpdfは比較的簡単にバラせるけど、
zipの方が楽なのは間違いない 600dpiで読み込んで
↓
盲点除去
↓
300dpiに縮小
が一番綺麗に縮小できるな 端末に合わせてドットバイドットで電子化すると端末変えて解像度が微妙に上がった時に少し嫌な気になる スキャナの最高画質でスキャンしておいて保存しておく
端末に合わせて最適化してこちらで閲覧
これが答え ScanSnap1600、4万の時に買っときゃよかった
4.5~4.8からなかなか下がらない fiの方がいいって聞くね
なかなか手にする機会がない 中古だとscansnapがfiより高値安定の傾向。twain有無等より有名で普及してる方が安心なのかね。 >>625
両方使ってるけどハードは断然 fi の方が使いやすい。特にローラーの紙送りが安定してるのが良い。
付属アプリとかは好き嫌いあるので何とも言えない、私は linux から自作アプリで取り込みしてるので比較できないけど。 ただスキャンするだけならfiは宝の持ち腐れになるだけだよ fiってマンガのスキャンはどう?
ScanSnapはモアレがキツくて… 600dpiでのスキャンならモアレは基本出ないはず
300以下で撮ってるならそういうものと諦める
600でもモアレてるなら表示側(ビューア)の問題の可能性大
ドットバイドットでモアレてないか確認してみ カラースキャンのブツブツはロゼッタパターンでモアレとは別物だと知った スキャンする前には無かったのならスキャンで発生したモアレだろう
ロゼッタパターンは印刷で発生したモアレ >>631
サンキュー
気になるヤツはスーパーファインじゃなくてエクセレントで取るか 最近はDR-5010とかもオークションに出なくなったので、今使っているの(と予備機)が壊れたらどうするか悩むところ fiはスキャン速度早いのがありがたい
黒背景だから周囲に黒帯が出ることはあるけど90枚/180ページを重送なしでやってくれるのはすごい ただfiはたまに微妙にぐにょる時があるのが気になる。あれ、紙送りとかでどこかが引っ掛かってるとかなのかな? 漫画の枠線とかで見ると分かりやすいですが、本来直線の部分が弓なりの感じに歪むということですね。
スキャンされた画像の下の方で起きることが多いです。 プログラミングなどの技術書を自炊しようとしています。
CZURの6万ぐらいのを購入するか、
それとも他メーカー含めて3万くらいのでいいのか迷っているのですが、
やはり違いはあるのでしょうか? 非破壊スキャンは希少本でなければやる価値ないぞ
あんな虚無的な作業するくらいなら、もう一冊自炊用に買うか
電書版があるならそっちを買い増したほうがいい 専用ソフトの実力は知らんがスマホで事足りるが
踊るテキストでプログラミングを学ぶのは無理だったw
紙ならたわんでいても理解できるのに不思議 図書館の本を借りて、気になった部分だけ自炊します。
なので非破壊ですね。
ちなみに皆さん、PDFをみる端末はなんですか?
自分はkindle scribeかQUADERNOで迷ってます。 そんな部分コピー程度なら、スマホにonenote入れて
ドキュメントスキャンすれば充分だよ 技術書は高いし、何度も反芻するので
たとえ部分的にもやはり非破壊でスキャンしたいのです 図書館で必要な部分だけコピーは昔から普通にやってることだな
紙で手に入るかデータかの違いだけ
データ化が必須ならコンビニでスキャンできる
わざわざフラットベッドスキャナとかドキュメントスキャナの導入が必要そうには見えない
非破壊のスキャナは大変なので、それで図書館の本コピーしまくってウマーという話は聞いたことがない ドキュメントスキャナは歪むしフラットベッドスキャナは影
耐えられるかな? 技術書は読むというより、見るなので、ぜんぜん構いません。 だいたい技術書で繰り返して読む部分なんて限られてるだろ
保存目的でなければスマホで撮ってトリミングすりゃいいよ 質問者 >640 は ID:LBENa7oa と ID:YIrPz9T4 どっちなの? ID:LBENa7oaは末尾aだから出先で書き込んだんじゃないの >>649
筆箱の様なハンデースキャナーを買ったが、、上手くいかんからお蔵入りや 横長の本を裁断して、何も考えずに縦にスキャンしたら、、読めん、やり直しや ハンディスキャナって転がして読むやつ?
あれ高確率で歪むし今の時代となっては撮影した方がいいよ かなり雑に表面なぞるだけで歪みは補正して綺麗にスキャンできるのなかったっけ >>660
歪むどころか蛇行するから 何年も前に買ってから一度も使ってないんよ…無駄なモノを買ってしまった orz
書画カメラも自作したが、、光がうまく回らずテカるしページ捲りが意外と手間なのでボツ
やっぱし裁断してスキャナーやで 雑なスキャンはスマホで撮影に負けるんだよな
スマホのカメラの解像度とオートフォーカス機能は文書保存用としてとっくに実用領域だった 面白いとは思うけど、みんながいいデジカメ(スマホ)を持ってしまった今となっては活躍の場が無い
CZURだって、実はスマホで十分に代用できる
スマホじゃないデジカメのピクセル数がどんどん増えていた頃に、
新聞全面を撮影した画像が問題なく読めたので、
近くスキャナは不要になりそうだとは思ってた A4≒12㌅x8㌅≒100平方㌅ 300dpix300dpi≒9万dot
9万x100≒900万画素、、中古のスマホで十分 スマホはスマホで勝手に色合い作ったりするのもあるからオリジナルの再現には不向きのとかもある スマホをセットして非破壊スキャンする為の台だけ売ったら需要あると思うけどな
空中で固定して光源を用意するのが面倒なのであって、カメラ自体はスマホで十分
wifiでデータはPCで受ければ配線も要らない つ omoidori
スマホ取り付けられる卓上雲台とか買ってみたこともあるがピント合わせ普通に面倒
CZURは歪み補正のソフト込みで評価されてるのでスマホで充分つってる人とはユーザー層違うと思う ピントはオートフォーカス任せでしょ
そんなもん手動ではやらない
歪み補正は、そのうちフリーのすごいのが出るよ
出てるのかも
人間が見てどう歪んでるか明確に判るんだから、
自動とかちょいAIで十分に補正可能
今の勢いなら、PC用は出なくてスマホ版だけ出る 本を持って撮影するとアーチ状に歪むので補正する方法を知りたい
台形補正では物足りない 紙なんて伸び縮みしないんだから、変形にかなり強い制約があって解が限定される
紙の端やら文字の並びやらで抽出した曲線から元に戻す行列を割り出すのはそんなに難しくない
面白そうだからトライしたい気もあるけど、明らかに再発明だからやりたくない スマホのカメラに映った本のページを自動で認識して、
勝手に平面に直す機能が優秀すぎて、
非破壊スキャンする枚数少ないならそれで充分なんだよな それもそうだが、お前らは私に自動的に黒枠を消しこむ最良ソフトを教えろ! それもそうだが、お前らは私にオススメのAVを教えろ! >>674
私はPhotoShifterを使っているかな。
指定座標の色との差異を見て一括トリミングしてくれるので便利。 PhotoShifterは設定が保存されないけどバグか仕様かなんなのか 数値固定で一括トリミングしてるんで代わりにIrfanView >>678
うちでは自分が設定変更した内容(指定色と認識するしきい値や出力フォルダなど)に関しては普通に保存されてますね。Windows10なので、11ではどうかは分かりませんが。 >>678
保存した設定を復元する仕様だね
そういう意味では保存されないな トリミングは自作ツール。
フォルダー内の全画像を重ねて表示し、トリミング範囲を指定して一括処理。 s1500からDS-530に買い替えて、
書類とかレシートとかそんなんばっかりスキャンしてたけど、
初めて本をスキャンしたらファイル名を秒にするとギリギリだな
35枚/分だから理論的にはアウト 自作ニキは勤め先のソフトウェア会社を公開してるから要望を出したら販売してくれる可能性がある いくつかは公開してるがダウンロード数が全然なので需要がないんだと思っている。 フラベの時は自動サイズ認識&傾き認識でやっているので、うちはそもそも黒枠がない。 先日ChainLPというソフトをご紹介いただき、少しずつインストールなどを進めていましたが、ようやく昨日PDFを変換し、Kindle端末で鮮明に読むことに成功しました。
ありがとうございます。
ただ、余白の設定などは、これから試行錯誤をしていく必要があります。
何か設定のコツなどがあれば教えていただけると嬉しいです。
PDFからMobiに変換した方がデータサイズが大きくなったのですが、仕方がないことでしょうか?
それとも、デフォルトのJPGのクオリティ80をPNGにしたり、クオリティを下げたりしたほうがよいのでしょうか?
そして、もう一つ質問があります。
裁断機はダーレ200DXを購入し、以下のサイトを参考にして、同じシートを同じ貼り方をしています。
https://tealic.blog.shinobi.jp/Entry/1474/
しかし、裁断面が少し斜めに、台形のようになってしまいます。
これをまっすぐにするために、できることがあれば教えてくださると嬉しいです。 mobiは同じ内容を2つ分持ってるからサイズが倍なんだよな
kindlestripで余分なのを削除すると半分になる >>690
なるほど、そうなのですね。
kindlestripを入れてやってみます。ありがとうございます。 薄くて硬い下敷きみたいなのを本に挟むとそのページをスキャンしてくれるようなスキャナーがあれば
便利なんだけどねぇ。スキャナ本体と実際挟み込む下敷きが別になっててケーブルで繋がれてるような感じでw
ページ数多いと面倒だけど。 時々非破壊スキャナーが話題になるんだけど、自分の場合、裁断できない場合はコピー機との複合スキャナーを使ってる
半ページのサイズを測ってソフトに設定し、とじしろと反対側をスキャナーの角に合わせて左ページだけをスキャンして保存する。終わったら次に右ページだけをスキャンしてファイルに保存。どちらかを回転させて向きを合わせる。その後ソフトで交互に合併する。これでとじしろ部分の影とかもじの歪みは相当に軽減して実用には問題ない。 フラべの読み取り方向に対して垂直に置けば満足する品質になるが…
滅茶時間かかるのが問題 初歩的な質問で申し訳ないんですが、
非破壊スキャナーってフラットベッドとオーバーヘッド、どっちが良いんですかね? 品質を優先するならフラべ
手間を軽減させたいならオーバーヘッド
文字主体の本ならぶっちゃけどっちでも
コミックスなどノド側に空白の少ないものは>693の方法は厳しいので
品質殺してカメラのほうがいいかも >>697
ありがとうございます
折角自炊するなら手間がかかっても高品質な方が良いですね
文庫本は代替が効くので裁断してそれ以外の本中心ですが文庫本以外の本はノド空白が大体少ないでしょうから厳しそうですね
フラットベッドでおすすめのスキャナーとかございましたら教えて頂けないでしょうか? >>698
手前の縁が極細の自炊用と名乗るフラットヘッドが出てるよ、、
儂は裁断出来ないのはそのママにして、極力裁断して済ます
流石に半世紀前の本は硬くなっているのか裁断し難いね
新刊書は柔らかいし、スキャナーも順調に流してくれるわ 書籍特化ならPlustek OpticBook
画質重視ならGT-X830だけど>699の言うように単ページずつ撮るのはやりづらいかも
ノド部分が浮くと被写界深度の浅いCIS機ではボケて読めなくなるので
非破壊前提ならCCD機を選んだほうがよいと思う 写真集とかはGT-X830かな?
尼見たらホコリ溜まりやすいとかあるけど大丈夫なんだろうか 本に特化したスキャナで、本を開いてノドの奥までスキャンしてる画像を見ると良さそうに思えるけど、
実際の本はあんなに開かないんだよな
ノドの奥までスキャンしたい場合は逆に画像補正か解体の二択になる >>704
コレの原始的なのを作ってみたが 本がテカって上手く行かなかったわ
テカらない照明が思い付かず、、現在はスマホの充電台になってるんよ
天井の照明も邪魔、昼間の屋外でなら上手く行くかな?? >>706
反射しない角度から撮るだけだから画像が歪む(笑)
補正ソフトが必須 Plustekとか使ってる人いんの?
レビュー見ると不穏なんだが
GT-Xが安牌だろ >>707
シフトレンズが使えたら出きるんだけど、クソ高いセットになるからな 質問です。
大きな専門書などをスキャンして、Kindle Oasis用にリサイズしたとしたら、すごく字が小さくなって読みにくいと思います。
その場合はタブレットで読んだり、あるいはKindle Scribeといった大きめのE-inkリーダーなどで読むべきだということでしょうか? >>708
plustek opticbook4800つこうちょるよ
gt-x820もあるけど近年はもっぱらplustek 専門書なら大きめのタブレットやPCモニターのほうがいいのでは
Eink端末は小説やコミックなど物語を楽しむような読書向けだと思う
>>708
過去あったレビューだと画質はCCD機としては微妙らしい
ただフラべの非解体ブックスキャナとしては他に選択肢がない >>713
そんなことはない
私は専門書を E インク端末で読んでいるが随分と目に楽になった >>713
やはりもともと大きな本で、細かい字がたくさんある場合は、大きい画面で読まないと厳しいですよね。。
E Ink端末でも、Kindleスクライブやソニーかどこかの端末なら10インチ以上あって、タブレットと同じくらいの大きさだったと思います。
このくらい大きければE Inkでも大丈夫ですかね?
>>714
例えば字が上下2段になっていて、紙のままで読んでも字が小さいと感じるくらい、字がギッシリと詰まった大きな本だとしても、7インチで読んでも読みやすいでしょうか?
今はまだ四六版までしか試していませんが、これでも余白によっては字が小さいと感じることがあります。
そのE Ink端末のディスプレイは何インチでしょうか? >>715
13インチです。
モニターで見るときは25 in のEインクモニターです。
13 インチ の方をよく使います >>708
本に変な折り目が付かないのが良い
スキャンは最高設定でやる(調整とかはデータ化後にやる)ので、スピードは遅い
破壊禁止の本でしかやらない 一晩にコミックス3、4冊程度が限界かな
大判の本だとズレ防止とスキャン時間でもっと掛かる 飛行機とかネットが繋がらないときにも読みたいじゃん それだけ用意周到なら、読む分をダウンロードしとけよw 一部の人向けの極論だが
・DRMの解除(技術的利用制限手段の回避)は著作権法で禁止されているが、刑事罰はなく民事賠償のみ。サービス終了した業者が支払い済のものに被害額を主張して告訴してくるのは笑い話。
・不正競争防止法には刑事罰はあるが、禁止されているのは、回避装置の提供であって、作成や使用ではない。
結論: 自分でDRM解除プログラムを作って、購入済やつに使用する分には問題にならない OpticBook4900が出てるのを今知ったが4800との違いは何だろう? >>716
そうですよね、13インチ、25インチあったら、すごく読みやすいですよね。
大切な本、希少な本、高価な本を破壊して自炊するのに勇気、覚悟が要るのですが、そこまでして自炊するなら、やはり大きなE Ink端末を読みたいなと思いました。
ありがとうございます。 >>726
私も最初に新刊を裁断するときは抵抗がありましたが、今では電子化することでDeepLとかインテリジェントノートアプリと組み合わせることで本に新たな命を吹き込むことが出来ると考えるようになりました >>725
AmazonのQ&Aだと、下記らしい。基板の差
「答え: OpticBook4900には、本や書類のデータ化と整理に特化したソフトウエアBookMakerを
バンドルしています。
OpticBook4900と4800の基本的なハードウエアは同じですが、BookMakerを動作させるため、内部の基盤を変更しています。
ご検討のほどよろしくお願いいたします。」 ScanSnap iX1300が半額?
B09R7GK5Z9 風呂でPDFファイルを読む場合、どういう機器が向いていますか? 防水のkindleは沈めても大丈夫
その状態で操作はできんけど 質問があります。
先日、初めて分厚いハードカバーを裁断したのですが、ダーレ200DXだと何度かに分けて切ることになります。
その場合、裁断するたびに裁断する幅(背表紙からの距離)がわずかに変わってしまいます。
すると余白の幅も変わり、スキャンしたときに字の大きさが微妙に変わるのではないかと危惧しています。
すべてのページをまったく同じ幅で裁断するには、裁断前にページに印をつけるなどしなければ無理でしょうか?
あるいはスキャン後にChainLPなどで余白を揃える方法などがあるのでしょうか?
ところで皆様は、裁断した本は捨てていらっしゃいますか?
私は新品だったり高い本の場合は、捨てるのに抵抗があり、フリマアプリで売ることも検討していますが、出品や発送などの手間の割に値がつかないだろうと葛藤中です。
ちなみに電子化した大きめの本を読むための端末として、今のところ、KindleScribeを第一候補としています。
>>727
ご返信くださり、ありがとうございます。
私も、新品の本を裁断するのは、やはり抵抗があります。
まだ自炊を始めたばかりということもあり、(特に定価で買った)新品を裁断するのは後回しにして、失敗してもいいと思える中古本から始めています。
たしかに、洋書を電子化することでDeepLなどにコピペして翻訳できるのはいいですね。
裁断した新品本は捨てていらっしゃいますか? >>735
基本的に捨てています。
ただし捨てるのに抵抗がある場合には誰かに役に立てばいいと思いメルカリに安価で出品してます。1ヶ月位出して売れなければすてます。
捨ててもいいようにスキャンした画像は一通り目で確認して見にくいところがないかをチェックしております >>736
そうですよね。捨てるのが怖いのは、抜け、漏れがあるかどうか、というところで、失敗していたら取り返しがつかない…という気持ちになってしまいます。
チェックして捨てる、あまりに捨てるのが忍びない場合は儲けは度外視して売る、基本的に同じ感覚です。
ありがとうございます! >>735
自分は PK-513LN 26-309を使っていますが表示をカッターで取り除いた後厚さ1 CM 弱にバラしてスライダーに角を合わせるとほとんどズレは発生しません
ズレが発生するのはまだ厚いからではないかと思います >>737
ページ抜けの確認はスキャンした画像の数と元の本のページの数が一致しているかで確認しています
スキャンの設定時に白いページをスキップという設定があるのですがスキップするとページがズレるので白いものもそのままスキャンしています >>735
まったく同じ幅で裁断など無理なので画像処理で合わせる。
拡大縮小ではなく適当な幅の余白を付加し、同一幅でトリミングする。 >>735
新品のほうが躊躇無く裁断して捨てられる。
むしろ入手が難しい古書のほうが自炊に躊躇する。 オークションじゃないんだから手間の割に値がつかないってことはないだろう
そんな値で出品する方が問題
売れたら発送売れなきゃ捨てる、それだけさ ご意見をお聞かせいただき、ありがたいです!
>>738
説明が下手で申し訳ないです。
薄くても、目分量なので、裁断のたびに、裁ち落とす幅が同じ本の中で少しずつ変わってしまいます。
PK-513LN 26-309を検索し、画像を見て、裁断機に描かれたグリッドの目盛りを見て合わせれば、毎回同じ幅で裁断できるのでは、と思いました。
私の裁断機には全体的に滑り止めが貼られていて、グリッドがすべて隠れてしまっているのです。
>>739
なるほど、ページ数の確認は簡単で、よいですね。
>>740
そうですね、まったく同じというのは無理ですね。。
左右に余白を足して、少し大きくして揃えるということですね。
裁断幅が違うと余白も変わるので、スキャン後の字の大きさも変わるのかと思っていたのですが、合っているでしょうか?
その場合、余白を増やしても字の大きさは揃えられないのでは、などと思ってしまうのですが、真相を教えていただけると嬉しいです。
>>741
たしかに、失敗しても簡単に買えるのなら、まだ気軽に裁断して捨てられますよね。
>>742
多くの本は安くしないと売れないという意味でした。
相場を見ると、手間ひまかけて手取りが数百円にしかならなかったりしますので。。 >>743
Amazon でダーレ200DXの写真を見ましたけどスライダーはついてるし LED でカットする場所も確認できるので私の使ってる裁断機と同じことはできると思います。私はグリッドに合わせることを意識したことはないです。
ひとつを裁断した後次の部分を裁断するときにスライダーが動かないようには注意しています >>735
>すると余白の幅も変わり、スキャンしたときに字の大きさが微妙に変わるのではないかと危惧しています。
300dpi、600dpiでスキャンすれば、300dpi、600dpiになるので、字の大きさは変わらない。
「表示する時に」画像サイズに合わせて拡大縮小すると字の大きさが変わる。
気になるならスキャン後に余白をカットして画像サイズを揃えればいい。 >>743
手取りが数百円でやってられないなら葛藤しなくない?
葛藤て他人が同じものを売ったら高く売れるのでは…という不定要素に起こると思うけど >>744
そういうことですね!意味が分かりました。
スライダーの位置をそのままにして、次の原稿を置けば、同じ幅になりますね。
そして、厚みがあると上下で幅がズレていってしまうということですね。
理解力がなく失礼いたしました…(^_^;)
>>745
そうなのですね!
すると、余白を増やして同じ幅にするのは、文字の位置を揃えるためなのでしょうか。
>>748
捨てるのがもったいないから儲けがなくても売ろうか、という気持ちと、儲けもないのに手間暇ばかりかけるなら捨てちゃって早く楽になりたい、という気持ちの葛藤です。
裁断してもある程度高く売れる本については葛藤なく出品しますが、数百円となると、「もったいない精神やボランティア精神」と、「自分の都合や自分の利益」の間に葛藤が生じます。 レア本は裁断済みでも捨てるのは文化への攻撃みたいな後ろめたさがある 微妙な文字のサイズや位置まで気になるようなら自炊ではなく最初から電子書籍買った方がいい。
いくら忠実に画像化しても紙本製造の時点で印刷位置や紙の大きさなどズレている。 >>751
たしかにそうですね。。
私はそこまで厳密には気にしていなくて、多少斜めになっていても、位置がズレても、まあ普通に読めればいいという感じです。
ただ、裁断の仕方が悪いのか何故なのか、字の大きさ(縮尺?)が2:3くらいの比率というくらい明らかにページによって違った本があったり、その他、自炊のことで頭がゴチャゴチャになって質問させていただきました。
今回また皆様に、いろいろと質問させていただいたおかげで、また進められそうです。感謝です! なんだ盛り上げっていたのか
用紙固定値でスキャンしてRalphaで一括で切り出してるな自分は 横ですみません。
文字のみの小説などを自炊するとき、皆さんは白黒かグレースケールどちらでスキャンしていますか? >>754
グレイスケール。
もし白黒が欲しければ後からソフト的に変換すれば良いだけなので必要ない。
画質はカラーでも良いのだがUSBの転送速度の上限に引っかかってスキャンが遅くなるので、どうしても必要な時だけ。 画質に拘るならカラーでスキャンして自前でグレスケ化
拘らないなら何でも好きにすりゃいいよ 小説もコミックもドロップアウトカラーを赤にしてグレスケ
紙焼けが酷いときや色紙の時はカラー フルカラーでスキャンして自作ツールでグレースケール化。 >>754
私がスキャンするのは専門書ですが、モノクロを使っています。モノクロの方が文字がくっきりと見えるからです。
グラフが多くて白黒の濃淡差が必要な場合にはそのページだけグレースケールでスキャンしグラフ部分だけ切り取ってモノクロページの上に重ねます。
ただモノクロの場合裏写りする場合が時々ありますが、グレースケールでスキャンし文字くっきりという設定をします。紙焼けしている場合もこの方法で対処できます。全ページグレースケールするか裏写りのページだけするかはケースバイケースです。
カラーでスキャンするのは元がカラーページの場合だけですね。文字だけの白黒ページをカラースキャンしても文字のクッキリ感が低くてメリットは感じません。
あなたの場合小説ですから白黒メインで、必要ならばグレースケールで補完すればいいんじゃないですか。 すべてカラーで何の補正もしない
情報は極力残す
国会図書館と同じ >>757
初歩的な質問ですみません。
紙焼けがひどいときにあえてカラーにする意味はなんですか? 紙焼けは全ての波長域で均等に起きて灰色になるわけではないし、場所も紙面の周辺から起きる。カラーでとって色情報をもとに補正することで紙焼けを除去してグレイスケール化できる。
もっとも、元が白黒の紙面なら最初からグレイスケールでとっても周辺との差分抽出で紙焼けを除去するアルゴリズムもあるので必須というほどでもない。 >>762
スキャン後に紙焼け低減の処理を試すから
酷くない時は赤抜きスキャンで低減できるので処理が想いカラーは避ける
ちなみに酷いときは自分は手動・半手動で試行錯誤したり結構手間をかける
説明しづらいのでやり方は聞かないで 乱暴な言い方をすれば、赤焼けだろうが黄焼けだろうがグレスケでスキャンしたら白黒で表示されて区別出来なくなる
カラーなら赤身を低減、黄色を低減と各色毎に補正が出来る >>754です。
皆さん色々教えていただきありがとうございました!
カラーで乗り込んだ場合やグレースケールで取り込んだ場合のおすすめの編集ソフトはありますか? なぜ漫画家にジワ売れ?「スマホでレシートをスキャンする道具」製作者も予想していなかった意外な用途とは [朝一から閉店までφ★]
https://egg.5ch.net/test/read.cgi/moeplus/1679396523/ 紙が白でない場合に、それを白として扱うには、
グレイスケールでの補正みたいに1つのスペクトラムで処理するのではなく、
ちゃんと色空間を考慮する必要がある
実際には赤っぽくなることが多いので、赤のチャンネルを無視するという雑な処理が多い
RGBで範囲を指定して、該当するピクセルを白に置き換えるのが正解だけど、
それ専用のツールは見たことない site:kokkai.ndl.go.jp 普遍的価値 filetype:pdf 「赤のチャンネルを無視」じゃなくて、「赤のチャンネルを抽出」な
別に雑でもなんでもないよ、これが最適な状況ももちろんある
赤く焼けているのは、実質的に赤以外のスペクトル反射率が減衰してると見做せるわけだからね 紙によって色々あるので一概には言えない。昔の酸性紙みたいに化学反応で炭化する場合もあれば、最近の蛍光紙みたいに青が劣化する場合もある。
紙面一様に劣化することもあるが、隅とかから部分的に変色することも多い。
一律の対応ができるわけではない。自動化したければ自分でプログラムを組んで解析と補正をするしかない。 文化財の保存ならここまでエネルギーをかける意味はあると思うが、たかが個人の資料でここまでエネルギーをかける価値はあるかな
趣味になってるとしか思えない 俺は馬鹿だからよく分からないんだけど、俺の言ってること言い換えてるだけにしか読めないんだけど誤読してる?
「青が劣化」するのに「赤のチャンネルを無視」するの?
一律の対応が出来ないってのも「最適な状況ももちろんある」って書いてる通り当然理解してるし
そもそも>>768 = >>771で合ってる? 別人だったら俺のただの言いがかりだから謝る、ごめんね
ところでこのスレ、「自炊技術」のスレなのに自炊技術の話するとイヤがる頭のおかしい奴が住み着いてるの笑う 話に嫌がってんじゃなくて、職人技の言い争いにやがってる
一方の主張に対して、同じことを言い換えてるだけだろうなんて、職人でない人間には分からない
だからスレ汚しでしかない
わかる? 紙焼け処理はそれぞれがいろいろ試してこうするのがいいって経験則的な結論になってるのも多いと思うから
化学的に説明できる人ばかりではないと思う
持論を述べてる人が何を言わんとしてるのかは理解できるからスレ汚しとは思わないな 話についていけなくてムカつく!スレ汚しだ!
幼稚園児の駄々こねそっくりで草 そこまでする必要ない、価値がないというのも1つの意見としては尊重する
だけどそれを押しつけてその話はやめろってのは受け入れられないよ チャンネルというのが何かのツールの専門用語なのかもしれん
赤のチャンネルを赤の成分に読み替えてくれ フォトショかAffinity使ってればチャンネルで通じるはず チャンネルが理解できていない人はいないと思うよ?
「赤の成分を無視する」ってのが逆じゃないの?って話はしてるけど 俺は771だけど、768じゃないよ。
蛍光紙の青が少しだけ劣化してるような分には赤チャネル抽出で十分。しかし紙焼けはそのパターンだけではない。
ある人にとって赤チャネル抽出で十分でも、それはその人が普段からスキャンしてるものがそうなだけであって、万人に適用できるわけではない。
逆に十分なアルゴリズム駆使すれば色情報無しのグレイスケールからでも酷い紙焼けを除去することもできる。
特定のやり方のみを主張するのはどれも間違い。その状況に合わせたものを使うことが重要。 >>784
ごめんごめん、同一人物だと勘違いしちゃった。
で、俺はあなたの意見と全く同意するので何の反論もない。実際、同じことしか書いてないよ
俺ももちろん自作ツールで複数の選択肢から最適なものを選んでるからね >>778
「一方の主張に対して、同じことを言い換えてるだけだろう」という次元の話はまともな議論ではありえない。建設的な議論というのは互いに理解可能な言葉を交わしてするものだから。非職人には理解できない高度な職人技を披露しあって研鑽し合うのは自由だが、それならもっとまともな会話をしてほしい。そうであれば高級職人同士の戦いであっても不快臭は漂ってこない。
ところで、同じことを言い換えてるだけなのかね?話についていけてる人答えて。 >>786
少なくとも私はそんな高度な職人技の中身の話はしてないよ。
「紙焼け」っていっても退色には色々なパターンや重度があって、どのパターンかによって対応が異なるので一口に説明できないし完璧なソフトもないと言ってるだけ。中身がなくてすまん。
特定のパターンについて聞いてもらえれば具体的に回答できるかもしれない。無理かもしれない。 >>787
おっしゃる通り鼻をつまんで不快臭を我慢して読み直すと、当たり前のことしか言ってなくて「中身がない」と言えるほどだよね。
768は言葉の使い方が不正確かもしれないが言ってることは当たり前のことだけで脳内で補えば素人の俺でも容易にわかる
それを cYD/3lJPXが噛みついたわけだ。こんな大したことない事なのに噛みつく奴がいると、それだけで不快臭が漂うので内容を読む前に近づきたくなくなる。そうならないようにしてほしいという希望だけです。 >>789
そんなことわかってる。
不正確な言葉ん使う768と正確の記述できるあなたを混同する訳がない。
どこをどう読めば私があなたを768だと思ってるになるのかな?
>>790
おまえcYD/3lJPXはとことん性格が悪いな。全てはおまえの嫌味と噛みつきが原因だろうが。
idを見れば768と771が別人物なのは確認しなくてもわかるのに頭も悪いのか? オタクでなければほとんどの人は書籍をスキャンして電子化するにしても適当にやって終わらせるんじゃね
だからスレに来ることもない >>792
>>793
道を極めたい人達が集う場所
あなた達も道を極めたいのか? オタクっぽい知識の披露、読み飛ばして可
紙焼けといっても色々な種類があり、主なものでも3種類ある。
1)古い酸性紙の場合、インクの滲みどめに使用さてている硫酸アルミニウムが空気中の水分で加水分解されて硫酸が生じる。この硫酸が紙の主成分のセルロースから水素を奪って炭化させる。焦茶色に変わるだけじゃなくて紙がボロボロになる。最近の中性紙では起きにくい
2)木材からパルプを作る際にセルロースに絡みついたリグニンが除去し切れずに残留する。リグニンは木材が茶色い理由だと思えば良い。これは化学的に脱色して影響が出ないようにするんだが、紫外線などにより組成変化してまた着色してしまう。リグニンの除去をきちんとした上質紙では起きにくい
3)最近の紙は漂白するかわりに、もともと黄色ぽい紙に蛍光染料を混ぜて増白している(紫外線を吸収して青に発光するので全体として白くなる)。この蛍光増白剤は強い紫外線に弱く、時間経過で機能を失う。もとの黄ばんだ色に戻ってしまう
最近の紙で多いのは3)のパターン。赤チャネル抽出とか、上限カットとかだけでも何とかなることが多い >>795
なるほど詳しいですね。いろいろあるんですね。
795さんは仕事で資料保存などをしているのですか?
そうではなくて個人でスキャンをしているならどういう局面でこれくらいの深い知識を使うんでしょうか
自分は適当派なんで自分と違う価値観で利用してる人の利用形態は興味あります 赤を無視(ドロップアウトカラー)と赤チャンネル抽出(photoshop)は
真逆に見えるけど実際は同じだって前にこのスレで聞いた記憶
具体的な説明は覚えてないが、なんでだったかな
自分も紙色に合わせて調節はするし識者の方々が劣化成分の色に関して一家言あるのはわかるけど
こんな何度も同じこと言って議論するほどの内容でもないような モノクロページなら一番焼けの激しいところが白く飛ぶ感じにホワイトレベルを設定してグレースケールで取り込んでいるな
コミックでもこれで問題を感じたことはない >>796
そんなややこしい話じゃなくて、紙焼けの仕方を見て、グレイスケールで十分か、カラーでスキャンが必要かを決める
あとは自作の紙焼け補正プログラムで使うアルゴリズムを選定する。自作プログラム作るのに知識が必要だっただけ 焼けてない
紙 字
R 255 0
G 255 0
B 255 0
焼けてる
紙 字
R 255 0
G 200 0
B 200 0
こんな感じになる
紙の赤みが増すのはRが増えるのではなく、R以外が減る
だから生き残ったRだけでグレースケールを作るというアイディア 蛍光染料の劣化だと赤が落ちてない状況で緑がそんなに落ちることはない。(実際に赤選択でも緑選択でも結果はほぼ変わらない)
輝度ベースのグレイスケール化は
赤30%+緑59%+青11%
なので、青が半分に劣化しても5%しか暗くならない(だから上限カット/90%以上で白飛ばしみたいな対応でも十分だったりする)
逆に完璧にやるのなら近傍の白い部分を見つけてRGBの比から劣化を推定して補正するのが有効
やり方は色々あるって話だ 職人あるあるの上級者を自覚せずに自称初心者を名乗るところが不快 白黒の文字のみのページをカラーで取り込んでからグレースケール化するのと、最初からグレースケールで取り込むのでは何が違うのですか? >>804
いい質問だ
俺も聞きたい
グレスケ用のパラメーターは同じように設定できるという仮定のもとで グレースケールで直接スキャンするときはパラメータ設定を試行錯誤するたびにスキャンし直さなきゃいけないが、カラーでスキャナンをするとスキャン後のデータに対してパラメーター設定を試行錯誤できるので楽、以外の回答でお願いします。 質問がループしてる気がするんだけど
昨日散々レス付いてたやん >>807
本質から外れた「違い」を列挙することになるが... >>809
本質から外れているなら結構です
もう一つ識者にききたいんですけど、自分は文字だけの本をモノクロでスキャンしたのと、カラーでスキャンしてそれをモノクロ変換したのを試したことあるんですが、最初からモノクロスキャンした方が文字がくっきりしていました。これはカラーからモノクロ変換した時の設定が微妙に異なっているということなんでしょうか
それとも直接モノクロスキャンとカラースキャン経由のモノクロではどこかで情報の脱落を起きるので全く同じにはならないということなのでしょうか 機種によるけど私の使ってる機種の一つはカラーは600dpiで、グレイスケールだと1200dpiのとかある。スキャン速度はグレイスケールの方が倍以上早いのもある。 >>808
そりゃ理解できてないからね
仕方ないね みなさんスキャンした後に傾き補正などされていますか? ものによるが、イラストや写真がメインのものは基本的にやる ただ、それらはフラベでスキャンするから滅多に傾かない >>805
> グレスケ用のパラメーターは同じように設定できるという仮定のもとで
まず仮定が間違ってね?
グレスケスキャンはRBGから均等に濃淡拾ってくるのが普通で
機種によってはドロップアウトカラーで赤、緑、青のどれかを無視して取り込むことができるという程度で
カラーチャートから輝度ベースを選んでグレスケに落とし込むような複雑な設定はほぼできない
> 最初からモノクロスキャンした方が文字がくっきりしていました。
使ってるスキャナの機種書いてないから知らんけど
大抵のスキャナドライバはデフォルトで補正が入ってて撮ったものそのままの絵は出てこない
くっきりに見えるならレベル補正ガッツリされてるだけでは? >>816
なるほど、なるほど、勉強になりました
ところで50年前に買った数学の本をスキャンしたいんですが赤やけがひどくて余白が相当に赤ヤケしています。文字の本体部分はひどくないです。文字情報さえくっきり拾えればいいんですけど、どういうスキャンがいいですか
色変換のソフトが必要ならおすすめのものも教えてください
ハードはEPSON の DS 571 W です 普通に考えると色を範囲で指定して置換してしまうのがいい
そのくらいのことはかなり昔の段階でできた筈なのに、
何故かRGBのRだけ使うという方法が広まった >>817
それだけ人生経験を積んでいるなら子や孫に相談してみては
コミュニケーションの種になるかと >>818
カラースキャンで色飛ばしは文字に色がかぶってイマイチ
グレスケ化とR抽出に差があるとおもない目だけどさ >817
参考書みたいに多色刷りだと難しいだろうけど、2色刷りなら文字の黒以外は全部白くなってもいいと考えてハイライトのレベルを調整して2値やグレーで取り込めば?
グレーなら調整が甘くて周辺部に暗い部分が残っても読むのに問題ないでしょう 自炊wikiの紙質低減アクション使うならばフォトショだろうけど
情報古いし自力で積極的にお勉強してかないと厳しい
つか現実的な話するなら白枠塗りつぶしでよくね?
ここでこれ以上質問繰り返してももう「自作プログラムでやってますが何か?」で終わるオチが見えてる なかなか焼けた紙のサンプルも無いので、誰かお手本をupして、
それをいろんな方法で綺麗にしてみて手間と効果を評価するのが現実的だな 当然だが、傾き補正はする。
安い単行本、文庫、コミックは製本、裁断の段階で傾いてるので、完璧にスキャンしても傾きがある。
紙のまま読む分にはページは曲面なので気にならくても、フラットな液晶などで読むと気になる。 eTilTran
NDLOCRの中の自動傾き補正
自動で補正できるソフトはこの2つしか見つからなかった そうなんですか。
ScanSnapを使っていてスキャン時にPDFで保存しているのですが、PDFからjpegにして補正するより、最初からjpegで保存して補正後にPDFにした方がいいのでしょうか? jpgの方が編集ソフトが充実してるからね
OCRをしないならその方が良い >>833
ありがとうございます!
ちなみに黄ばみがとれるおすすめのソフトもあったら教えてください! >>834
xnconvertが一括処理で簡単で入門向きかと
黄変除去のスクリプトはないので(あるかもしれない)
「黒点・白点」で白で調整したり、
「画像修正」のガンマ値を上げ下げしてバランスをとったりとか
注意点は
スクリプト保存をすると出力ファイル形式もそのときの設定で固定されてしまう
なので元画像と同じにしておくことかな
でないとpngもすべてjpgになってしまったりあとでいろいろめんどい >>835
ありがとうございます。
順番としてはスキャン時にjpegで保存→ xnconvert で黄ばみ除去(そのままjpegで保存)→eTilTranで傾き補正しPDFで保存
で大丈夫でしょうか?初心者なので黄ばみ補正が不安です。 自称初心者。初心者とは異なります。
何かと「初心者であること」を強調する人。
自称初心者は、初心者であることに威張り、他の利用者よりも大きな利益を得ようとする人のことです。
例えば、「初心者だからたくさん教えて欲しい」とか「初心者だからこのこと(=超基礎的事項)がわからないから教えて欲しい」とか「初心者だからやりもせず不安」ということをいう人です。
謙遜しているのとは異なり、何かやるたびに「すいません、初心者なもので」などと、初心者であることで許してもらおうとする言い訳です。 >>836
JPEGだと品質によっては劣化が目立つから 作業途中はpngとかの保存時に劣化しないフォーマットを使った方がいいかと >>836
そうなんですね!
ではxnconvertの補正後pngで保存しeTilTranの最後の修正後にPDFで保存します!
eTilTranの傾き補正はpngでも可能なのでしょうか? うるさいことを言うとOCRソフトでも勝手に傾き補正をするよと
とりあえずは画像で保存しておいて別の書籍のスキャンを進めるとかまえに進むのが吉と
補正はあいた時間で将来いくらでもできるし
カラーページのみフルカラーであとはグレースケールでドロップアウトカラー赤
クロッピングオフで傾き補正の設定があればサイズ固定で左寄せになるので
あとでRalphaで一括切り抜き
自分の場合はね 知識技術があって自分でツールを作れる人
野良ツールを使える程度の人
ただスキャンした結果を拾うだけの人
それぞれ全く別の次元で生きてるのが面白い エチル使うなら枠外塗りつぶししたらええやん
枠合わせめんどいけど黄ばみ取りとか難しいことせずともスッキリするぞ 似たような結果になることも多いけど「赤チャネル抽出」と「ドロップアウトカラー:赤」は別の機能なので注意。
ドロップアウトカラーは特定の色相の色を白とみなす機能。色相と彩度のパラメーターが存在し、場合によって黄色に紙焼けしているのとかを除去できない。
一方でシンプルな赤チャネル抽出だけだと、茶色に紙焼けしているのを除去できない。
要は使い分けで適切なものを選ぶか組み合わせるのが重要。 >>846
webpはテキスト周りのブツブツしたノイズが出にくいのが優秀
SusiePluginにiftwicとiftwebpがあるけどiftwebpの方がデコード速いのね へー
まあjpegは元から自然画が対象だからなあ
アニメ絵とかにも強いんだろうか KinoppyとかSidebooksはWebPに対応してないのか(´・ω・`) 大抵のもんは対応してない
susieプラグイン方式のものは後から対応させられる >>846
使い勝手悪すぎだから拡張子で検索してまとめて退治してるけどなあ ウェッピー対応してるの少なすぎて結局jpgに変換するはめになる 以前からWebp推しの人がここにもいるけど、対応していないビュワーが多いだけでなく、Photoshopとかで書き出せなかったりするので色々と使い勝手が良くないんだよね。
現状、白黒ページについては8bitのgifかpng、カラーページはjpgか24bitのpngが無難かな? ぎちぎちに圧縮しなければjpgでも大したアーティファクトは出ない
全部jpgで実質問題はないけど、bmpを別途保存するのはあり >>855
いつの話なん?
WebP のネイティブサポート
Photoshop 23.2 では、WebP ファイル形式が完全にサポートされるようになりました。
プラグインまたは環境設定なしで、Photoshopで WebP ファイルを開く、作成、編集、および保存作業ができます。 白黒ページは16色PNG
いろんな色を使われてるように見えるが黒インク一色で印刷してるんだし 品質90でもアーティファクトが気になるな
この辺も自作ツールなら違うのかな? いつの話って言うけど23.2(22年2月)ならめっちゃ最近じゃないですか >>852
作る方は中間ファイルから変換しなきゃだめかもしれんが
読む方は内蔵デコーダー、WIC、susieプラグインのどれかでいける
iOSはcbzにしてYomuに突っ込んだらいけた グレイスケールなら作業ファイルも最終形式も PNG(8bit)がおすすめ。
カラーなら作業ファイルはPNG(24/32bit)、最終形式はJPEGがおすすめ。(更新したい場合は作業ファイルからやり直すこと)
印刷目的やカラースペース(色域)にこだわりたい場合は TIFF を使え。
WEBP は今のところウェブに掲載したい場合の最終形式だと思っとけ。 圧縮率0で出力できる環境ならPNGでいいが、変更できないツールだと時間がかかってしかたないので中間ファイルにPNGはやめておけ >>865
どんな環境で使ってるんだ? 圧縮率なんて環境依存で変えるものだが、圧縮した方が早いことも多いぞ。
中間ファイルに何を使わせたいんだw >>866
圧縮率を変えれるなら無圧縮PNGだが、幅広く使えるBMPが無難
一昔前のSSDでも無圧縮が早いし、RAMDISKならさらに早い
無圧縮だからってNTFS圧縮すると遅くなるが、それでもPNGよりいいよ うちは中間ファイルはTIFF
BMPはICCプロファイル(特にsGray)の扱いが面倒だからスキャン直後の無圧縮生データだけだなあ >>867
BMP が幅広く使えるという意見は珍しいな。どっちかというと Windows 専用のマイナーフォーマットだろ。
圧縮速度については速いCPU使え問題だな。 >>868
丁寧に使うのなら TIFF は悪くないな。多機能過ぎて拡張子で性質が読めないのと、互換性がイマイチなのが問題だが。
間違い易いので個人的には初心者にはお勧めできない。いろいろ分かってる人向け。 bmpがv4なのかv5なのかすら指定してない時点で分かってない人なのは自明だしなあ もしかしたら BMP に圧縮機能があることすら知らずに、主張してる可能性もあるのか。
Windows には BMP の圧縮に非対応なアプリもあるもで。 BMPはアプリ次第っていうか複数アプリ跨いで処理してる間にプロファイル情報が欠落するのが面倒なんよね
v5対応の自作プログラム書ける人なら最強なのかしらん
圧縮もね
個人的には無圧縮ベタデータとしての汎用性がBMPのキモだと思ってるので
RLE圧縮してまで使いたくはないかなっていう 可逆圧縮の意味で無圧縮と言ってる気がする
ガチ無圧縮はいくらHDDが安いとはいえ無駄なので軽く圧縮かかってる方がいい BMPとは、Windowsにおける標準的な画像の保存形式のことである。 ビットマップ形式と呼ばれることも多い。
JPEGやPNGが圧縮保存するファイル形式であるのに対して、BMPでは基本的に無圧縮のままファイルを生成する。
そのため画質の劣化がない。
・・・じゃなくて前提がRLEとか技術レベルが追いつかん PNG の圧縮で画像が劣化すると思っている奴もいるのか? 流石に可逆と非可逆の違いすら分からないレベルの奴は…このスレなら普通にいそうだな 「ロスレス」という表現を知らない(使いこなせない)おじさん達の共演は続く ScansnapのICCプロファイルを適用すると鮮やかな色合いになるが、こんな色か?と思う
プロファイルがないRGBのソースからインデックスカラーのPNG(sRGB)で保存していることもあって
sGrayの出番がなく救われた
仮にJPEGで保存していたら色が変わっていたかもしれない 呼称の使いこなしw
知識マウント合戦中にどうでもいい事で笑かすなw
読み返しても可逆と無圧縮を混同してそうな書込みは特にないし
PNGだBMPだTIFだ言ってるの見ても可逆と非可逆の区別ついてない人もいなさそうだけどねえ まさかとは思うけど可逆がロスレスの意味だと分かっていないとか…流石に…? ネットには嘘情報(古くて更新されてない情報)が溢れてるんで変な信仰で主張するやついるから油断できない
TIFF の圧縮についてちゃんと説明できるやつとか、あんまりいない… HDDで昔は600dpi BMPで保存していたが、600dpi PNGのほうが
.NET Frameworkの自作ビューアの表示が体感速かったので、途中からPNGに変更した。
PNGのほうがファイルサイズが小さくなる分、CPU処理が増えてもHDDからの読み込みが速くなると思う。 TIFF(G3/G4) 2値用 FAX形式
TIFF(LZW) 可逆ならこれ選んどけば無難
TIFF(jpeg) 不可逆 スキャナの保存形式でたまにある(個人的に地雷)
マルチページTIFF 複数画像を格納(PDFでよくね?)
コンテナだし全部把握とか無理だけどよく目にするのは上の4つかな
>>885
PNGは閲覧はいいけど圧縮に時間かかるイメージ
中間ファイルとして何度も書き出す時は自分は敬遠しちゃう >>886
みんな、だいたい自分が普段使ってるツールの範囲しか言えないんだよなあ。なので互換性の罠が多い
TIFF の G3 や jpeg 圧縮には2種類あったりするし、抜けてるやつだと deflate/zlib 形式 (いわゆる Photoshop TIFF) とかも結構使われてる。マイナーなやつまで入れると両手両足でも全然足りない…
圧縮の速度については、遅いCPU使ってるやつは圧縮率下げて対応しろって話にしかならないからなあ、ハードの性能次第 2値のtiffをうかつに展開したら巨大ファイルになった
グレスケ化して圧縮しても元のtiffよりでかい 印刷分野(CMYK)とか今でも TIFF 一択の分野もあるから 自炊の場合 他者と共同作業するわけじゃないんで
自分が使う形式と避けるべき地雷形式だけ分かってればいいですし(震え)
まあマウント取りたすぎて話の本質どんどんズレてきてる感は否めない 初心者は素直に PNG 使っとけって話だろ。
他は分かるようになってからでも遅くない。
良くわからずに他のを使ってたら後から後悔する可能性がある。 グレイスケールのJPEGが地雷ってことだけ押さえておけばいい >>896
カラーも非可逆圧縮は地雷だろ!
作業を繰り返すたびに劣化が蓄積していく グレイスケールにしていいような素材ならjpegで失われた情報は要らない情報だからセーフ
カラーでjpegの明度上げると気付かない部分がいろいろ無くなってることに気付く >>769
朝鮮
北鮮
朝鮮総連
朝鮮学校
わが朝鮮総連の罪と罰
拉致 とじ太くんを買ったら
見開き部分ってもっとギリギリまで残せたりとかします?
接着剤があるから難しいでしょうか 結構ギリギリまで残せるけど、糊の溶け具合によってはのど部分の辺がギザギザになってしまう場合もあるね。
あと、とじ太くんから取り出した後、すぐに背表紙の上下を拭いておかないと背表紙が溶け出した糊で汚れてしまうことも。 裁断機か壊れた、、なんと軸受のベアリングが真っ二つになってた、週末はバラしてベアリング探しだ orz 裁断刃を上下させるハンドルの付け根と手前側のガイドに沿って上下する部分にベアリングが付いていた
手前側のベアリングが真っ二つ…残った中の部分を抜くのが大変なんだよ、プーリー抜きの爪が掛かれば良いんだけど、、
デカイのならバンドグランインダーで削り割るんだけなぁ とじ太くんを使っても接着剤が消えてなくなるわけじゃないからなぁ
自炊技術wikiはとじ太くんでキッチンペーパーにホットメルトを吸わせるとか書いてあるけど
https://wikiwiki.jp/bookjisui/%E8%A7%A3%E4%BD%93
45秒が5セット以上かかるとか書いてあるし、こういう方法でやってる人って見たことないわ
とじ太くん使って自炊してる人も皆バラした後結局裁断はしてるべ
接着剤付いてた部分はちゃんと切り落とさないとスキャナーの透明部分にベッタリ付着→筋になってしまうしな
見開き限界まで攻めたい場合
糊から1mmくらいで裁断する→1枚1枚分離できてるか確認→分離できていない頁を別途裁断する
ってやるしかないんじゃないかな 糊がどの程度残るのかは、本によって変わるから何とも言えないんだよね。
同じ雑誌でも、綺麗に糊が取れてほとんど 手間がかからないこともあれば、糊が数ヶ所残っていて手作業で取り除く必要がある場合もあるし。 グレースケールなら高圧縮になるグレースケールに特化した画像形式って無いの? JBIG2圧縮非可逆モードのくだりを読んだが
画像をOCRしてテキスト化したら高圧縮みたいなやり方なんだな また適当なこと言ってるやつがいるな。
JBIG2 はグレイスケール用じゃないだろ。 >>913
JBIG2には規格上はグレースケールもカラーもあるよ
使われてるの見たことないけどな >>914
そういう拡張を提案していた日本人研究者がいるのは知ってるけど
それって正式採用されたんだっけ? そもそも使えるソフトが存在していないんじゃ。 >>915
ISO/IEC 14492 Amd.3に入っちゃいるぞ
どこで使われてるのかマジで知らんけどな >>916
なるほど。修正3で採用されたのか。
どこかで実装されてるのかな。 >>917
規格自体は2019年にも改定されてるみたいなんで、どこかで使われているのは確かなんだろうけど…… eTilTranで、自動傾き補正ができなかったもので「0」のまま出力するとそのページだけ出力されないのですが、対処法はありますか?
jpeg→pngもjpeg→jpegもどちらもできませんでした。そのページだけ抜かされて出力されてしまいます。 補正なしフォルダに入っているのを見落としたとかではないですよね? となるとファイルが壊れているとかかもしれませんね。
問題なく開ける別ソフトで一度開いて、別名で保存し直して試してみるといいかも。
私もetiltranはよく使っていますが、書き出しでエラーが出たことはないので chainLPの出力ができません。
アプリケーションのコンポーネントでハンドルされていない例外が発生しました。
ファイルまたはアゼンブリまたはその依存関係の1つが読み込めませんでした。指定されたファイルが見つかりません。
と出てしまうのですがわかる方いますか? >>923
書き出す際に出力画像フォルダ分類という欄のチェックを外すことで解決しました。ありがとうございました! 難しいことがいろいろ書いてあるけど、結局存在しないファイルを指定してるんだろう
よくあるのは、日本語ファイル名とかshift-jis以外とか 取説読まずに使うからだろ
各入出力で別途必要になるexeやDLLが書いてあるのに >>926
ありがとうございます。
存在しないファイルというのはどういうことでしょうか? 存在しないファイルってのは、ファイルが存在しないということなんですよ chainLPでトリミングなどをしたのですが、表紙と半分の大きさが元々違うみたいで表紙の部分だけ他のページと大きさが合わず気になってしまいます。リサイズしたくないので高さや幅はそのままで表紙のみ揃える方法があれば教えてください。 chainLPでトリミングなどをしたのですが、表紙と半分の大きさが元々違うみたいで表紙の部分だけ他のページと大きさが合わず気になってしまいます。リサイズしたくないので高さや幅はそのままで表紙のみ揃える方法があれば教えてください。 お前んち、天井低くない?
お前んち、天井低くない? ごめんなさい!
表紙と本文部分です!
元スケールのままPDFにしたら表紙だけ大きさが違ったみたいで。 カラーのカバーの表紙のことです。見返しなどは元々付けていません。 PDFなら表示するときに勝手にリサイズしてくれるから大きさの違いなんか気にしない
どうせスキャンする前から大きさが違うんだからリサイズする気がないならそういうものだと諦める 何で読むかによるけど、ChainLPを使うケースというのはリサイズしない前提が多くないか >>943
i文庫で読んでますが表紙だけ大きさが変わってしまいます。
他のアプリだと大丈夫なんですかね? リサイズが嫌なら解像度を変えてスキャンすればいいじゃない CainLPは表紙と本文で設定が別れてたような気がするが詳細は覚えてないわ
設定全部見直してみれば合わせることは可能だったはず、たぶん 自動ではうまく行かないことも多いので、各ページ毎にいろいろ調整はできたな
読むのに困らなければそんなとこ凝っても仕方ないようなのばっかりなので触らないけど アマゾンさんのおかげで裁断機の修理が出来たで、ベアリング1つ替えるだけで済んだが、構造が解らず全バラシしたから、再組み立てに苦労したわ、、
頑丈に出来てるのと、裁断刃の動きが解った、、前方へズリ動かす動きだからシワになるはずやわ
ベアリング…ニードルベアリング10個650円、9個残った 自炊データをパソコンからスマホに転送したいんですけど特定のデータだけデバイスが応答していないか切断されていますってなるんたが何が考えられるだろう
パソコン側の自動再生はオフにしてあります っていうか、スマホにデータ転送すること自体が結構ハードル高い
いろいろ試してスマホ側でftpサーバ立てる方法に落ち着いたけど、
それでも謎の駄目文字とかある ここでeTilTranを知りました。
スキャンしてjpgで排出して、eTilTranで一括で傾き補正をすると、自動的にシャープネスなどもかかって、かえって読みにくくなることがあるのですが、そのあたりの調整をどこでしたらよいのでしょうか? スマホへぼ転送はNAS経由でやってるな。
時にはGoogleDriveも使うけど。 クラウド経由はファイル内容によっては警告なしBANの場合あり。 PCと泥ならNearby Shareでいいんじゃないの 元々スマホ同士でファイルを転送しかできなかったのが、PCも加わったのね
それも共有スペースにファイルを置いて、相手側でそれをコピーして、という手間があるけど
もっと直接的に、スマホのmicroSDをPC側からドライブとして認識して、
コピー、削除、同期をPCの操作だけで完結した方が楽だし自動化もできる
まあ、USBで繋げばできるんだけど、充電用のマグネットをいちいち外したくない こういうことがあるからmicroSDスロット付きの機種しか使えない データが大量にある時はUSB繋いでPCから流し込むけど
MTPだと接続切れるたびエクスプローラが勝手に閉じちゃって階層辿り直しになるからかえって面倒くさい
SMB使えるファイラでスマホタブ側から操作して引っ張ってくるほうが自分は楽かな
x-ploreとかだと一応同期化もできるし
個人的には 泥←→iOS間がめんどい >>959
近年の充電マグネットケーブルはデータ転送可能なものが主流だよ あのへんややこしいんだよな
データ転送可能を検出すると急速充電してくれないのでデータ転送できないのを選んでる
一度選ぶと全部それに合わせないといけない うちでは転送に失敗とか経験がないな。
電波が弱いとか、ウィルスチェックやファイアウォールが悪さしてるとか、別要因があるんじゃない? 上でも聞きましたが、eTilTranを使用している方に質問があります。
画像やPDFを開くと自動補正がかかりますが、同時に、文字にもシャープネスがかかりますよね?
そうすると、読みにくくなるページがあるので、シャープネスを切ったり、シャープネスの加減を調整したりする方法を御存知でしたら、教えてください。
どうぞよろしくお願い申し上げます。 画像やPDFを開くと自動補正がかかりますが
↓
画像やPDFを開くと自動で傾きの補正がかかりますが
です。 hangousuihanでリサイズしているのですが、
起動する度にサイズなどの設定をしないといけないのが面倒です
設定を保存する方法はありませんか?
ない場合、他に既にzipやrarにしたものを解凍せず直接読み込んでリサイズできるフリーソフトを教えて下さい 内部的には解凍するけどな
クソデカ解像度の画像のzipやrarを入手することが多いので、
全部まとめて内部のフォルダ構造を保持して画像だけ指定した高さに圧縮するスクリプト書いた 一方自分は解凍&再アーカイブが楽にできるスプリクトを書いた なんだかんだ一番綺麗に裁断できるのカールのディスクカッターだわ
次点で200DX+滑り止めシート >>975
40枚だよ
10枚は自炊向きじゃない機種だべ 某裁断機は400枚切るとか…実質100枚ほどだったw
刃が電動で回転して切るとか出来ないのかなぁ そういう紙があるのかはわからないけど粘り気のある素材だと回転工具で切ったら切断面が汚くなるよ CZUR ET18 Pro買った
医学図書館にある一冊2、3万する本スキャンするときは得してる感あっていいけど、文庫本スキャンしてるときはかなり虚無 >>980
> CZUR ET18 Pro買った
国会図書館とかに有るバババと読み取るバカ高いヤツかと思ってぐぐったら、、書画カメラか 図書館に高価な欲しい本が既にある場合には、それ専用で導入しても元が取れるかもしれない
特に思いつかないので買わない Opticbookが国会図書館に採用されてるって本当? 1頁がB5サイズの本で2ページ見開きでスキャンしたデータのPDFファイルがありますが,これを1頁ずつに分割するソフトはないでしょうか?PDFファイルから別フォーマットの画像ファイルに2パージ単位で変換することはできます. 機械的に真ん中でばっさりなら簡単だけど、境目を見極めてとなるとそれ用の判定が要る
ノドの線があるならそこで、無ければ空白部分で、みたいに JPEGとかなら機械的に真ん中で二分割するアプリはあるがPDFに対応してるかはわからん。 >>986
PDF から jpg への変換は簡単にできるので JPEG で2分割のソフトを教えてください そんなのは専用の何かを使うのではなくて、imagemagickとかで簡単にできる
使えると応用範囲が広い >>987
ImageMagickがありゃ大抵のことはできるようになるぞ >>988,989
皆さんありがとうございました。
色々あるんですね。
いくつか試してみます 真ん中でホッチキスで閉じてある冊子をホッチキスだけ外して90度回転してスキャン
スキャンは速いけど回転してるしページ順もバラバラ
これを水平に半分にして回転させてページ順にリネームする
みたいな専用ツールを探すと大変だけど自作できるようにしておくと組み合わせですぐできる 自分はスキャン時に回転させるようにして、半分子ちゃんで分割した後、あふ(afx)というファイラーの拡張改名機能を利用して 処理してるな 4枚の紙を重ねて折った本を開いてスキャンするとノンブルは、
1+16
2+15
みたいに並ぶけど、それを正しく処理できる? 残念ながら、中綴じの漫画雑誌しか分割処理はしていないので、そのような形に対応できるのかはちょっと分かりません
自分の場合、半分子ちゃんで分割されたファイルの名前末尾の[1]、[2] を利用してファイラーで絞り込み、1、3、5という風に一つ飛ばしの連番でリネームとかしています >>993
儂は横長で横綴じの本を裁断して縦に突っ込んでスキャン、、読もうとしたら上下が交互になってた
慌てて再スキャンし直したが、、捨てずにおいて助かったわ
みんなも、確認するまで置いとこうね 見開き半分にするScanTailorとかあった
chainlpで中綴じ見開きを順番に半分にできた chainLPで1ページごとのトリミングは可能ですか?
可能な場合やり方を教えて下さい。 できなかったはず
えちるの調整がめんどくなった作者が全自動でそこそこ仕上げのコンセプトで作ったソフトなので このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 143日 21時間 3分 21秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。