X



トップページ電子書籍(仮)
1002コメント428KB
自炊技術総合25 @電子書籍板
レス数が900を超えています。1000を超えると表示できなくなるよ。
0001名無しさん@お腹いっぱい。
垢版 |
2018/01/10(水) 05:34:15.04ID:/7TF4DuT
書籍を自分でスキャンして電子化する、
通称「自炊」についてのスレッドです。

■前スレ
自炊技術総合23 @電子書籍板
http://rio2016.2ch.net/test/read.cgi/ebooks/1485175560/
自炊技術総合24 @電子書籍板
http://rio2016.5ch.net/test/read.cgi/ebooks/1501637878/

■関連スレ
【コミック】自炊技術総合スレッド43冊目【書籍】
http://yomogi.2ch.net/test/read.cgi/download/1442423719/

■参考サイト
自炊技術Wiki
http://wikiwiki.jp/bookjisui/
0809名無しさん@お腹いっぱい。
垢版 |
2018/03/13(火) 22:54:29.79ID:DBqyMx6T
一時期使ってたが別に粉なんてふかなかったけどな。
マツキヨで買ったヤツだけど。

酒税対策もイソプロパノール配合でクリアだし。
あとは苦味成分入りのもあるね。

塩の入った消毒用アルコールって、機械の金属部品にも悪影響あるだろうし
出来れば避けたいから具体的に製品名とか教えてくれると助かる
0813名無しさん@お腹いっぱい。
垢版 |
2018/03/14(水) 05:17:07.98ID:Ga45kB/B
そもそも酒税対策で混ぜ物って食品ではないことにするって方向が多いのに、
食品でもある塩を混ぜて酒税対象外になるのか?

塩化ベンザルコニウム配合のものもあるけど、これのことかな?
こいつらは消毒薬として売られてる物ばかり引っかかるけど、
消毒用エタノール銘で売られてるものの中にもあるんかな?
0814名無しさん@お腹いっぱい。
垢版 |
2018/03/14(水) 07:44:48.80ID:Wb+CV3JD
やっぱ200万近くするスキャナを使ってる代行業者の品質にはかなわないや
0816名無しさん@お腹いっぱい。
垢版 |
2018/03/14(水) 08:43:36.69ID:xQxXDOUV
>>808
それってどこ情報?
エタノール 塩 でググってもエタノール沈殿しか出てこないし
一般に「消毒用エタノール」と呼ばれるものは酒税対策されてないはずだけど
http://general.kenei-pharm.com/learn/influenza/2918/
http://general.kenei-pharm.com/faq/ethanol/

無水エタノール
エタノール濃度99.5v/v%以上、酒税対策されてない、高い

消毒用エタノール
エタノール濃度76.9〜81.4v/v% 残りの成分は水、酒税対策されてない

消毒用エタノールIP
エタノール濃度76.9〜81.4v/v% 飲用不可能にするためにイソプロパノールを添加(酒税対策) 残りの成分は水、安い
0817名無しさん@お腹いっぱい。
垢版 |
2018/03/14(水) 15:35:07.21ID:Y04smsWH
消毒液を消毒用アルコールと勘違いしてるだけじゃね?
店舗の入り口とかにおいてある手の除菌用アルコールには塩化物入り物があるし。
0819名無しさん@お腹いっぱい。
垢版 |
2018/03/14(水) 16:15:22.41ID:b+DBFv8d
折角だからシャーペンで書いたノートをスキャンし続けるとこんな汚れの影響が出てくるってサンプルアップしといた


https://i.imgur.com/FY6Bgiu.jpg
iX500で白黒で1200dpiかつ濃さ5でスキャン
シャーペンで書いたノートを300枚ほどスキャンした辺りでこのような汚れの影響が出てきた
まるでマジックペンのにじみみたいになってる
ミクロに散らばった黒鉛が影響してるのだろうか?
0823名無しさん@お腹いっぱい。
垢版 |
2018/03/15(木) 00:50:30.84ID:ftQZBKxd
大した価格差じゃないからわざわざ消毒用なんて買わないが、
塩が〜とか粉吹くとか根拠不明のネタには気になるからな。

無水でも酒税対策されたものもあるし。
0828名無しさん@お腹いっぱい。
垢版 |
2018/03/15(木) 08:25:17.09ID:4ylU8/n2
>>826
モアレ低減させて網点潰してノイズ除去で均す
jpg設定は サンプリング比 4:4:4にする(重要)
品質の値はファイルサイズと画質見ながら適当に調整
最後にjpegtranなどで最適化する
0829名無しさん@お腹いっぱい。
垢版 |
2018/03/16(金) 22:40:07.14ID:W/RD2rP6
EPSONのスキャナって黒背景にできないんだな
黒背景でオーバースキャンしてエチルトランにかけたら傾きガッツリ補正できるって知ったから期待したのに
0832名無しさん@お腹いっぱい。
垢版 |
2018/03/17(土) 19:36:58.19ID:hhfjRiHp
背景黒だとセンサーのキャリブレーションが出来ないからね。
一時的にでも白にしてキャリブレーションする機構が必要になる。
つまり余計なコストがかかる
0836名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 09:41:28.59ID:xQb41LOx
なんか設定おかしくなったせいかRalpha使うとファイルサイズがもとより大きくなるようになってしまったぞ
死ねよ
0837名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 11:11:02.82ID:xQb41LOx
Ralphaで変換したら、縦×横って意味での大きさが10倍になってしまったんだがなんで?
画面上部の「大きさ 比率(%)」って所は「100%」のままいじってないんだが

バグ?
0838名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 11:19:55.97ID:a1ZmsRay
jpg to jpgで補正もリサイズもせず4:4:4で再サンプリングだけしたの?
それ全然意味ないよ
低画質の狭い箱に詰めるために捨てられたデータは高画質の大きい箱に入れ直してももう取り戻せない
ScanSnapなんかだとスキャンの段階で4:2:0にされちゃうしな

完成版で画質とファイルサイズ減の両方を取りたいならスキャンの段階ではケチっちゃダメ
600dpiできれば可逆で保存して網点潰してきちんと均してからリサイズする
補正リサイズ後のデータなら元がjpgでも4:4:4で再サンプリングする意味はたぶんある


Ralphaの設定戻したいならRalpha.ini捨てるかリネームして初期化すればええ
デフォルトだと品質90サンプリング4:2:2だから
どっちにしろIX500とかでスキャンしたjpgよりは大きくなるはずだがな
0839名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 11:30:53.73ID:xQb41LOx
変換後のファイルが72dpiにいつの間にか落ちてたんだが?
元が600dpiだったのにどこで変わるんだ?
0842名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 13:01:10.89ID:7zwVqXDz
どうしても市販の電子書籍や自炊代行業者みたいに、
見開きの上下のズレをなくせないや
結構奥の深い世界なんだなぁ
0844名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 16:49:12.42ID:xQb41LOx
「俺はカラーページをこんなに高画質なのにこんなに小さいファイルにしたんだぞ」って自信ある人はどんなもの持ってるかサンプル見せて欲しい
0845名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 16:54:55.96ID:zuG2kMWa
先輩方に質問なのですが、スキャンのガラス面の内部にホコリが入って、分解してきれいにした人
いますか? 
DRC225wで、いくらアルコール等で拭いても、4本くらい、消えない縦線があり(カラーの場合
めだつ)、おそらく内部にホコリが入ったのではと疑っています(ぱっと見、密閉されてるのになぜ?)

それと、電子コミックで売っていればこんな面倒で、神経を使うことをしなくても良いのですが
1番書籍数が多いとネットで出ていた DMM で 成年コミック雑誌 例えば ポプリクラブ 
とか検索したら ほとんど無くて で、 これから、 少しずつ過去の 2000年前後とかの成年コミック
雑誌とか 増えてくると思いますか?  増えそうなら、いま電子化しないで待つ作戦もありなのかなぁ。

それと、一番いいのが、雑誌出版社が、雑誌データー→紙雑誌、雑誌データー→電子雑誌
と、作ってくれれば良いのですけども、無理がありそうでしょうか?

長文すみません。
0846名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 17:31:22.47ID:zAwlEYsJ
バラして掃除はしたことがあるが、一台はガラス割っちゃった。
センサーは基本的に密封はされてないよ。
ガラスが外せる機種以外はエアブロワーとか使うと中にホコリが入って終わる。
そういう機種は取説にエアブロワー使うなって書いてあるはず。

成年コミックは現役作家の過去作品なら電子復刊の可能性あるだろうが、
引退済みの作家だとよっぽどの名作を持ってる作家以外は権利者(つまりは作家)と連絡取れなくて
復刊は無いと思う。
Jコミとかの方が可能性あると思う。
なので自分は引退済み作家の本をスキャンすることが多いかな。
80年代とか90年代とか、消しや題材の変化が結構興味深い。

成年マンガって記載雑誌や出版社に関係ない出版社から単行本が出るケースが見られるように、
作家が全て権利持ってることが多いように思う。
なので過去雑誌の復刊はほぼ無いと自分は見てるよ。
例示のポプリクラブなんて結構複雑な経緯あるし難しそうだ。
0847名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 18:43:20.04ID:zuG2kMWa
>>846
レス有難うございます。
僕も前モデルの125で、ダメ元で外したりして、パキッとガラスを割ってしまってます(貼り付けが
強力すぎる)。そうか、密閉じゃないんですね、ブロワはやってないんだけどなぁ。

成年コミックって複雑なんですね、単行本は、ぶっちゃけ、古本屋にだいたいあると思うからすんなり
捨てようと思えばできるのですが、ポプリ、パピポ、桃姫、アンリアル等々、雑誌は店にあまりないから
捨てれない、でかい、大量で、しかも、過去雑誌の復刊はほぼ無い、かぁ。

カラーでの縦線が目立つだけで、モノクロはそうでもないから、意を決して、
表紙、数枚のカラーを犠牲にして電子化するかなぁ。
0848名無しさん@お腹いっぱい。
垢版 |
2018/03/18(日) 22:51:37.84ID:qz9nkXQE
これ縦線だらけだけど、ADFってのはこのぐらい割り切って使うもんなんだと思う
https://books.google.co.jp/books?id=IvbNkQ8N4dcC&;printsec=frontcover&hl=ja#v=onepage&q&f=false

ガラスは二回割ったなあ
CANONの安いやつは
ガラス面はいじらず、爪を持ち上げれば裏側から小箱の中は掃除できるとあとでわかったが
どちらにせよケーブルが身近すぎて簡単にはメンテ不可
やるときは処分前でケーブル差し込めたらラッキーってな感じでやるね自分は
0849名無しさん@お腹いっぱい。
垢版 |
2018/03/19(月) 05:20:42.42ID:WdqASvVA
オフィス用の複合機のADFでスキャンする程度の画質が目標だろうとは思うけど、
X10Cのようにクリーニング機能付ならこれほど酷いことにはならんと思うけどな。
オフィス機は補正が強くかかるってのはあるが。

でも自炊ユーザーが神経質にガラス清掃しまくるような画質は望み過ぎだろうね。
画質自体もちょっと良さ気なフラベに簡単に負ける程度だし。
0850名無しさん@お腹いっぱい。
垢版 |
2018/03/19(月) 09:30:32.89ID:ZzQMTd1+
>>848
ひどすぎですね、逆に、これに比べれば自分のは1割もないから、解決にはなってないけども、
うん、ありがとうございます。

ボックスのフタ部分(ガラス表面の所)を爪を解除して取って清掃しても内側ガラスの端っこに、
ほんんっの少し何かが残って(つまようじ、綿棒、等、色々やりました。)結局、ガラスを取り外さないと
、まっさら状態じゃなくて、はずす時、パキッ、終了、でした。

今の225も前機の1割もスキャンしてない(量的にはほぼ新品)のに内側にホコリが入って
ほぼ使えない(画質の意味で)状態になったしまったけども、電子化はなさそうだし、いつまでも
部屋を占領するわけにも行かないから、やるしかないなぁ。

それにしても、メーカーの修理(清掃は)はどうやってるのかなぁ、全バラ(スキャン周り)、
ガラス交換(割らないでやってるのかなぁ)、気になりますね。
0851名無しさん@お腹いっぱい。
垢版 |
2018/03/19(月) 10:24:28.27ID:Rp+B04r4
>>850
DR-C125でガラスの内側にゴミがついた時は京セラの電動砥石の振動で落とせたけど
やってみるのなら超音波電動歯ブラシかスマホの角を当ててバイブレーション?
CISセンサーは衝撃に弱いので壊れるリスクもあるけどね(パナ機の分解掃除で壊したw)
まーガラス割れても代わりにアクリル板貼ればまた使えるよ
0853名無しさん@お腹いっぱい。
垢版 |
2018/03/19(月) 12:24:37.08ID:eemoQEJj
機構ほとんど同じに見えるし外せるんじゃね
気になるなら取説ダウンロードして確認してみれば
0855名無しさん@お腹いっぱい。
垢版 |
2018/03/19(月) 12:38:19.46ID:ZzQMTd1+
>>851
CISセンサーって棒ガラスみたいなやつですよね? 125の時、7回くらい、縦線が入るたびに、分解、清掃
やってて、いつの間にか割れてましたが、どういう仕組でスキャンしてるんだろう、結局ボックスに入ってるのって
あの棒ガラスみたいなのだけですよね、その上に板ガラスがあって、って感じだし。

板ガラスの替えのアクリル板も、ホムセンでこのサイズでカットして下さい、ができるかな?
どちらにせよ、センサーを割るリスクがあるから、使い潰したやつじゃないと怖くてできないですね。
0856名無しさん@お腹いっぱい。
垢版 |
2018/03/19(月) 13:57:01.88ID:ncYPmPCc
CIS:コンタクトイメージセンサー
センサー自体はCMOSイメージセンサーだよ。
ただし、レンズと一体化されてて、ほぼ密着の位置にフォーカスが合うようになってる。
棒状のもの一列に並んだCMOSセンサーに合わせて作られたレンズね。

アクリルのカットはPカッターを使えば個人でも簡単に切れる。
でも個人で切ると端面をきれいにするのが難しいのでオーダーカットしてくれる通販も良いと思うよ。
ホームセンターのカットサービスではアクリルに対応してくれる率は低い印象。
アクリルだと傷がついてだんだん曇ってくるので、ダメになったら交換する方向だと思う。
ハードコートアクリルもあるけどハードコートが接着に向かないので
ハメこんで装着できるタイプのスキャナじゃ無ければ通常アクリルが良いと思う。

オーダーカットならガラスでもあるけど、普通のガラスは色が入ってるので
オリジナルのガラスの色をみて考える。
オリジナルのガラスが色の無いガラスならそういうガラスをオーダーしてくれるところを選ぼう
0857845、847、850、855
垢版 |
2018/03/19(月) 15:31:37.45ID:ZzQMTd1+
>>856
丁寧に説明、大変ありがとうございます。いろんなレスをもらい、分解清掃する勇気が出てきました
。そもそも、センサーは以前のやつでそんなにすぐに割れた訳じゃないので、今、分解清掃
やってみます。本当にありがとう。
0858857
垢版 |
2018/03/19(月) 18:02:54.70ID:ZzQMTd1+
分解清掃、成功しました!! 縦線ノイズ5本あったのが全くなくなりました。
それはそうと、皆さん、清掃する時、アルコール、キムワイプが普通でしょうか?
僕は、ラッカーシンナー、アルコール、キムワイプですが、こんなの良いよ、みたいのがあったら
教えて下さい。
0859名無しさん@お腹いっぱい。
垢版 |
2018/03/19(月) 20:21:11.30ID:sFqXPTd4
キムワイプの話はしつこいアンチが居るので面倒くさいことになりやすい。
メガネクリーナーを勧める人も居る。

自分の場合は薬剤で清掃する時はキムワイプで使い捨て、
カラ拭きのときはカメラ用で静電気対策されたクリーニングクロスを使う。
あとは除電ハケと細いノズルを付けた掃除機。

薬剤は無水エタノールとレインXを使い分け。
一冊の始めにレインX塗り、途中で清掃したくなったらカラ拭き
レインXを塗っても縦線消えなくなったらアルコールでレインX剥がし。

こんな感じ。
0860858
垢版 |
2018/03/19(月) 20:39:03.38ID:ZzQMTd1+
>>859
細いノズルを付けた掃除機、静電気対策されたクリーニングクロス、すごい良さそうです。
参考にさせていただきます。

それと、NGワード? 出してすみませんでした、以後気をつけます。
0861名無しさん@お腹いっぱい。
垢版 |
2018/03/20(火) 05:58:33.00ID:OW6Br2As
>>858
ラーカーシンナーは強すぎで塗装がハゲるので×
アセトンのように樹脂パーツが溶けたり変形はしないがただちに使用を中止した方がいい
シリコンオフの類もきれいになるが油分が抜けすぎて×
結局弱いエタノールが○
ヘキサンはまだ試してない
0862名無しさん@お腹いっぱい。
垢版 |
2018/03/20(火) 08:06:06.68ID:Jcqrr5g6
スキャンして付く汚れなんてせいぜいがホットメルト系の糊汚れ。
しかもこびり付いただけのもの。
従って溶剤は必要ない。

アルコールを使うのは速乾性に期待しただけで、溶剤としての性能には期待していない。

自分はこんな感じだな。
溶剤を使って除去しないといけない汚れが搬送路に付くことって有る?
0865名無しさん@お腹いっぱい。
垢版 |
2018/03/20(火) 10:49:26.11ID:ds6WATat
いつからキヤノンの純正クリーニングキットが存在すると錯覚していた?

C225Wのマニュアルのはお手入れは ブロアー&水を含ませて固くしぼった布で拭けと書いてあるのな
ブロアーOKとはさすがキヤノン強気すぎるわ
0866860
垢版 |
2018/03/20(火) 14:06:05.80ID:a7f0t6uM
>>861
わかりました。

>>862
プラモ用のシンナーが残っていたのがきっかけで、ローラーに付いたインク、ガラスの汚れも取れるし
楽じゃないかな? が、きっかけです。アルコールも速乾性だけの目的なんですね、なるほど。

>>865
ブロアーはありえないですね、使わなくても、少しスキャン、パソコンほうき清掃等、だけで内側
にホコリが入り、昨日まで(約3年間)使用できなくなりましたから。キャノンは自社製品テストしてるのかな?

それと、話題が変わりますが、スキャンして、どうしても斜めにしかスキャンできない場合、対処法はありますか?

2つとも縦にスキャン、両ガイドもキッチリ、見た目には斜めにスキャンしてない(動く余地が無いのに)

傾き補正なし → https://i.imgur.com/T1fdKnv.jpg  http://imgur.com/T1fdKnv

   補正あり → https://i.imgur.com/9IbPVc6.jpg  http://imgur.com/9IbPVc6

2,3回しかUPしたこと無いので、写っているかなぁ? 左右は同じ画像です。

帯は大したものじゃないので 補正なしを今回は使いますが(それでも10分近く格闘)、
前に、きっちりスキャンしても、どうしても斜めにしかスキャンされないのがあって、40分近く、
たった1枚のフルカラーと格闘したことがあります、最後の最後にきっちりスキャンされました。

それと、補正ありで何回やっても斜めって、補正を切ったらカッチリスキャンされたりと、
補正ってなんだろう、て、ことがわりとありますね。多少の斜めはもうなれましたが、
今回の画像くらい余白とかがあると、まだ、許せないですね。
0867866
垢版 |
2018/03/20(火) 14:11:36.08ID:a7f0t6uM
今画像をチェックしたら、左の写真は背景の色も白で、写真と、背景が同一化して分かりづらいので
右側の画像を見て下さい。すみません。
0869名無しさん@お腹いっぱい。
垢版 |
2018/03/20(火) 19:00:06.46ID:Jcqrr5g6
複数のメーカーのスキャナ使ってるし、
そうなると特定メーカー用資材はかえって使いにくいんだよね。

今のところエタノールで困ってないし。
0870名無しさん@お腹いっぱい。
垢版 |
2018/03/20(火) 19:08:28.35ID:+zivbYl6
斜行補正と用紙サイズ検知をバッチリしてくれる機種ってある?
なんで代行業者の仕上げてくるデータは見開きがズレないんやろ
0872名無しさん@お腹いっぱい。
垢版 |
2018/03/20(火) 20:55:38.62ID:1Ze4Nqw0
業者は横装填してるからじゃね?
見開きが合わないのは縦方向の搬送ムラか来る伸びのズレだろうし。
0873名無しさん@お腹いっぱい。
垢版 |
2018/03/20(火) 21:50:45.36ID:3Kq+1F1u
ADFで光速でスキャンするタイプは用紙送り方向が間延びしたり縮んだりしてスキャンされる?
正方形が微妙に長方形にならない?
0874名無しさん@お腹いっぱい。
垢版 |
2018/03/20(火) 21:55:05.14ID:ds6WATat
される
fiはカラー雑誌の見開き合わせなんかも一応できたけど
コミックの見開き合わせはフラベ使った方がいい
0875名無しさん@お腹いっぱい。
垢版 |
2018/03/22(木) 07:00:15.06ID:Zh4ILSn5
>>866
自分はコミックの場合は傾き補正OFFだな。
斜めの枠線を誤認識したりするからね。
自分は読んでて傾いていてもあまり気にならないし。
フチが黒ベタなページでも認識異常起こす事があるし。

文字本の場合はページめくった時にガクっと傾くのが気になるのでマイナス設定のサイズ認識とセットで傾き補正も入れてる。
文字のページとカラーやイラストのページはスキャン設定変えて別スキャンなので
誤認識しやすいページはどうせ棄てるスキャンだし。
カラーやイラストのページはコミックと同じような設定でスキャンしてる。

基本的にはスキャナが何を縦横の基準として認識しそうか考えて、紛らわしいものがあるページや本は傾き補正を切る。
0876860、866
垢版 |
2018/03/22(木) 14:09:53.85ID:lWX//kgw
>>868
富士通のクリーナーF1、良さそうですね、ただ、価格が・・。

>>869
やっぱり1台ですべてOKってわけではないんですね。

>>873、874
間延び、縮みは初耳です、長方形しかスキャンしたこと無いから気づきませんでした。

>>875
結構複雑なんですね、知りませんでした。ありがとうございます。
0882名無しさん@お腹いっぱい。
垢版 |
2018/03/26(月) 19:27:43.96ID:P0ibwvwo
>>880
ここの住民なら名前部分のみ4800dpiでスキャンして傾き補正、白飛ばし、ダイナミックレンジの端強調、縮小(ry
とかのフォトショアクション作ってデータミス100件以下にできそう
0884754
垢版 |
2018/03/28(水) 01:50:30.19ID:Y5iSsCwf
>>752,754-755
遅レスですがWSLでUbuntu入れて環境構築できました、CygwinとかVirtualBoxとか要らんかったんや
 https://remoteroom.jp/diary/2017-10-12/
 https://linuxfan.info/wsl-setup-guide

まだサンプル動かして遊んでるだけですが WSLならコマンドラインで使えるので
GUI被せるかバッチ組めばwinのお作法でD&D実行できそう
自炊PDF → 検索可能PDF はGhostscriptでの圧縮やめて
pdftoppm の代わりに pdfimages使えば画像を変質させずに透明テキストだけ被せられる気がする
 https://marvelph.wordpress.com/2010/06/10/scansnap%E3%81%A7%E8%AA%AD%E3%81%BF%E5%8F%96%E3%81%A3%E3%81%9Fpdf%E3%82%92%E7%84%A1%E5%8A%A3%E5%8C%96%E3%81%A7%E7%94%BB%E5%83%8F%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%81%AB%E5%A4%89%E6%8F%9B%E3%81%99/


ただ hocr-tools が Ubuntu + python2.7 以外の環境で上手く動作させられずにモヤっとする
VirtualBox + Xubuntu + python2 → 成功
Ubuntu on WSL + python2    → 成功
Cgywin / MSYS2 + python2   → pipでのインストールに失敗する
python2 for windows        → 作成されたPDFの透明テキスト内の日本語が文字化けする
Ubuntu + python3          → 上と同様
0887名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 07:58:17.10ID:esddxKsP
趣味の一環と考えれば「追求型」の人がいてもおかしくないでしょ。

自分も今までつぎ込んだ機材や手間を考えたら、
自炊に興味ない人から見たら異常だろうと思われるだろうし。
0888名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 09:45:57.85ID:DcB/kgED
すまん
ここは元々取りっぱなし派補正派zip派PDF派入り乱れてるから
わかってる人興味のある人に伝わればいいかなと

既存のOCR製品やスキャナ付属のソフトでのPDF作成に不満しかなかった身からしたら
googleのOCR性能で補正済み画像からPDF作れるなら「そこまで」の価値はあった
副次的効果として今までずっと隣の芝生だった分からない世界が
Windows Subsystem for Linuxであっさり自分ちの庭と繋がったというのも大きい
0889名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 10:03:29.26ID:9xk9hkIl
大学生です
自炊してocr処理したpdfの教科書を
onenoteに入れようと思っています
onenoteなら本文を横断検索できそうだからです
どう思いますか
0890名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 10:24:39.07ID:j+QkPWa1
自炊書籍を見たり読んだりするのに最適なソフトやアプリ、ハードってどんな組み合わせだろ?
0891名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 11:02:01.35ID:G8XDa2fV
そんなの何を読むかによって変わるだろ
12インチのiPadが最適という人もいればkobominiを愛用する人もいる
0892名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 14:18:07.29ID:j+QkPWa1
>>891
それぞれ、環境別のベストバイみたいな物があれば・・・
PCで使ってるけどビューアーって言うほど洗練された物がない気がする
0894名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 18:15:32.17ID:DcB/kgED
>>889
ファイルとして添付するとOneNoteから直接PDFの中身の検索はできない
印刷イメージとして挿入するとPDF内のOCR情報は失われる

後者についてはOneNote内臓のOCR機能で新たに検索用テキストが作られるけど
>自 炊 し て ocr 処 理 し た pdf の 教 科 書 を
みたいな感じで日本語は1文字ごとにスペースが入るので検索ではほぼ使いものにならない

横断検索だと
・EverNoteに張り付けておく
・Googleドライブに放り込んどいて必要なときにブラウザから検索かける
・ローカルにPDFのまま保管しておいてDocFetcherのようなPDF対応のGrepソフト使う
あたりが実用的じゃないかな
0895名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 19:41:43.18ID:p4wgdhX+
同じく。WindowsタブレットならPicoviewer一択だな。
アンドロイドのPerfectviewerより機能的に上の部分が多いし。
自炊してる人なら買って損なしだと思う。
0897名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 21:43:29.56ID:iSIkCEO4
comicglass派
0898名無しさん@お腹いっぱい。
垢版 |
2018/03/29(木) 21:53:30.82ID:RawRO6Sa
>>884
Pythonスクリプトが見にくかったので、シェルとPHPにしてみた。

シェルでcurlコマンドでGCVにOCR処理を投げて、自作のPHPでjsonをhocrファイルに変換、最後にgostscriotでPDFに変換って感じ。

WSLで使うのは考えたことなかった。
Unbuntsは苦手なのでFedoraが出たら試してみる。
0899名無しさん@お腹いっぱい。
垢版 |
2018/03/30(金) 01:56:38.54ID:R11rCi4J
すごいなあリナックスで自炊とかマゾとしか思えん
なぜそんな険しい道をゆくのか
すごいなあすごいなあ
0900名無しさん@お腹いっぱい。
垢版 |
2018/03/30(金) 08:02:14.89ID:bfeJG0Kd
趣味嗜好なんて他人に理解できなくて当然だろ
自分も酒やたばこをうまいと思ってる奴らの嗜好が理解できん
0902名無しさん@お腹いっぱい。
垢版 |
2018/03/30(金) 11:59:27.35ID:93BxV1mX
>>898
よろしければ差支えない範囲でコード見せていただけないでしょうか、特に
>最後にgostscriotでPDFに変換
のあたり

自分もhocrファイル作成までは何とかわかるんですが
hocr→pdf の部分がhocr-toolsでpython依存になってしまうんですよね
ここのやり方理解できてうまいことwin用バイナリ組み合わせられれば
linuxに下りなくてもできそうな気がしてるんですが
0906名無しさん@お腹いっぱい。
垢版 |
2018/03/30(金) 19:05:21.87ID:93BxV1mX
>>903
そうでしたか了解です、無理言ってすみませんでした。
ググってて hocr2pdf というのも出てきたけど透明テキストじゃなくてテキストに置き換えるっぽい?
とりあえずhocr-pdfの代替には無理みたい


調べる過程でtesseract-ocr ってフリーのOCRツールを知ったんですが
これ、素のtesseractのWindows用バイナリ(ver4α)だと残念な感じだったのに
フロントエンド被せてある VietOCR がGoogleさんもびっくりな認識率で驚いた
カスタマイズで相当辞書を鍛えてるっぽい?
https://i.imgur.com/tj1ARCW.png

tesseract.exeでは1ページずつだけどOCRからPDF出力までできるのでVietOCR同梱のほうで
tesseract.exe -l jpn hoge.jpg hoge pdf
バッチ組んであとでgsとかで纏めればローカル環境だけでそこそこ精度のPDFが作れてしまう予感
レス数が900を超えています。1000を超えると表示できなくなるよ。

ニューススポーツなんでも実況