【ChainLP】自炊データ変換ソフト【PDFDiet】4冊目
0001名無しさん@お腹いっぱい。
垢版 |
2013/06/12(水) 18:16:43.00ID:9113lR9q
自炊したデータやテキストを変換し、電子書籍リーダで読みやすくデータを最適化するソフトのスレです。

・ChainLP
自炊データ変換界の大御所
http://no722.cocolog-nifty.com/blog/chainlp/

・かんたんPDFDiet
シンプルな余白削除、フォーマット変換なら。SonyReader との相性抜群?
http://smart-pda.net/software/PDFDietEasy/

自炊でないデータ変換(AozoraEpub3など)についてはこちらへ
【自主】電子書籍作成スレ【作成】
http://uni.2ch.net/test/read.cgi/ebooks/1297947557/

■前スレ
【ChainLP】自炊データ変換ソフト【PDFDiet】3冊目
http://uni.2ch.net/test/read.cgi/ebooks/1330112414/
0002名無しさん@お腹いっぱい。
垢版 |
2013/06/12(水) 18:19:25.41ID:9113lR9q
落ちていたので立ててみた
引き続き、どうぞ
0008名無しさん@お腹いっぱい。
垢版 |
2013/06/16(日) 13:38:05.89ID:Nbjp/Y6X
ChainLPで作成したmobiデータがNexus7だと落ちるんだけど・・・・・
PWは問題なんだけど、同じような症状の人いない?
ChaiLPで出力をMobiにしているだけで他は何もいじってなんだけどな
0012名無しさん@お腹いっぱい。
垢版 |
2013/06/21(金) 23:46:00.71ID:5qTMuddv
>>9 >>11

その気持ち、分かる。

なんていうか、、、
よく分からない一括おまかせ画像処理とかいらないから、
シンプルに余白カットだけとか、
画像の一部だけゴミ除去とか、
OCRの一部を訂正とか、

他は維持したまま、単純操作をやりたいのだけどそういうPDFのソフトって少ないよね。
0018名無しさん@お腹いっぱい。
垢版 |
2013/06/22(土) 06:34:26.37ID:jWz4VwGg
>>9
Yes。Creator が変わるので scansnap で再OCR不可。acrobat 使うしか無いよ。diet の xml 修正裏技は出来なかった。
大丈夫だったのは rightfile ぐらいかな。
0020名無しさん@お腹いっぱい。
垢版 |
2013/06/22(土) 14:15:40.66ID:BAA5335e
>>8
自分で作ったmobiをAndroidのKindleアプリで表示させると落ちるのって仕様なんじゃ?
俺は自炊本をAndroidで読む時はPerfectViewer使うようにしてる。出力時にzipかrarにしておいて
0023名無しさん@お腹いっぱい。
垢版 |
2013/06/22(土) 23:06:10.15ID:BAA5335e
自炊画像データ+上のレイヤーに透明OCR文字
のpdfを
画像データ

黒色OCR文字
に分離するのに簡単で最適なソフトってどれ?
0027名無しさん@お腹いっぱい。
垢版 |
2013/06/23(日) 22:57:37.99ID:ipXX2RTG
>>18
えっとプロファイルの setting*.xml の、
<Creator>PFU ScanSnap Organizer 4.1.14</Creator>
にすれば良いんだと思う。
設定できるのにドキュメントに書いてないのは作者が富士通に遠慮してるんだと思う。
0028名無しさん@お腹いっぱい。
垢版 |
2013/06/24(月) 00:23:17.26ID:NEqwkNcd
i2pdfで自作したPDFを更にchainLPにD&Dしたところ、そのPDFの1頁だけが本の頁分読み込まれてしまうんだが、これはバグということでいいのかな
0031名無しさん@お腹いっぱい。
垢版 |
2013/06/27(木) 07:51:27.80ID:Ur0y7u5i
chainLP,機能的には不満ないんだけど
処理速度向上させるのは無理だろうか

一括変換ファイルが千超えると2日くらいかかる…w
複数ページ処理させるとうちの環境だと何故かファイルがおかしくなるし
0035名無しさん@お腹いっぱい。
垢版 |
2013/06/28(金) 19:04:28.86ID:XDsZRgoZ
sub2.0の外付けHDDでもいいから
保存先を別ドライブにするだけで時間短縮するぞ
usb3.0の”書き込みの速いUSBメモリ”でもいいぞ
0039名無しさん@お腹いっぱい。
垢版 |
2013/06/28(金) 22:00:48.51ID:fENXZGtE
横から悪い
RAMディスクはテンポラリとして?
それとも変換前データを置いておく場所として?
0041名無しさん@お腹いっぱい。
垢版 |
2013/06/29(土) 00:20:52.42ID:i2Hv6l0j
>>39
4GB割り振ってあって、スキャンしたものはそこに保存して補正。
補正後にzip化までしてからHDDに書き出してるよ。
0042名無しさん@お腹いっぱい。
垢版 |
2013/07/05(金) NY:AN:NY.ANID:3rxuE7g1
mobi出力時にKindlestrip.pyを実行する機能を追加されたので使ってみたのですが
出力された時に圧縮前のファイルと圧縮されたファイルが同時に出力されるのですが
どうにか圧縮されたファイルだけ出力出来るようになりませんか?
0043名無しさん@お腹いっぱい。
垢版 |
2013/07/19(金) NY:AN:NY.ANID:Xgx/6aXs
小説家になろうのページからD&DでPDFには出来るんだけれど
KindleDX用に2段組設定してると2段組に出来るときと強制的に1段になってしまうときがある?
KindleDXで1段組だと縦に長すぎて見にくいんだよね
0044名無しさん@お腹いっぱい。
垢版 |
2013/08/03(土) NY:AN:NY.ANID:GSk+TbKa
すみません質問です

chainLPで特定の自炊pdfファイルを開くと、
左タブにページは250枚以上全て読み込まれているらしいのですが
中身がなぜか全て同じページになっています
(プレビューも1枚)

自炊業者に頼んだpdfファイルなのですが
数点ありましてなぜかchainLPでepubやcbzに変換したあと全てが特定のページのみとなってしまいます
普通にpdfを読むだけなら破損もなく問題ないのですが…

原因がわかる方いたらご教授願います…
0047名無しさん@お腹いっぱい。
垢版 |
2013/08/05(月) NY:AN:NY.ANID:/MNTZbie
テキスト文書を横書きのままkoboで読むのはどうすればいいでしょう。
ドロップすると縦書きになってしまうので。
0050名無しさん@お腹いっぱい。
垢版 |
2013/08/05(月) NY:AN:NY.ANID:/MNTZbie
>>49
ありがとうございます。思っていたものに近いです。
頑張ってみましたが、58KBのテキストが、38KBになって出来上がり、
全体の三分の一くらいしか書き出されていないorz
どこか間違ってるんでしょうか。
0051名無しさん@お腹いっぱい。
垢版 |
2013/08/05(月) NY:AN:NY.ANID:BbMKlu9j
どっかにこんな感じで半角ハイフンが続いてるところはない?
---------------------------------------
半角ハイフンが連続で続いた行に囲まれた部分がコメント扱いにされて消えてるんだと思う
0052名無しさん@お腹いっぱい。
垢版 |
2013/08/05(月) NY:AN:NY.ANID:/MNTZbie
>>51
親切にありがとうございます。
半角ハイフン見当たりません。
25課まである解説書の、7課途中までで終わってしまう。

7課のその切れ目までを消してから新たに書き出したら
今度は31KBで、9課の途中まで。
9課のできた所の最後に半角スペースのみの行があったからそれも消したけど変化なかった。
むーん
0053名無しさん@お腹いっぱい。
垢版 |
2013/08/12(月) NY:AN:NY.ANID:IRqrsZJ6
ChainLPを使わずにいまだにeTilTranを使って傾き補正をしてるんですが
マルチコア非対応でいい加減処理の遅さがきつくなってきたので
別のソフト何かオススメあれば教えてもらえないでしょうか
こんなニッチなアプリってやっぱり世界中探してもeTilTranだけっすかねえ…
ChainLPがもっと小回りがきけばよかったんですけど
設計思想が違うみたいですしねえ
0055名無しさん@お腹いっぱい。
垢版 |
2013/08/12(月) NY:AN:NY.ANID:O9a6DA9w
>>53
俺もえちるとらん使ってるけど、傾き等をえちるとらんのGUI使って補正して
プロジェクト保存だけして、あとはそのプロジェクトのテキストデータを元に
imagemagick使ってバッチで画像処理してる。

一つの画像処理中に別の画像をと簡易マルチスレッドでね。
0056名無しさん@お腹いっぱい。
垢版 |
2013/08/12(月) NY:AN:NY.ANID:IRqrsZJ6
>>55
すみません、すこし詳しく教えていただけないでしょうか
えちるのプロジェクトデータの傾き補正情報ってこんなのの連続ですよね。

001.bmp,漫画,2916,4290,,0.00,0.00,-,-,100,X:0000 Y:0000 W:2916 H:4290,-,C:\hoge,12510718,-

これをどう変換してimagemagickに食わせてバッチ処理させればいいのでしょうか?
0058名無しさん@お腹いっぱい。
垢版 |
2013/08/12(月) NY:AN:NY.ANID:O9a6DA9w
>>56
ファイル,種別,幅,高さ,しおり,計測,補正,テクスト補正,ノンブル補正,拡大率,テクスト領域,ノンブル領域,パス,サイズ,レベル調整
というフォーマットで書かれてるから行をそのままforに入れれば各パラメータが取得できる
俺は小説ばかりなんで領域取得して余白カット・回転・リサイズ・挿絵と本文での処理変更等を一括してやってる。
これバッチの一部、パラメータ取得部。

for /f "delims=" %%x in (%project%) do (
set param=%%x
set param=!param:,,=,-,!
set param=!param:,,=,-,!
set param=!param:,,=,-,!
set param=!param:,,=,-,!
for /f "tokens=1,2,3,4,7,11,12,13,14 delims=," %%a in ("!param!") do @(
rem echo;ファイル=%%a ★ 種別=%%b ★ 幅=%%c ★ 高さ=%%d
rem echo;補正=%%e ★ テクスト領域=%%f ★ ノンブル領域=%%g ★ パス=%%h ★ サイズ=%%i
set pFilename=%%~a
set pCategory=%%~b
set pWidth=%%~c
set pHeight=%%~d
set pHosei=%%~e
set pText=%%~f
set pNumb=%%~g
set pPath=%%~h
set pSize=%%~i
0059名無しさん@お腹いっぱい。
垢版 |
2013/08/12(月) NY:AN:NY.ANID:IRqrsZJ6
>>58
ありがとうございます。
コピペでまんまでは動かないので自分なりにバッチコマンドを
調べているのですが、set param=!param:,,=,-,! の意味が良くわかりません
何のためにこの処理が4行も続いているのでしょうか?
0060名無しさん@お腹いっぱい。
垢版 |
2013/08/12(月) NY:AN:NY.ANID:O9a6DA9w
それはパラメータが「-」じゃなくて無しになってる場合、つまり
 あいうえお,-,かきくけこ
ではなく
 あいうえお,,かきくけこ
みたいになってるとそこの項目が飛ばされて順番がずれてしまうので
「,,」を「,-,」に置換してる。
大体しおりのところがそうなってるんで1回でもいいんだけど、他にも出てきた時の為
念のために4回位置換してれば十分かなと。
0062名無しさん@お腹いっぱい。
垢版 |
2013/08/12(月) NY:AN:NY.ANID:IRqrsZJ6
>>61
ありがとうございます。
さらに調べてみたところ私の環境では
× set param=!param:,,=,-,!
○ set param=%param:,,=,-,%
とすれば期待した動作をしました。

!はNT系のコマンドインタープリタ「cmd.exe」でサポートしている遅延環境変数を表現する時に採用されるとかなんとか、ググったらヒットしましたけれどよく分からないのでスルーします
0063名無しさん@お腹いっぱい。
垢版 |
2013/08/12(月) NY:AN:NY.ANID:O9a6DA9w
遅延展開はリストを処理する場合に必要なんだが…

どうもバッチって何?というレベルに近い感じで
まあ先は長そうだ頑張ってくれ。
0064名無しさん@お腹いっぱい。
垢版 |
2013/08/13(火) NY:AN:NY.ANID:6G1sJRCT
>>63
NT系といっても、Windows XPからは基本全てNT系のはずなので
なぜうちの環境(Win7 64bit)で動かないのかよく分からないですね

for /f "tokens=1,2,3,4,7,11,12,13,14 delims=," %%a in ("!param!") do @(

ここのdoの後の「@」もついてると動きませんでした。
削除すると期待通りの動作になりました。
0065名無しさん@お腹いっぱい。
垢版 |
2013/08/13(火) NY:AN:NY.ANID:OvJhrUxd
そりゃ全体は200行位のバッチの途中だし頭も尻も無いんだし、パッとコピペして使えるわけがないよ…
ある程度知識があるもんだと思って書いたわけで、コマンドの意味が分からないレベルとは思ってなかったから。
OSは同じ7の64bitさ。
0066名無しさん@お腹いっぱい。
垢版 |
2013/08/21(水) NY:AN:NY.ANID:ENwHL8fP
chainLPでページ番号をつけてくれないかな
自炊本のページ番号をそのまま入れるとページ番号と本文までの余白のため
かなり字が小さくなってしまう。
ページ番号をトリミングするとどこを読んでいるのかわからなくなってしまう。
0068名無しさん@お腹いっぱい。
垢版 |
2013/08/29(木) NY:AN:NY.ANID:ORNvf16m
chainLP、ルーラー配置のノンブルのフォントサイズってどっかで調整できる?
やたら大きなフォントで本文とかぶっちゃって使い物にならんのだが
0069名無しさん@お腹いっぱい。
垢版 |
2013/08/30(金) NY:AN:NY.ANID:obMk3ank
>>66
もし、活字印刷の小説本のようなものでしたら、
まずは、ノンブル転送を試してみてはどうでしょうか。
(詳細設定->ページ補正タブ->小説解析)
(画像タブ内でページ補正を有効にするのも忘れずに)

参考までに、私が使っている設定値で関係するのを以下に。
ページ補正
 無効サイズ  13pix
 除去リミット 12から10%
 膨張サイズ  8pix (この値はノンブルの大きさの想定値でもあるらしい)
(この値でもノンブル転送の具合が悪い場合は、編集メニュー内の
事前トリミングを行って、ノンブルを仮想の紙の端により近づけてみる)

コレでうまくいくといいですが。どうでしょうか。ではでは。
0070名無しさん@お腹いっぱい。
垢版 |
2013/09/01(日) 19:44:40.73ID:hWYZINtz
RightFile以外で左綴じから右綴じに変換出来るソフトって無いですか?
パブーで購入したPDFなんですけど圧縮形式らしくRightFileでは弾かれて弄れないんです
0071名無しさん@お腹いっぱい。
垢版 |
2013/09/07(土) 20:22:25.52ID:MMPntcdn
age
0075名無しさん@お腹いっぱい。
垢版 |
2013/09/11(水) 09:38:01.92ID:ZS50kGzG
かんたん使ってる。前はChainLPだったけど、いちいち変換してやるのがめんどくなった。
その点かんたんはD&Dだけだからな。
こだわりがなければ自由度は変わらんと思うけど。
0078名無しさん@お腹いっぱい。
垢版 |
2013/09/15(日) 12:20:42.33ID:rN0wRtwq
ChainLPもノンブルが章の名前とか続いて長かったらトリミング失敗するね
でも事前トリミングで範囲広げて削れば問題ない、どうしようもないのは設計ミスじゃないかな?ダイエットくん
0081名無しさん@お腹いっぱい。
垢版 |
2013/09/17(火) 15:04:15.55ID:BxrUBnKS
何がどう悪いか、どのように改善すべきなのか
具体的な提案が出せないようでは、押し付けがましいのは
むしろクレームを出してるほうだよな。

とはいえ、私もかんたんPDFは使わなくなったんで大きなこと言えない。


前はChainLPだと読めないPDFがあったので使ってたんだが、
Acrobatで、読んだ後、保存しなおせばいいことに気がついたorz
0082名無しさん@お腹いっぱい。
垢版 |
2013/09/19(木) 15:51:01.26ID:k6RHD7rV
ChainLPで自炊したPDFファイルをkobo gloの解像度[758*1024]、ページ補正小説優先、ガンマ補正1.6、シャープネス3で、CBZファイルにしたら、
元pdfファイルサイズが22.6Mなのに出来上がったcbzファイルサイズは80M。orz
こんなもんなのか?
0084sage
垢版 |
2013/09/19(木) 16:45:39.14ID:k6RHD7rV
>>83
画像設定というのは、詳細設定の画像タブの色深度のところかな?そこは8bitになってる
ためしに元スケールで出力してみたら130Mになりやがったorz
Scansnapで取り込んだ文庫の小説であるが…
みんなファイルサイズは小さくなるんだよね…?
0086sage
垢版 |
2013/09/19(木) 16:49:12.42ID:k6RHD7rV
>>85
・元pdf白黒二値(+win8 64bit) です
0087名無しさん@お腹いっぱい。
垢版 |
2013/09/20(金) 00:51:54.88ID:6bRhVsAf
・元画像 白黒ニ値(1ビット) : スキャンの段階で極限まで省サイズ化されてる
・ガンマ・シャープ補正 : 二値画にやっても効果なし、意味のない補正
・縮小 : 減色すると色数は増える。グレスケなら256色(8bit)化するのでそのままではサイズは肥大する
・色深度8bit CBZ出力 : 中身はjpg? png? どっちにしろ koboは16色(4bit)階調しかないので色深度 8bitは無駄

色深度1〜4bitにして画像形式をPNGかGIFにしてみ
E-Ink用に縮小しない場合でも二値画のjpg化は害しかないので割けること
0088名無しさん@お腹いっぱい。
垢版 |
2013/09/20(金) 00:54:20.03ID:6bRhVsAf
×縮小 : 減色すると色数は増える。
○縮小 : 縮小すると色数は増える。

いかんわ、減色で色数増えたら困るね
0089名無しさん@お腹いっぱい。
垢版 |
2013/09/20(金) 03:34:54.65ID:OumqdjeO
減色のつもりが増色になってるというオチかw
しかも補正によってノイズが乗り圧縮が効きにくくなってる、と
0091名無しさん@お腹いっぱい。
垢版 |
2013/09/20(金) 12:07:17.86ID:6bRhVsAf
256階調グレスケではなく16階調にしたいから
jpgは色数を制限できないフォーマットなため、256階調グレスケかフルカラーのどちらかしか作れない
二値画像はjpg変換した段階で2色ではなくなり余計なノイズが入る


あとそれとは別にwin7には256階調グレスケが16階調に強制減色表示になるGDI+バグがあり
ChainLPは読み込み時に影響を受ける
http://awabi.2ch.net/test/read.cgi/download/1343758619/406,414-415

win7上で起動したChainLPはグレスケjpg(pdf)を16色画像として読み込んでしまうのであまりよろしくない
グレスケjpg→(16階調化!)→ガンマなど補正→デバイスに合わせた縮小→デバイスに合わせた減色

ScanSnapだとスキャン段階で白飛ばし入ってるから見た目的には気にならない程度の変化かもしれない
ただ、サイズ肥大の原因になってる可能性はある
0092名無しさん@お腹いっぱい。
垢版 |
2013/09/28(土) 08:51:11.83ID:8cP23vMm
>>90
圧縮率が標準ぐらいでもぼやけると思う、字がにじむっていうのかな
pngは色数を減らすが、にじまずに白黒はっきりする、だから白黒原稿には合うんじゃないかな?
挿絵はjpg、本文はpng、俺はこうしてる
0093名無しさん@お腹いっぱい。
垢版 |
2013/09/28(土) 10:27:18.79ID:G8zC9FCX
白黒はっきりなのは2値でしょう
でも16階調とかのパネル用に2値は不利だからアンチエイリアスをかけるのが普通で、
画像は最初からにじんでいる

それがjpgかpngかで差が出るとしたら、圧縮のしすぎによるアーティファクトが
見えてしまう場合で、それは圧縮の設定に問題がある
0094名無しさん@お腹いっぱい。
垢版 |
2013/09/28(土) 15:58:37.50ID:gidPvhQG
アーティファクトでググったけど意味が分からん
jpgは不可逆でpngは可逆。 この段階で歴然とした差がある

jpgで保存したら2値だろうが16階調だろうがフルカラーかグレスケ256階調に増色されるし
16階調しかないE-Ink端末でそれを表示したら端末側で再度減色しなくちゃならなくて遅くなる

jpgの圧縮って、ようはどこまで劣化させるかってことだし、
見た目に影響しないレベルまでクオリティ上げようと思ったら16階調pngよりサイズが大きくなる
jpgはあくまで写真みたいに階調の多いもの向けのフォーマット、クッキリハッキリの画像は苦手なんだよ
レスを投稿する


ニューススポーツなんでも実況