【Calibre】電子書籍 保存・管理・変換・編集ソフト part1
レス数が900を超えています。1000を超えると表示できなくなるよ。
https://calibre-ebook.com/
Wikipedia https://ja.wikipedia.org/wiki/Calibre
Calibreとはフリー・アンド・オープンソースの電子書籍ソフトウェアであり、
電子書籍を保存や管理を行うことが可能で、多数のフォーマットに対応している。
またDRMのかかった電子書籍を他のフォーマットへ変換でき、
数種類の主な電子ブックリーダーと同期することができる。
使い方説明サイト
http://gihyo.jp/lifestyle/serial/01/calibre
Calibreについて語りましょう >>834
そういうボタン無くても運用次第でそれっぽい事は出来ると思うけど…
デバイスの本を表示させて全部選択し書誌情報をまとめて編集でタグ(転送済とか)を追加
後はタグブラウザでそのタグを − にすればそのタグの無い本だけ表示させられる
こういう方法じゃダメかな? >>833
端末接続後なら、゛デバイス上゛フィールドでソートかけたり仮想ライブラリ作れば未転送な書籍のリスアップくらいできるものな
端末接続前に知りたいってのだと事前にカスタム書誌情報にユーザー設定項目を作っといて端末毎に接続時のフラグの保存やっとくとかかなぁ 端末接続後です
「゛デバイス上゛フィールドでソート」で目的が達成できました
ありがとう! Calibre使えばソニーのreaderstoreで購入した書籍のdrmって外せますか? Kindle for PC 1.21に書籍をダウンロードしたのですが、ファイル形式がAZWでそれをCalibreでAZW3に変換しようとしても失敗します。
Clibreのプラグイン(DeDRMなど)はインストールしてます。
他に原因があるとしたらどういった点でしょうか? >>843
1.21の前に別バージョン使ってたとかないよね?
設定->プラグインでDeDRMのカスタマイズを開き、
一番下のKindle for Mac/PC ebooksの解除キーにdefault_keyが入ってる?
入っていたら削除してやり直しを試してみる >>847
自己解決した場合その詳細を書かないのが一番迷惑
同じ質問しようとしてた人もいたかもしれないだろ
オンラインで変換ってどういうこと? それってDRM外れたazwから他の形式に変換するものじゃないの?
質問はazwからazw3に変換したいってことでしょ?変換て言い方に違和感あるけど
ダウンロードした拡張子azwをDRM外した拡張子azw3にしたいってことじゃないの?
勘違いならごめん 4.9.1になっても縦書きは全然ダメだが、縦書きにせず横書きのままなら
ルビが文字の途中で改行されたりするが、ほぼPDFに変換出来るな。 Kindleで買った本をGoogle play書籍に移動したくてCalibreでEpubにしてアップロードしたら毎回表示が変(。がその行の最後ではなく最初に飛んだり段組みが変だったり)なんですが解決策分かる方いますか?
試しにSigilで縦書きにしてみたら少し変ではあるもののまだ読めはする感じになったけどできればCalibreで完結したい 日本語の禁則処理に対応出来てないんじゃね?
unpackしてmobi8内のepubをGoogle playに移動してみたら? 複数選択して右クリックから書誌を編集→書誌情報を個別に編集を選んだときに表示される画面がこれまでと変わってるな kindle unpackで展開するとちゃんとline-breakにstrictがあるから禁則処理は期待できると思う
同じ書籍をCalibreでepub変換するとnormalしかないcssになる >>854
特に縦書きの場合、Calibreのepub変換には期待しない方が良いよ。858の言うとおり、
Kindle unpackならまともに変換できることが多い。 >>859
Kindleunpackでいくつか上手くいきました
ありがとうございます
スレの前の方にKindleunpackのこと出てたのに気付かず質問してしまって失礼しました
Kindleunpackでも上手く行かないものがいくつかあるのですが変換前のAZWをCalibreのビューワで見てみるとその時点で表示がおかしいのでCalibreが原因じゃないのでしょうか
(Amazon側の対策?) >>860
禁則処理はデータのcssで指定しビューワがそれを解釈して表示するから
表示がおかしいだけではデータが悪いのか、ビューワなのかはわからない
特にCalibreのビューワは日本語文章の表示が怪しいので
書籍によっては段落で複数行まとめて<p>タグ使ったり、行毎に<p>タグ
使ったりもあるから、epubを展開してcssのline-break指定が何か、
<p>タグの指定はどうなっているか見て個別対応するしかない >>860
そういうのはもともとの作りがマズいんじゃ?
初期の文春なんて1xhtmlにつき1CSS、しかも1行ごとに1classっつー笑える作りだし
1行ごとにline-heightやfont-size設定するとか、CSSは何のためにあるんだよと 見出しの字下げはmarginでやって欲しいわ
4〜5文字の字下げでも全角スペースでやってるのがけっこうある
短い見出しならいいけど、長い見出しで改行入ると笑えるレイアウトになっちまうぞ 全角スペース字下げは角川のラノベで目次のあとがきで使われてるのを見るな
text-decoration: overline;にすると全角スペースにまでライン引かれるので
修正してるけど面倒なんだよね kindleの小説など、文字ばかりの本をCalibreの機能でtxt変換すると
ほぼ全ての書籍で余計な「改行」が入ってしまうのだけど
改善する方法わかります? >>840
>>841
やっぱこれでも無理か
やっぱソニー最強だわ >>869
ツールバーのCalibreLibraryとある「本が4冊立ってるアイコン」を押すと
そこに「現在のライブラリを新しい場所へ移動」てのがある >>870
それやると容量多いとフリーズして永遠に終わらない
自分でライブラリをコピーして、「新しい場所で以前使っていたライブラリを使用」がベスト 色々提案ありがと
4冊立ってるアイコン、ツールバーに追加したんだけど
なぜか表示されない。。。 >>872
アイコン追加画面の「ライブラリを選択」ってアイコン
矢印付きの4冊は「ライブラリにコピー」なんで別機能 (なぜか表示されないね) タグの最初の一文字だけが前の行にあったりするのどうにかならないかな Kindleとcobo以外のサイトでdrm外せるサイト教えて下さい 新しいネタないから過疎り気味なのは仕方がないんじゃないか
たまに来るのは新参か「突然できなくなったんですけど〜」みたいなのばかり azw3からpdfに変換したときサイズが小さくなって画像も荒くなってるみたいなんだけど、どこの設定をいじったらazw3から劣化せずに変換できるのでしょうか 今のバージョンはよく知らんが
以前はpdf全体の変換後サイズを正しく指定しないとアスペクト比狂ったり空白ページ挟まれたりした
ebook-convertのマニュアルを頑張って読むか、zipとかにするのか吉 共通オプションの出力プロファイルだっけ?あの辺は設定してるのかね >>884
していなかったので変な余白などが入っていました
https://qiita.com/khys/items/1ece112eb763f49e2c32
こちらのページを見て余白設定などを消してみたところそっちは消えました
この状態でPDFにするとazw3だったときの90%ぐらいの容量になります
zipにするとほぼそのままサイズで変換されるので縮小はかかっているのではないかと思います calibreの変換機能なんざ使いモンにならん
画像だったらunpackしてimageフォルダ抜き出すのが一番 設定の「構造検出」で「最初の画像を削除する」にチェックを入れても
PDFに変換すると表紙が2枚表示されるときが結構ある
何故なんだろう…… Pythonは一切触ったことなかったけどこれを機にちょっと勉強して、
KindleUnpack - The Pluginを改造してKindle本を無圧縮zipでの出力ができるようにしてみた
https://www.junk2ool.net/tools/kindle/
DumpAZW6も取り込んだので設定したディレクトリにresがあればHD画像を差し替えて出力可能
ついでに>>395の修正も取り込んでおいた
calibre使わずKindle本をzip(epub)変換可能なDeDRM+DumpAZW6+KindleUnpackを改造したPythonものももうちょいでできる予定 >>888
いただきました
1からのjpg連番が見ててすっきりします
まだ少ししか使ってませんが、resに合ってazwに無い画像もちゃんと取り込むのがすごいですね
自分はcalibre使わないので単独Pythonスクリプトも楽しみに待たせていただきます
ありがとうございました >>888
おー、めっちゃ便利だわ…ありがとう
ファイルの連続登録が面倒だから1冊1ファイルでダウンロードされる旧バージョンのKindlr for PCを使ってるんだけど
こんな楽にHD画像のEPUB作れるならを1冊1フォルダ でresファイルもダウンロードしてくれるバージョン使いたくなるな >>888
凄いね
Calibreなしで行けるバージョンができたら>>663あたりで話題になった件の公開版ってことになるな
うちは自前でシェルスクリプト化してるがres対応はしてないから参考にさせてもらおう
自分でPython弄り出すとPython2.7の終了問題が気になり出すが、dedrmにせよunpackにせよ電書界隈は対応鈍いな まだ使ってないがこれは多分凄い
zip変換だけが目的ならCalibre要らなくなる
同じようなものを自前で作っているがpython苦手なのでうちのはbashやらperlやらごっちゃで汚い
著者名や本タイトルの処理には独自ロジックを入れたいのと目次ファイル作りたいのでcontent.opfだけは消さずに残ってると嬉しいが、まあepub出力すればいいのか これは便利。ありがたやー
モノによってファイル名のタイトル部分がエスケープされる場合があるんですが、うちの環境がおかしいんでしょうか 具体的なタイトル書かないと調べようがないと思うが・・・ とりまタダの奴だとうにぁぽさんのが一通り化けてまする 18禁しかでてこないが
タイトルにやたら「!」が付いてるからそれかな >>892
乙 ★付けてきました
.vbsの同梱まであるとはいたれりつくせりですな
うちの環境だとcondaかwslなんでコマンドラインポチポチだけど ↓みたいにタイトル部が満遍なくエスケープされるな
ロケールをja_JP.UTF-8に強制したりしてみたが変わらず
[うにぁぼ] 地下ア(略).zip
こちらの環境はdocker上のdebian10
開発者の環境(WSL+Ubuntu18.04)との違いを調べる必要がありそうだ あれ、エスケープ文字を貼ったら5ch側で日本語にされちまった
後で貼り直す こんな感じか
おバカタイトルですまん
期待するタイトル:
[うにぁぼ] 地下アイドルあるある?八景島デジフェチパラダイス♡: 撮ってくれたらよしこ感じちゃうー!!.zip
実際のタイトル:(実際は5桁数値の前に&Hが付く)
[うにぁぼ] 22320;19979;12450;12452;12489;(略).zip 連投すまぬ
KVM上のUbuntu18.04でも試したが変化なし
どうも出力ファイル名が「UTF-8エンコードしたUnicode」でなくて
生のUnicode(UCS)になってそうに見える。
タイトル先頭の「地」の字の文字コードを調べると、
Unicode(UCS): 0x5730(10進で22320)
UTF-8: 0xE59CB0(10進で15047856)
で、上の方が使われているみたい。
著者名の方はちゃんと出てるから、何かマルチバイト文字周りで問題というか動作の違いがあるのかも。
WSLだと問題ないとしたら、マルチバイトの取扱いに差がある(WSLが吸収してる?)のかな かなり昔のことでうろ覚えだが、windowsでchcp 1200(UTF-16)が
使用できなくて、win10+Python2.7の環境で文字化けしたことがあった
その時は諦めてWSLで動かすことで逃げた >>888
ありがとう
おかげで「デパート女店員になる近道」のオリジナル画像を抜き出せた そんなんばっかですいません。それらです
とりあえずおま環ってやつではなさげですね >>892
いただきました
数冊試してみましたが一つにまとまってるから処理が早いですね
もしよろしければオプションの追加を検討していただきたいのですが、
例えば -f でImageフォルダ出力
-z -e でZIPとepub出力、-e -f でepubとImageフォルダ出力みたいな感じのを
Imageフォルダ出力はkindleによくある1ページ目のNEXT PAGEや
最後のBWロゴページを消したいので
複数出力はマンガか小説かを判定してオプションを切り替えたら
良いのでしょうが、良い判定方法が思いつかないので(汗)
両方一緒に出せば良いかなぁーと
お時間のあるときにでもご検討いただければ幸いです 作者さん次第だが、さすがにそりゃ自分でやることじゃないのか
azwからepub/zipに変換するツールが出てきたんだから組み合わせでどうにかできるでしょ
特定のページを捨てたいとか、いちいち組み込んでたらきりがないと思うがな 元のスクリプトを弄らんで、
epubとzipで引数変えて二回元のスクリプトを動かすスクリプトを作る、
その後に出来たzipをzipのファイル名のフォルダ作ってそこに解凍するバッチファイルなりスクリプトなりを自分で作るのじゃあかんの? py版いいっすね
せっかくなんでkindleunpack.py内のmakeOutputFileName()弄って出力ファイル名を調整しようとしたが
pythonニワカなうえPy2のUnicode制限がきつくてつらい
[苗字 名前] → [苗字名前] にするくらいならなんちゅーこともないが
タイトルHOGE (1)
みたいな尼の全半混じりクソ表記をどうにかしようとするとわけわからん
ファイルリネームするスプリクトを別に作るほうが楽か
>>903
junk2ool氏ではないが WSL+Ubuntu18.04 で試してみたが>902のタイトルはエラーで変換できなかった
ハートがcp932(SJIS)にはないコードなのでそのせいだと思うが
この辺の問題pyt3にすることでほぼほぼ解決しそうな気がするんだが
1byte圏の人らは自分らが困らないから無頓着だよね DeDRMをpython3に対応させようとしたら糞ややこしくて泣ける・・・
なんかソースがぐちゃぐちゃになってきた
>>902
原因は分かったから対応します
>>907
-zと-eでzipとepub両方出力は考えたけど優先度低かったからv.0.1では見送った(一応-e有りと無しで二回実行すれば望むことはできるし)
Imageもまぁ一段落ついたら考えます
zipも無圧縮/圧縮を切り替えれるとかも一応実装しときたいところ なるほどハートマークか
道理でエロタイトルばっかり引っ掛かる訳だ >>910
なるほど変換できない文字が含まれてると全体を生Unicodeにしちゃうような感じなのか
うちはメインフローはbashでpython部は呼び出すだけにしてるが、pythonは文字列処理難しいのかな
自分用のソースなら見た目気にせず使い慣れたsedやawkが大活躍なんだが >>902を直したazw2zip v.0.2上げといた k4mobidedrm.pyの72行目に書かれているhtml.entitiesが見つからないとかで動きませんでした
中身は良く判りませんがファイルの名前がなんとなくmobi用っぽいので
とりまエラー消しの為に該当行をv0.1の記述に戻して全件zip出力をテスト中です
ご報告まで 終了はしたのですが、数が合わなかったので、エラーになった書誌の特定のため、
vbsのコマンド部分をまんまバッチファイルに置き換えて実行したみたのですが、
不思議な事にバッチファイルだとうまく行きました
現在うちの環境ではコマンドプロンプトのデフォルトコードページが20127(UTF-8)から戻らなくなっていて、
バッチファイルでは先頭で932に変更しています
関連あるかはわかりませんが、一応文字コード近辺なので参考情報としてお伝えしておきます
あと>>802のファイル名ですが、ハートマーク以降が切り捨てられているようです
ご報告まで >>917
細かい事ですが、UTF-8は65001、20127はUS-ASCIIですね >>918
ども
数字の方は合っているので、US-ASCIIから戻らなかったようです
なんとかアイツのレジストリの話に辿り着き、削除してグローバル値に戻せました
(なんでアイツ呼ばわりかというとCFにブロックされたので書けたらこれかなと) 書籍名が切り捨てられる件の影響で、シリーズの巻数が切り捨てられて最後に変換された一冊だけが残る現象が発生しています
例はまたもうにあぼさんですが、「エロマンガ?描きますよ。お仕事ですから!」シリーズで発生を確認しました
ご報告まで タイトルが途中で切れる以上はそうなるわな
特殊な文字でしか起こらないだろうから個別に手で直せばいいのでは >>920
オプション-tを使えば行けるみたいよ
ちょっと調べたらKindleUnpackの時点でcontent.opfに記載のtitleが化けてる
Updated_Titleには正しい文字列が入ってるみたいだから、-tを使えばそっちを取れる
結局大元のazwの時点でデータに問題があるか、KindleUnpackのロジックに問題があるかのどちらかかな どもです。-t -eで全件お試し中です。
ところで>>916でk4mobidedrm.pyのhtml.entitiesの行を戻したままなんですが、これで何か不具合出たりしますか? html.entitiesはpython3
python2はhtmlentitydefsなんだけど実行環境変えたのかな なるほど。じゃpython2.7環境ならそのままでいい訳ですね
オプション次第では3特有の関数が必要とかかなぁ 処理終了
若干増えたので気が向いたら差分取ってみます(名前微妙に変わるわ母数4桁だわでちょっと大変)
恐らく全部EPUB化できたと思います
ありがたや
といいつつ要望なのですが、
・差分のみ出力オプション(既存の場合変換プロセスをスキップ)
・著者数が一定値を越えた場合に代替ラベルで出力するオプション(-alim 5 -albl "雑誌" みたいな)
あたりがあると非常にありがたいです
検討お願いします >>920
タイトルはTitleとUpdate_Titleと二種類あって自分の持ち物だとUpdate_Titleは後ろに(〜コミック)とかつくだけで邪魔だったからTitleを優先にしたのよね
readmeにも書いといたけどcalibreはUpdate_Titleを優先してた
で、指摘の件の本だとUpdate_Titleに完全なタイトルが入っててTitleは短いタイトルが入っているからどうしてもそうなっちゃう仕様です
なので>>922さんの言う通り-tオプション付けて変換かけてください
>>923,924
ブランチ切る前にPython3に同一ソースで対応させるために先走って弄ってたの忘れてました
今の最新コミットでは大丈夫なように直してあります
>>926
何冊以上となると数は変換してみないとわからないから、変換終了後に移動ってなるとアルゴリズムにちょっと悩む
著者名でディレクトリ掘って分けるオプションなら簡単に実装できそうだけど
差分出力は考えます あと>>395の修正取り込んでいたらepubのnavの表紙が2個(うち一つは存在しない表紙)になってしまうことがあるバグが有った
なので、KindleUnpack - The Plugin + ZIP modにも同じ不具合があります
両方とも次で直します
>>907の出力オプションは簡単だったからv.0.3で実装します
Images出力はzipとかのファイル名と同じディレクトリ作ってその中にjpgを投げます
で、python3のブランチにv.0.3 betaとしてpython3でも動くようにしたと思うのを上げときました
ただ動作確認はまだWindowsのpython 3.8でしかしてませんのでご注意を >>927
何冊以上に引っ掛かったので一応確認
雑誌などの場合、一冊の書籍に対して著者名が何人もつくと思うのですが、そういった場合を考えています
ずらずら著者が並ぶのも見栄え悪いしなにより毎号変わるから人によってはファイルの並びが不便かなと
とりあえずうちでは数冊なので困ってはいませんが
他は了解しました
差分出力のご検討ありがとうございます。期待しています 雑誌の扱いは悩むところ
うちでは雑誌名マスタを持っておいて、タイトルが前方一致したら著者名は「(雑誌名)編集部」に固定している ラノベ原作コミックスとかだと、原作者、原作絵師、コミックス作者が順不同で並んでたりしますね 例)りゅうおうのお仕事コミック版の場合
こけたおこげ:作画
しらび:キャラ原案
カズキ:構成
白鳥士郎:原作
西遊棋:監修 python3ブランチに設定ファイルで振り分け&リネーム可能にしたBeta2上げてみた
これで問題なければv.0.3にする
変な動作するものでKindle Unlimitedにあるものなら確認します レス数が900を超えています。1000を超えると表示できなくなるよ。