【Calibre】電子書籍保存･管理･変換･編集ソフト part1

**名無しさん＠お腹いっぱい。** · 2018/05/16(水) 19:42:10.24

https://calibre-ebook.com/

Wikipedia https://ja.wikipedia.org/wiki/Calibre
Calibreとはフリー・アンド・オープンソースの電子書籍ソフトウェアであり、
電子書籍を保存や管理を行うことが可能で、多数のフォーマットに対応している。
またDRMのかかった電子書籍を他のフォーマットへ変換でき、
数種類の主な電子ブックリーダーと同期することができる。

使い方説明サイト
http://gihyo.jp/lifestyle/serial/01/calibre

Calibreについて語りましょう

**名無しさん＠お腹いっぱい。** · 2020/03/24(火) 10:57:45.41

↓みたいにタイトル部が満遍なくエスケープされるな
ロケールをja_JP.UTF-8に強制したりしてみたが変わらず

[うにぁぼ] 地下ア（略）.zip

こちらの環境はdocker上のdebian10
開発者の環境（WSL＋Ubuntu18.04）との違いを調べる必要がありそうだ

**名無しさん＠お腹いっぱい。** · 2020/03/24(火) 10:58:41.71

あれ、エスケープ文字を貼ったら5ch側で日本語にされちまった
後で貼り直す

**名無しさん＠お腹いっぱい。** · 2020/03/24(火) 11:03:26.33

こんな感じか
おバカタイトルですまん

期待するタイトル:
[うにぁぼ] 地下アイドルあるある？八景島デジフェチパラダイス♡: 撮ってくれたらよしこ感じちゃうー！！.zip

実際のタイトル:（実際は5桁数値の前に&Hが付く）
[うにぁぼ] 22320;19979;12450;12452;12489;（略）.zip

**名無しさん＠お腹いっぱい。** · 2020/03/24(火) 11:20:03.74

連投すまぬ
KVM上のUbuntu18.04でも試したが変化なし

どうも出力ファイル名が「UTF-8エンコードしたUnicode」でなくて
生のUnicode（UCS）になってそうに見える。

タイトル先頭の「地」の字の文字コードを調べると、

Unicode(UCS): 0x5730（10進で22320）
UTF-8: 0xE59CB0（10進で15047856）

で、上の方が使われているみたい。

著者名の方はちゃんと出てるから、何かマルチバイト文字周りで問題というか動作の違いがあるのかも。

WSLだと問題ないとしたら、マルチバイトの取扱いに差がある（WSLが吸収してる？）のかな

**名無しさん＠お腹いっぱい。** · 2020/03/24(火) 11:55:32.80

かなり昔のことでうろ覚えだが、windowsでchcp 1200(UTF-16)が
使用できなくて、win10+Python2.7の環境で文字化けしたことがあった
その時は諦めてWSLで動かすことで逃げた

**名無しさん＠お腹いっぱい。** · 2020/03/24(火) 11:58:21.36

>>888
ありがとう
おかげで「デパート女店員になる近道」のオリジナル画像を抜き出せた

**名無しさん＠お腹いっぱい。** · 2020/03/24(火) 14:58:53.29

そんなんばっかですいません。それらです
とりあえずおま環ってやつではなさげですね

**889** · 2020/03/24(火) 19:44:05.22

>>892
いただきました
数冊試してみましたが一つにまとまってるから処理が早いですね
もしよろしければオプションの追加を検討していただきたいのですが、
例えば -f でImageフォルダ出力
-z -e でZIPとepub出力、-e -f でepubとImageフォルダ出力みたいな感じのを

Imageフォルダ出力はkindleによくある1ページ目のNEXT PAGEや
最後のBWロゴページを消したいので

複数出力はマンガか小説かを判定してオプションを切り替えたら
良いのでしょうが、良い判定方法が思いつかないので(汗)
両方一緒に出せば良いかなぁーと
お時間のあるときにでもご検討いただければ幸いです

**名無しさん＠お腹いっぱい。** · 2020/03/24(火) 21:07:03.24

作者さん次第だが、さすがにそりゃ自分でやることじゃないのか
azwからepub/zipに変換するツールが出てきたんだから組み合わせでどうにかできるでしょ

特定のページを捨てたいとか、いちいち組み込んでたらきりがないと思うがな

**名無しさん＠お腹いっぱい。** · 2020/03/24(火) 21:45:59.03

元のスクリプトを弄らんで、
epubとzipで引数変えて二回元のスクリプトを動かすスクリプトを作る、
その後に出来たzipをzipのファイル名のフォルダ作ってそこに解凍するバッチファイルなりスクリプトなりを自分で作るのじゃあかんの？

**名無しさん＠お腹いっぱい。** · 2020/03/25(水) 00:29:32.38

py版いいっすね
せっかくなんでkindleunpack.py内のmakeOutputFileName()弄って出力ファイル名を調整しようとしたが
pythonニワカなうえPy2のUnicode制限がきつくてつらい
[苗字　名前] → [苗字名前] 　にするくらいならなんちゅーこともないが
タイトルＨＯＧＥ (１)
みたいな尼の全半混じりクソ表記をどうにかしようとするとわけわからん
ファイルリネームするスプリクトを別に作るほうが楽か

>>903
junk2ool氏ではないが WSL＋Ubuntu18.04 で試してみたが>902のタイトルはエラーで変換できなかった
ハートがcp932(SJIS)にはないコードなのでそのせいだと思うが

この辺の問題pyt3にすることでほぼほぼ解決しそうな気がするんだが
1byte圏の人らは自分らが困らないから無頓着だよね

**名無しさん＠お腹いっぱい。** · 2020/03/25(水) 00:36:43.44

DeDRMをpython3に対応させようとしたら糞ややこしくて泣ける・・・
なんかソースがぐちゃぐちゃになってきた

>>902
原因は分かったから対応します

>>907
-zと-eでzipとepub両方出力は考えたけど優先度低かったからv.0.1では見送った（一応-e有りと無しで二回実行すれば望むことはできるし）
Imageもまぁ一段落ついたら考えます

zipも無圧縮/圧縮を切り替えれるとかも一応実装しときたいところ

**名無しさん＠お腹いっぱい。** · 2020/03/25(水) 00:40:40.01

なるほどハートマークか
道理でエロタイトルばっかり引っ掛かる訳だ

**名無しさん＠お腹いっぱい。** · 2020/03/25(水) 06:24:04.43

>>910
なるほど変換できない文字が含まれてると全体を生Unicodeにしちゃうような感じなのか

うちはメインフローはbashでpython部は呼び出すだけにしてるが、pythonは文字列処理難しいのかな

自分用のソースなら見た目気にせず使い慣れたsedやawkが大活躍なんだが

**名無しさん＠お腹いっぱい。** · 2020/03/25(水) 22:03:54.75

>>902を直したazw2zip v.0.2上げといた

**名無しさん＠お腹いっぱい。** · 2020/03/26(木) 02:16:11.25

乙です

**名無しさん＠お腹いっぱい。** · 2020/03/26(木) 03:10:18.32

k4mobidedrm.pyの72行目に書かれているhtml.entitiesが見つからないとかで動きませんでした
中身は良く判りませんがファイルの名前がなんとなくmobi用っぽいので
とりまエラー消しの為に該当行をv0.1の記述に戻して全件zip出力をテスト中です
ご報告まで

**名無しさん＠お腹いっぱい。** · 2020/03/26(木) 04:15:36.09

終了はしたのですが、数が合わなかったので、エラーになった書誌の特定のため、
vbsのコマンド部分をまんまバッチファイルに置き換えて実行したみたのですが、
不思議な事にバッチファイルだとうまく行きました

現在うちの環境ではコマンドプロンプトのデフォルトコードページが20127(UTF-8)から戻らなくなっていて、
バッチファイルでは先頭で932に変更しています
関連あるかはわかりませんが、一応文字コード近辺なので参考情報としてお伝えしておきます

あと>>802のファイル名ですが、ハートマーク以降が切り捨てられているようです
ご報告まで

**名無しさん＠お腹いっぱい。** · 2020/03/26(木) 10:32:55.17

>>917
細かい事ですが、UTF-8は65001、20127はUS-ASCIIですね

**名無しさん＠お腹いっぱい。** · 2020/03/26(木) 17:06:30.59

>>918
ども
数字の方は合っているので、US-ASCIIから戻らなかったようです
なんとかアイツのレジストリの話に辿り着き、削除してグローバル値に戻せました
(なんでアイツ呼ばわりかというとCFにブロックされたので書けたらこれかなと)

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 12:04:57.27

書籍名が切り捨てられる件の影響で、シリーズの巻数が切り捨てられて最後に変換された一冊だけが残る現象が発生しています
例はまたもうにあぼさんですが、「エロマンガ？描きますよ。お仕事ですから！」シリーズで発生を確認しました
ご報告まで

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 14:27:02.55

タイトルが途中で切れる以上はそうなるわな
特殊な文字でしか起こらないだろうから個別に手で直せばいいのでは

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 14:48:50.07

>>920
オプション-tを使えば行けるみたいよ

ちょっと調べたらKindleUnpackの時点でcontent.opfに記載のtitleが化けてる
Updated_Titleには正しい文字列が入ってるみたいだから、-tを使えばそっちを取れる

結局大元のazwの時点でデータに問題があるか、KindleUnpackのロジックに問題があるかのどちらかかな

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 19:20:38.95

どもです。-t -eで全件お試し中です。
ところで>>916でk4mobidedrm.pyのhtml.entitiesの行を戻したままなんですが、これで何か不具合出たりしますか？

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 19:38:20.77

html.entitiesはpython3
python2はhtmlentitydefsなんだけど実行環境変えたのかな

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 19:45:02.32

なるほど。じゃpython2.7環境ならそのままでいい訳ですね
オプション次第では3特有の関数が必要とかかなぁ

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 20:31:29.37

処理終了
若干増えたので気が向いたら差分取ってみます（名前微妙に変わるわ母数４桁だわでちょっと大変）
恐らく全部EPUB化できたと思います
ありがたや

といいつつ要望なのですが、
・差分のみ出力オプション(既存の場合変換プロセスをスキップ)
・著者数が一定値を越えた場合に代替ラベルで出力するオプション(-alim 5 -albl "雑誌" みたいな)
あたりがあると非常にありがたいです
検討お願いします

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 23:10:18.74

>>920
タイトルはTitleとUpdate_Titleと二種類あって自分の持ち物だとUpdate_Titleは後ろに(～コミック)とかつくだけで邪魔だったからTitleを優先にしたのよね
readmeにも書いといたけどcalibreはUpdate_Titleを優先してた
で、指摘の件の本だとUpdate_Titleに完全なタイトルが入っててTitleは短いタイトルが入っているからどうしてもそうなっちゃう仕様です
なので>>922さんの言う通り-tオプション付けて変換かけてください

>>923,924
ブランチ切る前にPython3に同一ソースで対応させるために先走って弄ってたの忘れてました
今の最新コミットでは大丈夫なように直してあります

>>926
何冊以上となると数は変換してみないとわからないから、変換終了後に移動ってなるとアルゴリズムにちょっと悩む
著者名でディレクトリ掘って分けるオプションなら簡単に実装できそうだけど
差分出力は考えます

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 23:18:09.32

あと>>395の修正取り込んでいたらepubのnavの表紙が2個(うち一つは存在しない表紙)になってしまうことがあるバグが有った
なので、KindleUnpack - The Plugin + ZIP modにも同じ不具合があります
両方とも次で直します

>>907の出力オプションは簡単だったからv.0.3で実装します
Images出力はzipとかのファイル名と同じディレクトリ作ってその中にｊｐｇを投げます

で、python3のブランチにv.0.3 betaとしてpython3でも動くようにしたと思うのを上げときました
ただ動作確認はまだWindowsのpython 3.8でしかしてませんのでご注意を

**名無しさん＠お腹いっぱい。** · 2020/03/27(金) 23:26:53.91

>>927
何冊以上に引っ掛かったので一応確認
雑誌などの場合、一冊の書籍に対して著者名が何人もつくと思うのですが、そういった場合を考えています
ずらずら著者が並ぶのも見栄え悪いしなにより毎号変わるから人によってはファイルの並びが不便かなと
とりあえずうちでは数冊なので困ってはいませんが

他は了解しました
差分出力のご検討ありがとうございます。期待しています

**名無しさん＠お腹いっぱい。** · 2020/03/28(土) 01:52:56.36

雑誌の扱いは悩むところ
うちでは雑誌名マスタを持っておいて、タイトルが前方一致したら著者名は「（雑誌名）編集部」に固定している

**名無しさん＠お腹いっぱい。** · 2020/03/28(土) 07:27:31.89

ラノベ原作コミックスとかだと、原作者、原作絵師、コミックス作者が順不同で並んでたりしますね

**名無しさん＠お腹いっぱい。** · 2020/03/28(土) 07:39:13.58

例）りゅうおうのお仕事コミック版の場合

こけたおこげ：作画
しらび：キャラ原案
カズキ：構成
白鳥士郎：原作
西遊棋：監修

**名無しさん＠お腹いっぱい。** · 2020/03/28(土) 23:45:34.20

python3ブランチに設定ファイルで振り分け＆リネーム可能にしたBeta2上げてみた
これで問題なければv.0.3にする

変な動作するものでKindle Unlimitedにあるものなら確認します

**名無しさん＠お腹いっぱい。** · 2020/03/28(土) 23:55:43.96

azw2zip.sample.json
を参考に
azw2zip.json
にリネームして使ってください

**名無しさん＠お腹いっぱい。** · 2020/03/29(日) 00:42:13.61

以降はpython3で開発される予定でしょうか？
これのためだけにpython入れてるので
もしそうなら両方は入れたくないので入れ替えます

>>931-932
その手のは多くてもほぼ固定だから雑誌よりはマシですね
個人的には5人ならギリ許容範囲かなぁ

**名無しさん＠お腹いっぱい。** · 2020/03/29(日) 16:44:23.29

Python 3.7.7で動作しました

azw2zip.jsonでのリネーム
python3だと\dで全角数字もマッチしてくれるの便利すぎ
巻数表記のゆらぎは
"title": "(.*)[ 　（]\\(*(\\d{1,2})"
"series_index": "(\\d{1,2})",
で大体何とかなりそう

ただこれ authors はマッチで前方抽出じゃなく直値で置き換えるしかない感じですか？
自分>910ですが[性名]の真ん中部分のスペースを削ったりしたくて
re.subでいらんとこ削ったり置き換えの指定ができるようになるとありがたいです
あと巻数部文以外の全角英数→半角変換とかも

**名無しさん＠お腹いっぱい。** · 2020/03/30(月) 00:30:18.52

>>928の不具合直した
KindleUnpack - The Plugin + ZIP mod v.0.3
上げといた

>>935
どっちでも動くようにソース書いているからよほどのことがない限りどっちでも動くようにするよ
py2exeでのexe化も目処がたったからやりたい

>>936
そういう著者もあったのか
ちょっと考えます
著者、作品名の全角→半角はとりあえずjsonにそれのON/OFFキー作ってみる

**名無しさん＠お腹いっぱい。** · 2020/03/30(月) 07:23:31.01

基本pytion2,3両用との事ですので報告
kindlekey.pyですが、python2ではwinregは_winregのようで、
v0.3のhtmlentitydefsに倣ってtry-except構文に書き換えようと試みたのですが、
いまいち理解できていないようでエラーになったのでとりあえず決め打ちで動かしています

現在EPUBと圧縮ZIPの同時出力でテスト中です
(毎回必ず全件変換だしオプションも変わらないので起動は自作バッチファイルですが)

雑誌はタイトルで引っ掛けてAuthorsを捨てるようにしました
私の案よりこっちのがモノによって雑誌、アンソロなど使い分けられていいですね

authorsに関しては>>936さんとほぼ同意見です。
同じ人でも全半角とか姓名空きとか揃っていない場合が多々ありますので
(もっとも検索にも難儀するので本来なら元データを統一してほしいところではありますが)

あとどちらかというとjsonの質問になってしまうのですが、例えば
オールカラーでわかりやすい！世界の宗教
なる本はauthorsが空なのですが、こういった場合を引っ掛けるにはどう記述したらいいでしょうか？

あとこれは本来の機能とは全然関係ないのですが
ファイルと書誌の対応一覧表を作れるミニツールみたいなものがあると変換テストが最小限で済んでとても助かります

**名無しさん＠お腹いっぱい。** · 2020/03/30(月) 07:40:10.90

著者姓名間のスペースは不揃いだと煩わしいから俺は一律消してるけど消したら自動では戻せない
また英字のみの外国人の場合はスペースないと逆に不自然

といった感じで要望噴出しそうでまとめるのは大変だと思うけど、作者の人は普通に対応してて頭が下る

**名無しさん＠お腹いっぱい。** · 2020/03/30(月) 11:22:51.43

その辺は([a-zA-Z]+)で振分け可能なのでユーザー側のjson編集でいけんじゃね
変換が不可逆なのも大前提だしね
ただ全半変換はタイトルに？が含まれてる本も多いからファイル名禁止文字に引っかかる

しかし氏名の間のスペースも半角だったり全角だったりあったりなかったり
全角英字タイトルも途中の巻から半角英字になってたり
表記ルールろくに決めずにノーチェックでバイトに入力させてるんやろうなって

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 00:34:42.53

漫画雑誌変換したら連結した作者名が長すぎてファイル名長の制限越えてダメだなw
1人目が出版社っぽいからとりあえず5人超えたら1人目だけにするようにするかな
リネームの処理柔軟にできるように考えてたら訳分かんなくなってきた…

>>938
あー、そういやそこもいじってたの忘れてた
直します

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 10:55:18.86

雑誌が限られてるならそれぞれの書誌名部分一致で変換ルール書く方が早いと思うです

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 11:53:04.51

ソフトハウス名義とかで全部英字でもスペース有無の統一されてないのがあったり
うちの例だとＲｉｄｄｌｅＳｏｆｔが何冊かあります
今売ってる奴は空白ありだけど完全に別商品扱いなので落とし直しても直らない

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 12:35:59.79

著者名末尾に（○○文庫）とか付いて邪魔なのもある

しかしつまるところファイル名になるんだからレアケースは手で直せばいい

著者名に関して標準であると嬉しいのは
・姓名間のスペース除去
・全角→半角変換
・複数著者は著者名でソート
・雑誌判定
くらいかなあ

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 12:53:24.82

差分出力も考え中って事だったからレアケースでもルールファイルに落とした方がいい気が
雑誌は書誌名の部分一致でなんとかならんかいね
スペース除去と英字半角はぜひ欲しいなぁ

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 13:03:50.13

差分出力するにはunpackまでやって名称一致判定するしかないのか

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 18:46:11.97

差分メンドそうですね
もう起動日時を(弄れる形で)ファイルに吐いてファイルかフォルダの日時と比べるとかでもいいかもしんない

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 18:57:10.31

差分変換って発想は
azwとzipの両方のライブラリも維持しつつ同期させたいってことだよね
無論個人の好みだけど俺は変換済んだらazwはさっさと消す派
残しても役にたたんから

強いて言うならKindleが本データ更新したときに追従できるくらいだけど
それも差分でやるにはAmazonの商品ID（Bで始まるやつ）をキーにするか、タイムスタンプで判定するしかない
後者だとファイル名が変わるような書誌変更はファイルが2つになる（まあそんな変更そうないが）

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 19:43:13.61

自分が差分変換したい理由はKindleforPCのビュアーが気に入ってるからですね
抜き出しはあくまでバックアップな感じです

自分の環境ではここ10年ちょっとで都合8冊ほど「ライブラリの管理」の対象から消えています
何冊かは商品ページも無くなっていました
幸い注文番号は残っていたので電話で復旧出来たんですが
こういうのもバックアップなり購入リストなりがないと正確に把握できませんし

それはそれとして、ASIN B07K5KJYZD の書誌名が化けてましたのでご報告
＆が&になってました

**名無しさん＠お腹いっぱい。** · 2020/03/31(火) 21:16:07.71

broken dream&reborn３: 一級建築士を目指して Broken dream & reborn Kindle版

タイトルに全角＆は含まれてないようだけど

**名無しさん＠お腹いっぱい。** · 2020/04/01(水) 00:14:56.07

すいません、その半角の奴です

**名無しさん＠お腹いっぱい。** · 2020/04/01(水) 16:11:16.22

epubファイルをリネームするツールを作ってみました
https://dotup.org/uploda/dotup.org2101707.zip.html
パスワード：epubren

使い方
node.jsをインストールした後booksフォルダに変換したいファイルを入れてrun.batを実行すると下記のような感じでリネームします
漫画や小説など
[作者名] 作品名第00巻
雑誌
雑誌名 0000年00月号

既知の問題
run.bat実行時にWindows Defenderとかの警告がでるかも
タイトルに98以下の数字が入っていたり99巻以上の作品だとファイル名がおかしくなる
雑誌の場合は変換が雑
ファイルが多いと時間がかかるかも

**名無しさん＠お腹いっぱい。** · 2020/04/02(木) 00:22:02.72

releaseにv.0.3 RC上げといた
リネーム処理融通効かせようと思ったらコードぐちゃぐちゃになったせいでバグありそうだけど・・・
py2exeを使ったexe化も可能にしたので、おいおいPythonインストールしないでいいexe版も上げとく

>>949
直ったと思う

差分は無駄なファイルを作らずできそうだからこれが問題なければやってみる

**949** · 2020/04/02(木) 01:34:47.58

対応ありがとうございます
とりあえず単品では直っているのを確認しましたので取り急ぎご報告まで
一応全件も確認しておきます

**名無しさん＠お腹いっぱい。** · 2020/04/02(木) 08:22:12.33

全件比較終了
著者数が多い場合は纏めるようにしたんですね
「ほか」は「外」より「他」のがいい気がします
それ以外はそのままでした

あとこれは前からの見落としかつかなりレアケースだと思うんでいよいよ個別に手で対応した方がいい気もしますが、
温泉マーク(U+2668)が?に化けていました。対象はASIN B07RZYV69F(有料)です。一応報告しておきます

**名無しさん＠お腹いっぱい。** · 2020/04/05(日) 18:58:50.15

日本商工会議所はあまりにも軽く考えすぎだろ

**名無しさん＠お腹いっぱい。** · 2020/04/05(日) 20:12:08.63

別ツールで作ろうとしたのですが、ファイル名長の都合で著者まとめ不可避っぽいので要望です
_authorsとかなんとかのフォルダを掘って各著者フォルダに書誌をリンクする機能があるといいなぁ
Windowsの場合XP以前はmklinkコマンドがないので対応するなら問題のないソースを拾う必要がありますが…
ちゃんと理解してないとコピー移動でエラい目に合う可能性があるのであくまでオプションで

あ、EPUB限定なら別ツールでもいいのか
うーんどうしようバランス悪い

**名無しさん＠お腹いっぱい。** · 2020/04/05(日) 23:19:54.37

やる気があるやつは某神様のところに行けよ

**名無しさん＠お腹いっぱい。** · 2020/04/06(月) 09:06:56.95

自炊したコミックをシリーズとしてカテゴライズしたいのですが、やり方がわかりません。
Calibre4.13 + Kindle ペーパーホワイトを使っています。

方法があったら教えて下さい。

**名無しさん＠お腹いっぱい。** · 2020/04/06(月) 09:27:06.37

series列にシリーズ名を
series_idx列に巻数を
それぞれセットするだけ

**名無しさん＠お腹いっぱい。** · 2020/04/06(月) 09:36:15.87

最近はkindle使ってないんだけど、今のkindle端末ってcalibreのseriesをデフォで反映できるの？

昔はプラグインでseries毎にコレクション作るような設定してたけど

**名無しさん＠お腹いっぱい。** · 2020/04/06(月) 09:36:58.95

>>960
例えばドラゴンボールだったら、
series列はドラゴンボール
series_idx列は、1巻なら[1] 2巻なら[2]…になるの？

つまりGUI表示状はドラゴンボール[1]　とかになるの？

**名無しさん＠お腹いっぱい。** · 2020/04/06(月) 11:39:31.01

Kindleもkoboもメタデータのseriesやcollectionは反映しない

**名無しさん＠お腹いっぱい。** · 2020/04/08(水) 16:27:37.93

azw2zipの作者さん、DeDRM PluginのソースのPython3対応は自分で修正してるのかな？

本家のPython3ブランチのソースだとExceptionのシンタックスとかlong値リテラルとかpy3対応してないと思うんだけど。

だとしたら熱烈感謝の上、ソース流用させてもらいます。
メインロジックは自分のもの使いたいけどpy3対応はしたかったので。

**名無しさん＠お腹いっぱい。** · 2020/04/12(日) 00:12:18.31

azw2zip v.0.3 RC2としてzip化のDRM解除不要版を作るついでにデフォでは上書きしないようにしてみた
-oオプションつければ従来どおり上書きします

>>964
Pythonの勉強がてら自分で修正したよ
strとbytesの整合性取るのがめんどかった

**名無しさん＠お腹いっぱい。** · 2020/04/12(日) 19:06:39.90

メタデータ取得用のプラグインってなにつかってる？

**名無しさん＠お腹いっぱい。** · 2020/04/14(火) 10:30:12.05

なんかエラーであります
全件固定版とD&D版でそれぞれバッチファイル作ってます
以下全件固定版画面まんま

D:\tool\azw2zip>"D:\Python2.7\python.exe" D:\tool\azw2zip\azw2zip.py -z -t -c "D:\RedirectedSettings\xxxx\My Kindle Content" "E:\My Kindle Backup\zip"
azw2zip v.0.3
Copyright (C) 2020 junk2ool

k4iディレクトリ: D:\tool\azw2zip
k4i: D:\tool\azw2zip\kindlekey1.k4i
変換ディレクトリ: D:\RedirectedSettings\xxxx\My Kindle Content
出力ディレクトリ: E:\My Kindle Backup\zip
出力ディレクトリ: 作成: E:\My Kindle Backup\zip

変換開始: D:\RedirectedSettings\xxxx\My Kindle Content\B0084AVKZW_EBOK
Traceback (most recent call last):
File "D:\tool\azw2zip\azw2zip.py", line 312, in <module>
sys.exit(main())
File "D:\tool\azw2zip\azw2zip.py", line 204, in main
a2z.load(azw_fpath, '', debug_mode)
File "D:\tool\azw2zip\azw2zip_nodedrm.py", line 564, in load
azw.load(azw_fpath, self.azw_header_data, self.debug)
File "D:\tool\azw2zip\azw2zip_nodedrm.py", line 419, in load
raise azw2zipException(u'invalid file format: {}'.format(ident))
UnicodeDecodeError: 'utf8' codec can't decode byte 0x81 in position 0: invalid s
tart byte

**名無しさん＠お腹いっぱい。** · 2020/04/15(水) 01:06:30.14

追記
RC(1)に戻して最初から試してみたところ、最初に解読失敗が１件ありました
この時はスキップされて次の本に移っているので、上記の場所ではなくエラー処理関係なのかも

**名無しさん＠お腹いっぱい。** · 2020/04/15(水) 20:02:35.13

kindleunpackでepub3にしたのをiBooks で読もうとした時に「要求されたリソースがみつからないため～」と出た場合にはどうすればいいですか？

**名無しさん＠お腹いっぱい。** · 2020/04/16(木) 22:23:48.56

スゴイツールができたんですね
でもPython導入してみましたがやり方が分からないので
プラグインの方を使わせていただきます

**名無しさん＠お腹いっぱい。** · 2020/04/21(火) 12:43:13.56

>>890
それらのバージョン詳しく

**名無しさん＠お腹いっぱい。** · 2020/04/21(火) 19:55:19.99

Got DSN key from database C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\kindlekey1.k4i
Found 4 keys to try after 0.2 seconds
Crypto Type is: 2
Error decrypting book after 0.2 seconds: No key found in 4 keys tried.
Traceback (most recent call last):
File "C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\DeDRM_Plugin\k4mobidedrm.py", line 274, in decryptBook
book = GetDecryptedBook(infile, kDatabases, androidFiles, serials, pids, starttime)
File "C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\DeDRM_Plugin\k4mobidedrm.py", line 248, in GetDecryptedBook
mb.processBook(totalpids)
File "C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\DeDRM_Plugin\mobidedrm.py", line 506, in processBook
raise DrmException(u"No key found in {0:d} keys tried.".format(len(goodpids)))
mobidedrm.DrmException: No key found in 4 keys tried.
DRM解除: 失敗:
DRM解除: 失敗:

azw3はいけるんですけどazwがDRMを解除できなくて引っかかってます
Pythonは3.8

**名無しさん＠お腹いっぱい。** · 2020/04/21(火) 20:08:48.90

パソコン内を検索したら出てきたkindlekey1.k4i使ったらできました！

**名無しさん＠お腹いっぱい。** · 2020/04/21(火) 23:58:24.87

タイトルと巻数がスペース無しで連続してるとき
"title": "(.*)[ 　（]\\(*(\\d{1,2})"
"series_index": "(\\d{1,2})",
じゃダメみたいです
情けないのですが1ミリも読めないのでご教示願いたいです

**名無しさん＠お腹いっぱい。** · 2020/04/22(水) 01:14:51.78

具体的な巻数表記がどうなってるのかサンプル出さないで言われても分からんけど
巻数数字の直前にある文字を[] の中に列挙していけばいいだけ
上の例では[ 　（] の部分で半角スペース or 全角スペース or 全角前カッコを指定している

**名無しさん＠お腹いっぱい。** · 2020/04/22(水) 01:30:30.19

たとえばこの2つです
https://www.amazon.co.jp//dp/B071NHX5L8/
https://www.amazon.co.jp//dp/B016CS1GHE/

**名無しさん＠お腹いっぱい。** · 2020/04/23(木) 04:43:22.90

■■■■kindle版「プロボクサー井上尚弥の弱点　偽りの怪物」只今無料■■■■

Amazonで無料ダウンロードサービス中　只今なら定価２５０円が無料に
Amazon検索窓で「井上尚弥の弱点　偽りの怪物」をクリック
井上尚弥本人が書いた著作より、Amazon検索上位に来てるから笑えるナゾの電子書籍
＜目次＞
第一章　史上初の最強王者同士のトーナメント
◆実は「正規王者」は、「正規の王者」ではない
第二章　偽のベルトを量産させたボクシング団体
◆正規王者というウソのタイトル
◆本物の王者2人の不可解な棄権
第三章　姿を消した長身のサウスポー
◆井上尚弥のもっとも苦手な選手は何処へ？
◆一度もまともに勝たず決勝戦にたどりついた老ボクサー
第四章　「正規王者」という名の偽王者
◆WBSS出来レース抽選会
第五章　トヨタオブハリウッドからの刺客
◆スポンサー広告禁止を無視して
◆大橋ジム後援会の超大物顧問
第六章　パヤノの演技力
◆ヒットポイントから外れた効くはずのないパンチ
◆ネリのKO劇に酷似するパヤノのダウンシーン
第七章　ついにバレた「偽りの王者」
https://www.amazon.co.jp/dp/B0879FVBST/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&;dchild=1&keywords=%E4%BA%95%E4%B8%8A%E5%B0%9A%E5%BC%A5&qid=1587467105&sr=8-1

**名無しさん＠お腹いっぱい。** · 2020/04/27(月) 00:34:10.16

>>974
>>976ならその作者のタイトルに数字が入らない前提なら作者で絞っておいて
"title": "(.+?)\\s*(\\d{1,2})",
の大雑把な指定で2桁までの巻数が取れるはず
作者で絞っておけば誤爆しないだろうし
あとtitleで巻数取るようにしといたらseries_indexは無くても大丈夫
あえて書くなら
"series_index": ".+?(\\d{1,2})",
でいいと思う

タイトルに数字が入ってても巻数の数字がタイトルの末尾なら最短マッチの?消して
"title": "(.+)\\s*(\\d{1,2})",
でいい

**名無しさん＠お腹いっぱい。** · 2020/04/27(月) 20:54:25.23

>>978
出来ました！　ありがとうございます！　もうちょっと勉強します

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 12:40:05.27

ちょっと話に入りたいんだが、｢KindleUnpack - The Plugin + ZIP mod｣って、文字メインの活字本に対して役立つ?
画像で出力とか言われると、活字本の場合の文字データが全部消えてしまうように聞こえるんだが?

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 13:28:38.80

まずepubを理解しよう

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 13:30:55.42

ごめんZIP modの話か
そりゃ画像にしかならんのでは

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 13:34:44.15

文章が画像になるわけじゃなく、テキストは捨てられるだろう
挿絵とかの画像だけになるのでは

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 13:52:46.15

>>980
質問する前にreadmeくらい読めよ

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 14:01:32.07

俺ちゃんとKindle1.24使ってる。
高画質画像が収まってる(?)resファイルをazwファイルの該当画像に差し替えたいと思ってるんだが、丁度いいツールある？

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 16:04:13.61

今度はスレの流れ読まないマンか？
すぐ上で話題に出てるツールがまさにそれなんだが

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 16:07:33.11

ID隠してるのは相手しないが良い

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 16:30:49.38

>>985
このスレぐらい読んだら？

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 17:12:19.74

>>985
俺ちゃんとKindle1.24使ってるお前は誰ちゃんなの？

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 17:18:30.26

>>987
気づいてなかったわ
980と同一人物か

**967** · 2020/04/29(水) 18:40:00.72

結局うちっておま環なんかいね
指摘もうちももないからよくわからん

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 19:50:13.56

>>991
python3.8にした？

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 20:29:22.17

してません
今のところ「2系で動かない」っていうのは意図されていないと思っているので
作者さんもその意向なら諦めてそっちにしますが

**名無しさん＠お腹いっぱい。** · 2020/04/29(水) 21:07:56.81

同じ症状出て3.8にしてpycryptoじゃなくてpycryptodome入れたら直ったから

**名無しさん＠お腹いっぱい。** · 2020/04/30(木) 00:34:38.51

情報どもです
とりま確保だけしておきます

**名無しさん＠お腹いっぱい。** · 2020/04/30(木) 01:37:41.11

【Calibre】電子書籍保存･管理･変換･編集ソフト part2
https://rio2016.5ch.net/test/read.cgi/ebooks/1588178225

**名無しさん＠お腹いっぱい。** · 2020/04/30(木) 22:30:20.41

またID無しのハゲか
ろだコミに帰れよ

**名無しさん＠お腹いっぱい。** · 2020/05/03(日) 12:49:57.87

次スレ
【Calibre】電子書籍保存･管理･変換･編集ソフト part2
https://rio2016.5ch.net/test/read.cgi/ebooks/1588178225

**名無しさん＠お腹いっぱい。** · 2020/05/03(日) 12:51:27.79

次スレ
【Calibre】電子書籍保存･管理･変換･編集ソフト part2
https://rio2016.5ch.net/test/read.cgi/ebooks/1588178225

**名無しさん＠お腹いっぱい。** · 2020/05/03(日) 12:51:49.23

次スレ
【Calibre】電子書籍保存･管理･変換･編集ソフト part2
https://rio2016.5ch.net/test/read.cgi/ebooks/1588178225