トップページ電子書籍(仮)
1002コメント327KB
【Calibre】電子書籍 保存・管理・変換・編集ソフト part1
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しさん@お腹いっぱい。
垢版 |
2018/05/16(水) 19:42:10.24
https://calibre-ebook.com/

Wikipedia https://ja.wikipedia.org/wiki/Calibre
Calibreとはフリー・アンド・オープンソースの電子書籍ソフトウェアであり、
電子書籍を保存や管理を行うことが可能で、多数のフォーマットに対応している。
またDRMのかかった電子書籍を他のフォーマットへ変換でき、
数種類の主な電子ブックリーダーと同期することができる。


使い方説明サイト
http://gihyo.jp/lifestyle/serial/01/calibre


Calibreについて語りましょう
0900名無しさん@お腹いっぱい。
垢版 |
2020/03/24(火) 10:57:45.41ID:8qpisS6m
↓みたいにタイトル部が満遍なくエスケープされるな
ロケールをja_JP.UTF-8に強制したりしてみたが変わらず

[うにぁぼ] 地下ア(略).zip

こちらの環境はdocker上のdebian10
開発者の環境(WSL+Ubuntu18.04)との違いを調べる必要がありそうだ
0902名無しさん@お腹いっぱい。
垢版 |
2020/03/24(火) 11:03:26.33ID:8qpisS6m
こんな感じか
おバカタイトルですまん


期待するタイトル:
[うにぁぼ] 地下アイドルあるある?八景島デジフェチパラダイス♡: 撮ってくれたらよしこ感じちゃうー!!.zip

実際のタイトル:(実際は5桁数値の前に&Hが付く)
[うにぁぼ] 22320;19979;12450;12452;12489;(略).zip
0903名無しさん@お腹いっぱい。
垢版 |
2020/03/24(火) 11:20:03.74ID:8qpisS6m
連投すまぬ
KVM上のUbuntu18.04でも試したが変化なし

どうも出力ファイル名が「UTF-8エンコードしたUnicode」でなくて
生のUnicode(UCS)になってそうに見える。

タイトル先頭の「地」の字の文字コードを調べると、

Unicode(UCS): 0x5730(10進で22320)
UTF-8: 0xE59CB0(10進で15047856)

で、上の方が使われているみたい。

著者名の方はちゃんと出てるから、何かマルチバイト文字周りで問題というか動作の違いがあるのかも。

WSLだと問題ないとしたら、マルチバイトの取扱いに差がある(WSLが吸収してる?)のかな
0904名無しさん@お腹いっぱい。
垢版 |
2020/03/24(火) 11:55:32.80ID:E4/mrKWr
かなり昔のことでうろ覚えだが、windowsでchcp 1200(UTF-16)が
使用できなくて、win10+Python2.7の環境で文字化けしたことがあった
その時は諦めてWSLで動かすことで逃げた
0907889
垢版 |
2020/03/24(火) 19:44:05.22ID:nf07vL4t
>>892
いただきました
数冊試してみましたが一つにまとまってるから処理が早いですね
もしよろしければオプションの追加を検討していただきたいのですが、
例えば -f でImageフォルダ出力
-z -e でZIPとepub出力、-e -f でepubとImageフォルダ出力みたいな感じのを

Imageフォルダ出力はkindleによくある1ページ目のNEXT PAGEや
最後のBWロゴページを消したいので

複数出力はマンガか小説かを判定してオプションを切り替えたら
良いのでしょうが、良い判定方法が思いつかないので(汗)
両方一緒に出せば良いかなぁーと
お時間のあるときにでもご検討いただければ幸いです
0908名無しさん@お腹いっぱい。
垢版 |
2020/03/24(火) 21:07:03.24ID:BfFFNdnk
作者さん次第だが、さすがにそりゃ自分でやることじゃないのか
azwからepub/zipに変換するツールが出てきたんだから組み合わせでどうにかできるでしょ

特定のページを捨てたいとか、いちいち組み込んでたらきりがないと思うがな
0909名無しさん@お腹いっぱい。
垢版 |
2020/03/24(火) 21:45:59.03ID:OWSbFCog
元のスクリプトを弄らんで、
epubとzipで引数変えて二回元のスクリプトを動かすスクリプトを作る、
その後に出来たzipをzipのファイル名のフォルダ作ってそこに解凍するバッチファイルなりスクリプトなりを自分で作るのじゃあかんの?
0910名無しさん@お腹いっぱい。
垢版 |
2020/03/25(水) 00:29:32.38ID:Zdt1tcnz
py版いいっすね
せっかくなんでkindleunpack.py内のmakeOutputFileName()弄って出力ファイル名を調整しようとしたが
pythonニワカなうえPy2のUnicode制限がきつくてつらい
[苗字 名前] → [苗字名前]  にするくらいならなんちゅーこともないが
タイトルHOGE (1)
みたいな尼の全半混じりクソ表記をどうにかしようとするとわけわからん
ファイルリネームするスプリクトを別に作るほうが楽か

>>903
junk2ool氏ではないが WSL+Ubuntu18.04 で試してみたが>902のタイトルはエラーで変換できなかった
ハートがcp932(SJIS)にはないコードなのでそのせいだと思うが

この辺の問題pyt3にすることでほぼほぼ解決しそうな気がするんだが
1byte圏の人らは自分らが困らないから無頓着だよね
0911名無しさん@お腹いっぱい。
垢版 |
2020/03/25(水) 00:36:43.44ID:Pjb4Hc47
DeDRMをpython3に対応させようとしたら糞ややこしくて泣ける・・・
なんかソースがぐちゃぐちゃになってきた

>>902
原因は分かったから対応します

>>907
-zと-eでzipとepub両方出力は考えたけど優先度低かったからv.0.1では見送った(一応-e有りと無しで二回実行すれば望むことはできるし)
Imageもまぁ一段落ついたら考えます

zipも無圧縮/圧縮を切り替えれるとかも一応実装しときたいところ
0913名無しさん@お腹いっぱい。
垢版 |
2020/03/25(水) 06:24:04.43ID:lmfxVMo+
>>910
なるほど変換できない文字が含まれてると全体を生Unicodeにしちゃうような感じなのか

うちはメインフローはbashでpython部は呼び出すだけにしてるが、pythonは文字列処理難しいのかな

自分用のソースなら見た目気にせず使い慣れたsedやawkが大活躍なんだが
0916名無しさん@お腹いっぱい。
垢版 |
2020/03/26(木) 03:10:18.32ID:uEMxp6su
k4mobidedrm.pyの72行目に書かれているhtml.entitiesが見つからないとかで動きませんでした
中身は良く判りませんがファイルの名前がなんとなくmobi用っぽいので
とりまエラー消しの為に該当行をv0.1の記述に戻して全件zip出力をテスト中です
ご報告まで
0917名無しさん@お腹いっぱい。
垢版 |
2020/03/26(木) 04:15:36.09ID:uEMxp6su
終了はしたのですが、数が合わなかったので、エラーになった書誌の特定のため、
vbsのコマンド部分をまんまバッチファイルに置き換えて実行したみたのですが、
不思議な事にバッチファイルだとうまく行きました

現在うちの環境ではコマンドプロンプトのデフォルトコードページが20127(UTF-8)から戻らなくなっていて、
バッチファイルでは先頭で932に変更しています
関連あるかはわかりませんが、一応文字コード近辺なので参考情報としてお伝えしておきます

あと>>802のファイル名ですが、ハートマーク以降が切り捨てられているようです
ご報告まで
0919名無しさん@お腹いっぱい。
垢版 |
2020/03/26(木) 17:06:30.59ID:uEMxp6su
>>918
ども
数字の方は合っているので、US-ASCIIから戻らなかったようです
なんとかアイツのレジストリの話に辿り着き、削除してグローバル値に戻せました
(なんでアイツ呼ばわりかというとCFにブロックされたので書けたらこれかなと)
0920名無しさん@お腹いっぱい。
垢版 |
2020/03/27(金) 12:04:57.27ID:HZu9VkPb
書籍名が切り捨てられる件の影響で、シリーズの巻数が切り捨てられて最後に変換された一冊だけが残る現象が発生しています
例はまたもうにあぼさんですが、「エロマンガ?描きますよ。お仕事ですから!」シリーズで発生を確認しました
ご報告まで
0921名無しさん@お腹いっぱい。
垢版 |
2020/03/27(金) 14:27:02.55ID:G80qub6t
タイトルが途中で切れる以上はそうなるわな
特殊な文字でしか起こらないだろうから個別に手で直せばいいのでは
0922名無しさん@お腹いっぱい。
垢版 |
2020/03/27(金) 14:48:50.07ID:G80qub6t
>>920
オプション-tを使えば行けるみたいよ

ちょっと調べたらKindleUnpackの時点でcontent.opfに記載のtitleが化けてる
Updated_Titleには正しい文字列が入ってるみたいだから、-tを使えばそっちを取れる

結局大元のazwの時点でデータに問題があるか、KindleUnpackのロジックに問題があるかのどちらかかな
0923名無しさん@お腹いっぱい。
垢版 |
2020/03/27(金) 19:20:38.95ID:HZu9VkPb
どもです。-t -eで全件お試し中です。
ところで>>916でk4mobidedrm.pyのhtml.entitiesの行を戻したままなんですが、これで何か不具合出たりしますか?
0925名無しさん@お腹いっぱい。
垢版 |
2020/03/27(金) 19:45:02.32ID:HZu9VkPb
なるほど。じゃpython2.7環境ならそのままでいい訳ですね
オプション次第では3特有の関数が必要とかかなぁ
0926名無しさん@お腹いっぱい。
垢版 |
2020/03/27(金) 20:31:29.37ID:HZu9VkPb
処理終了
若干増えたので気が向いたら差分取ってみます(名前微妙に変わるわ母数4桁だわでちょっと大変)
恐らく全部EPUB化できたと思います
ありがたや

といいつつ要望なのですが、
・差分のみ出力オプション(既存の場合変換プロセスをスキップ)
・著者数が一定値を越えた場合に代替ラベルで出力するオプション(-alim 5 -albl "雑誌" みたいな)
あたりがあると非常にありがたいです
検討お願いします
0927名無しさん@お腹いっぱい。
垢版 |
2020/03/27(金) 23:10:18.74ID:VfjvZrq2
>>920
タイトルはTitleとUpdate_Titleと二種類あって自分の持ち物だとUpdate_Titleは後ろに(〜コミック)とかつくだけで邪魔だったからTitleを優先にしたのよね
readmeにも書いといたけどcalibreはUpdate_Titleを優先してた
で、指摘の件の本だとUpdate_Titleに完全なタイトルが入っててTitleは短いタイトルが入っているからどうしてもそうなっちゃう仕様です
なので>>922さんの言う通り-tオプション付けて変換かけてください

>>923,924
ブランチ切る前にPython3に同一ソースで対応させるために先走って弄ってたの忘れてました
今の最新コミットでは大丈夫なように直してあります

>>926
何冊以上となると数は変換してみないとわからないから、変換終了後に移動ってなるとアルゴリズムにちょっと悩む
著者名でディレクトリ掘って分けるオプションなら簡単に実装できそうだけど
差分出力は考えます
0928名無しさん@お腹いっぱい。
垢版 |
2020/03/27(金) 23:18:09.32ID:VfjvZrq2
あと>>395の修正取り込んでいたらepubのnavの表紙が2個(うち一つは存在しない表紙)になってしまうことがあるバグが有った
なので、KindleUnpack - The Plugin + ZIP modにも同じ不具合があります
両方とも次で直します

>>907の出力オプションは簡単だったからv.0.3で実装します
Images出力はzipとかのファイル名と同じディレクトリ作ってその中にjpgを投げます

で、python3のブランチにv.0.3 betaとしてpython3でも動くようにしたと思うのを上げときました
ただ動作確認はまだWindowsのpython 3.8でしかしてませんのでご注意を
0929名無しさん@お腹いっぱい。
垢版 |
2020/03/27(金) 23:26:53.91ID:HZu9VkPb
>>927
何冊以上に引っ掛かったので一応確認
雑誌などの場合、一冊の書籍に対して著者名が何人もつくと思うのですが、そういった場合を考えています
ずらずら著者が並ぶのも見栄え悪いしなにより毎号変わるから人によってはファイルの並びが不便かなと
とりあえずうちでは数冊なので困ってはいませんが

他は了解しました
差分出力のご検討ありがとうございます。期待しています
0930名無しさん@お腹いっぱい。
垢版 |
2020/03/28(土) 01:52:56.36ID:sJsjZr4/
雑誌の扱いは悩むところ
うちでは雑誌名マスタを持っておいて、タイトルが前方一致したら著者名は「(雑誌名)編集部」に固定している
0931名無しさん@お腹いっぱい。
垢版 |
2020/03/28(土) 07:27:31.89ID:d4GTZXYD
ラノベ原作コミックスとかだと、原作者、原作絵師、コミックス作者が順不同で並んでたりしますね
0932名無しさん@お腹いっぱい。
垢版 |
2020/03/28(土) 07:39:13.58ID:sJsjZr4/
例)りゅうおうのお仕事コミック版の場合

こけたおこげ:作画
しらび:キャラ原案
カズキ:構成
白鳥士郎:原作
西遊棋:監修
0933名無しさん@お腹いっぱい。
垢版 |
2020/03/28(土) 23:45:34.20ID:3UFcuLkt
python3ブランチに設定ファイルで振り分け&リネーム可能にしたBeta2上げてみた
これで問題なければv.0.3にする

変な動作するものでKindle Unlimitedにあるものなら確認します
0935名無しさん@お腹いっぱい。
垢版 |
2020/03/29(日) 00:42:13.61ID:0LUzT4GC
以降はpython3で開発される予定でしょうか?
これのためだけにpython入れてるので
もしそうなら両方は入れたくないので入れ替えます

>>931-932
その手のは多くてもほぼ固定だから雑誌よりはマシですね
個人的には5人ならギリ許容範囲かなぁ
0936名無しさん@お腹いっぱい。
垢版 |
2020/03/29(日) 16:44:23.29ID:s/f6oZms
Python 3.7.7で動作しました

azw2zip.jsonでのリネーム
python3だと\dで全角数字もマッチしてくれるの便利すぎ
巻数表記のゆらぎは
"title": "(.*)[  (]\\(*(\\d{1,2})"
"series_index": "(\\d{1,2})",
で大体何とかなりそう

ただこれ authors はマッチで前方抽出じゃなく直値で置き換えるしかない感じですか?
自分>910ですが[性 名]の真ん中部分のスペースを削ったりしたくて
re.subでいらんとこ削ったり置き換えの指定ができるようになるとありがたいです
あと巻数部文以外の全角英数→半角変換とかも
0937名無しさん@お腹いっぱい。
垢版 |
2020/03/30(月) 00:30:18.52ID:jqMTph6R
>>928の不具合直した
KindleUnpack - The Plugin + ZIP mod v.0.3
上げといた

>>935
どっちでも動くようにソース書いているからよほどのことがない限りどっちでも動くようにするよ
py2exeでのexe化も目処がたったからやりたい

>>936
そういう著者もあったのか
ちょっと考えます
著者、作品名の全角→半角はとりあえずjsonにそれのON/OFFキー作ってみる
0938名無しさん@お腹いっぱい。
垢版 |
2020/03/30(月) 07:23:31.01ID:0dtf+Few
基本pytion2,3両用との事ですので報告
kindlekey.pyですが、python2ではwinregは_winregのようで、
v0.3のhtmlentitydefsに倣ってtry-except構文に書き換えようと試みたのですが、
いまいち理解できていないようでエラーになったのでとりあえず決め打ちで動かしています

現在EPUBと圧縮ZIPの同時出力でテスト中です
(毎回必ず全件変換だしオプションも変わらないので起動は自作バッチファイルですが)

雑誌はタイトルで引っ掛けてAuthorsを捨てるようにしました
私の案よりこっちのがモノによって雑誌、アンソロなど使い分けられていいですね

authorsに関しては>>936さんとほぼ同意見です。
同じ人でも全半角とか姓名空きとか揃っていない場合が多々ありますので
(もっとも検索にも難儀するので本来なら元データを統一してほしいところではありますが)

あとどちらかというとjsonの質問になってしまうのですが、例えば
オールカラーでわかりやすい! 世界の宗教
なる本はauthorsが空なのですが、こういった場合を引っ掛けるにはどう記述したらいいでしょうか?

あとこれは本来の機能とは全然関係ないのですが
ファイルと書誌の対応一覧表を作れるミニツールみたいなものがあると変換テストが最小限で済んでとても助かります
0939名無しさん@お腹いっぱい。
垢版 |
2020/03/30(月) 07:40:10.90ID:E/X5iNKt
著者姓名間のスペースは不揃いだと煩わしいから俺は一律消してるけど消したら自動では戻せない
また英字のみの外国人の場合はスペースないと逆に不自然

といった感じで要望噴出しそうでまとめるのは大変だと思うけど、作者の人は普通に対応してて頭が下る
0940名無しさん@お腹いっぱい。
垢版 |
2020/03/30(月) 11:22:51.43ID:dU7CohN6
その辺は([a-zA-Z]+)で振分け可能なのでユーザー側のjson編集でいけんじゃね
変換が不可逆なのも大前提だしね
ただ全半変換はタイトルに?が含まれてる本も多いからファイル名禁止文字に引っかかる

しかし氏名の間のスペースも半角だったり全角だったりあったりなかったり
全角英字タイトルも途中の巻から半角英字になってたり
表記ルールろくに決めずにノーチェックでバイトに入力させてるんやろうなって
0941名無しさん@お腹いっぱい。
垢版 |
2020/03/31(火) 00:34:42.53ID:caOYEeKt
漫画雑誌変換したら連結した作者名が長すぎてファイル名長の制限越えてダメだなw
1人目が出版社っぽいからとりあえず5人超えたら1人目だけにするようにするかな
リネームの処理柔軟にできるように考えてたら訳分かんなくなってきた…

>>938
あー、そういやそこもいじってたの忘れてた
直します
0943名無しさん@お腹いっぱい。
垢版 |
2020/03/31(火) 11:53:04.51ID:4ffVb0ed
ソフトハウス名義とかで全部英字でもスペース有無の統一されてないのがあったり
うちの例だとRiddleSoftが何冊かあります
今売ってる奴は空白ありだけど完全に別商品扱いなので落とし直しても直らない
0944名無しさん@お腹いっぱい。
垢版 |
2020/03/31(火) 12:35:59.79ID:aMh4wtwR
著者名末尾に(○○文庫)とか付いて邪魔なのもある

しかしつまるところファイル名になるんだからレアケースは手で直せばいい

著者名に関して標準であると嬉しいのは
・姓名間のスペース除去
・全角→半角変換
・複数著者は著者名でソート
・雑誌判定
くらいかなあ
0945名無しさん@お腹いっぱい。
垢版 |
2020/03/31(火) 12:53:24.82ID:4ffVb0ed
差分出力も考え中って事だったからレアケースでもルールファイルに落とした方がいい気が
雑誌は書誌名の部分一致でなんとかならんかいね
スペース除去と英字半角はぜひ欲しいなぁ
0947名無しさん@お腹いっぱい。
垢版 |
2020/03/31(火) 18:46:11.97ID:4ffVb0ed
差分メンドそうですね
もう起動日時を(弄れる形で)ファイルに吐いてファイルかフォルダの日時と比べるとかでもいいかもしんない
0948名無しさん@お腹いっぱい。
垢版 |
2020/03/31(火) 18:57:10.31ID:aMh4wtwR
差分変換って発想は
azwとzipの両方のライブラリも維持しつつ同期させたいってことだよね
無論個人の好みだけど俺は変換済んだらazwはさっさと消す派
残しても役にたたんから

強いて言うならKindleが本データ更新したときに追従できるくらいだけど
それも差分でやるにはAmazonの商品ID(Bで始まるやつ)をキーにするか、タイムスタンプで判定するしかない
後者だとファイル名が変わるような書誌変更はファイルが2つになる(まあそんな変更そうないが)
0949名無しさん@お腹いっぱい。
垢版 |
2020/03/31(火) 19:43:13.61ID:4ffVb0ed
自分が差分変換したい理由はKindleforPCのビュアーが気に入ってるからですね
抜き出しはあくまでバックアップな感じです

自分の環境ではここ10年ちょっとで都合8冊ほど「ライブラリの管理」の対象から消えています
何冊かは商品ページも無くなっていました
幸い注文番号は残っていたので電話で復旧出来たんですが
こういうのもバックアップなり購入リストなりがないと正確に把握できませんし



それはそれとして、ASIN B07K5KJYZD の書誌名が化けてましたのでご報告
&が&になってました
0950名無しさん@お腹いっぱい。
垢版 |
2020/03/31(火) 21:16:07.71ID:r9lWVONR
broken dream&reborn3: 一級建築士を目指して Broken dream & reborn Kindle版

タイトルに全角&は含まれてないようだけど
0952名無しさん@お腹いっぱい。
垢版 |
2020/04/01(水) 16:11:16.22ID:jN8qUDXd
epubファイルをリネームするツールを作ってみました
https://dotup.org/uploda/dotup.org2101707.zip.html
パスワード:epubren

使い方
node.jsをインストールした後booksフォルダに変換したいファイルを入れてrun.batを実行すると下記のような感じでリネームします
漫画や小説など
[作者名] 作品名 第00巻
雑誌
雑誌名 0000年00月号

既知の問題
run.bat実行時にWindows Defenderとかの警告がでるかも
タイトルに98以下の数字が入っていたり99巻以上の作品だとファイル名がおかしくなる
雑誌の場合は変換が雑
ファイルが多いと時間がかかるかも
0953名無しさん@お腹いっぱい。
垢版 |
2020/04/02(木) 00:22:02.72ID:uQQFEKlb
releaseにv.0.3 RC上げといた
リネーム処理融通効かせようと思ったらコードぐちゃぐちゃになったせいでバグありそうだけど・・・
py2exeを使ったexe化も可能にしたので、おいおいPythonインストールしないでいいexe版も上げとく

>>949
直ったと思う

差分は無駄なファイルを作らずできそうだからこれが問題なければやってみる
0954949
垢版 |
2020/04/02(木) 01:34:47.58ID:ZxIdF6De
対応ありがとうございます
とりあえず単品では直っているのを確認しましたので取り急ぎご報告まで
一応全件も確認しておきます
0955名無しさん@お腹いっぱい。
垢版 |
2020/04/02(木) 08:22:12.33ID:ZxIdF6De
全件比較終了
著者数が多い場合は纏めるようにしたんですね
「ほか」は「外」より「他」のがいい気がします
それ以外はそのままでした

あとこれは前からの見落としかつかなりレアケースだと思うんでいよいよ個別に手で対応した方がいい気もしますが、
温泉マーク(U+2668)が?に化けていました。対象はASIN B07RZYV69F(有料)です。一応報告しておきます
0956名無しさん@お腹いっぱい。
垢版 |
2020/04/05(日) 18:58:50.15ID:FfcHTHMN
日本商工会議所はあまりにも軽く考えすぎだろ
0957名無しさん@お腹いっぱい。
垢版 |
2020/04/05(日) 20:12:08.63ID:aFWYmnLp
別ツールで作ろうとしたのですが、ファイル名長の都合で著者まとめ不可避っぽいので要望です
_authorsとかなんとかのフォルダを掘って各著者フォルダに書誌をリンクする機能があるといいなぁ
Windowsの場合XP以前はmklinkコマンドがないので対応するなら問題のないソースを拾う必要がありますが…
ちゃんと理解してないとコピー移動でエラい目に合う可能性があるのであくまでオプションで

あ、EPUB限定なら別ツールでもいいのか
うーんどうしようバランス悪い
0959名無しさん@お腹いっぱい。
垢版 |
2020/04/06(月) 09:06:56.95ID:JLmPq4sQ
自炊したコミックをシリーズとしてカテゴライズしたいのですが、やり方がわかりません。
Calibre4.13 + Kindle ペーパーホワイト を使っています。

方法があったら教えて下さい。
0961名無しさん@お腹いっぱい。
垢版 |
2020/04/06(月) 09:36:15.87ID:1gGsA0jI
最近はkindle使ってないんだけど、今のkindle端末ってcalibreのseriesをデフォで反映できるの?

昔はプラグインでseries毎にコレクション作るような設定してたけど
0962名無しさん@お腹いっぱい。
垢版 |
2020/04/06(月) 09:36:58.95ID:JLmPq4sQ
>>960
例えばドラゴンボールだったら、
series列は ドラゴンボール
series_idx列は、1巻なら[1] 2巻なら[2]…になるの?

つまりGUI表示状は ドラゴンボール[1] とかになるの?
0964名無しさん@お腹いっぱい。
垢版 |
2020/04/08(水) 16:27:37.93ID:qMeRHq1d
azw2zipの作者さん、DeDRM PluginのソースのPython3対応は自分で修正してるのかな?

本家のPython3ブランチのソースだとExceptionのシンタックスとかlong値リテラルとかpy3対応してないと思うんだけど。

だとしたら熱烈感謝の上、ソース流用させてもらいます。
メインロジックは自分のもの使いたいけどpy3対応はしたかったので。
0965名無しさん@お腹いっぱい。
垢版 |
2020/04/12(日) 00:12:18.31ID:EJQfsg5v
azw2zip v.0.3 RC2としてzip化のDRM解除不要版を作るついでにデフォでは上書きしないようにしてみた
-oオプションつければ従来どおり上書きします

>>964
Pythonの勉強がてら自分で修正したよ
strとbytesの整合性取るのがめんどかった
0967名無しさん@お腹いっぱい。
垢版 |
2020/04/14(火) 10:30:12.05ID:IoO4+VeI
なんかエラーであります
全件固定版とD&D版でそれぞれバッチファイル作ってます
以下全件固定版画面まんま

D:\tool\azw2zip>"D:\Python2.7\python.exe" D:\tool\azw2zip\azw2zip.py -z -t -c "D:\RedirectedSettings\xxxx\My Kindle Content" "E:\My Kindle Backup\zip"
azw2zip v.0.3
Copyright (C) 2020 junk2ool

k4iディレクトリ: D:\tool\azw2zip
k4i: D:\tool\azw2zip\kindlekey1.k4i
変換ディレクトリ: D:\RedirectedSettings\xxxx\My Kindle Content
出力ディレクトリ: E:\My Kindle Backup\zip
出力ディレクトリ: 作成: E:\My Kindle Backup\zip

変換開始: D:\RedirectedSettings\xxxx\My Kindle Content\B0084AVKZW_EBOK
Traceback (most recent call last):
File "D:\tool\azw2zip\azw2zip.py", line 312, in <module>
sys.exit(main())
File "D:\tool\azw2zip\azw2zip.py", line 204, in main
a2z.load(azw_fpath, '', debug_mode)
File "D:\tool\azw2zip\azw2zip_nodedrm.py", line 564, in load
azw.load(azw_fpath, self.azw_header_data, self.debug)
File "D:\tool\azw2zip\azw2zip_nodedrm.py", line 419, in load
raise azw2zipException(u'invalid file format: {}'.format(ident))
UnicodeDecodeError: 'utf8' codec can't decode byte 0x81 in position 0: invalid s
tart byte
0968名無しさん@お腹いっぱい。
垢版 |
2020/04/15(水) 01:06:30.14ID:UlLo3gB6
追記
RC(1)に戻して最初から試してみたところ、最初に解読失敗が1件ありました
この時はスキップされて次の本に移っているので、上記の場所ではなくエラー処理関係なのかも
0969名無しさん@お腹いっぱい。
垢版 |
2020/04/15(水) 20:02:35.13ID:iuPJ9IKH
kindleunpackでepub3にしたのをiBooks で読もうとした時に「要求されたリソースがみつからないため〜」と出た場合にはどうすればいいですか?
0970名無しさん@お腹いっぱい。
垢版 |
2020/04/16(木) 22:23:48.56ID:tVvov+gK
スゴイツールができたんですね
でもPython導入してみましたがやり方が分からないので
プラグインの方を使わせていただきます
0971名無しさん@お腹いっぱい。
垢版 |
2020/04/21(火) 12:43:13.56ID:WMuInGbR
>>890
それらのバージョン詳しく
0972名無しさん@お腹いっぱい。
垢版 |
2020/04/21(火) 19:55:19.99ID:WMuInGbR
Got DSN key from database C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\kindlekey1.k4i
Found 4 keys to try after 0.2 seconds
Crypto Type is: 2
Error decrypting book after 0.2 seconds: No key found in 4 keys tried.
Traceback (most recent call last):
File "C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\DeDRM_Plugin\k4mobidedrm.py", line 274, in decryptBook
book = GetDecryptedBook(infile, kDatabases, androidFiles, serials, pids, starttime)
File "C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\DeDRM_Plugin\k4mobidedrm.py", line 248, in GetDecryptedBook
mb.processBook(totalpids)
File "C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\DeDRM_Plugin\mobidedrm.py", line 506, in processBook
raise DrmException(u"No key found in {0:d} keys tried.".format(len(goodpids)))
mobidedrm.DrmException: No key found in 4 keys tried.
DRM解除: 失敗:
DRM解除: 失敗:

azw3はいけるんですけどazwがDRMを解除できなくて引っかかってます
Pythonは3.8
0973名無しさん@お腹いっぱい。
垢版 |
2020/04/21(火) 20:08:48.90ID:WMuInGbR
パソコン内を検索したら出てきたkindlekey1.k4i使ったらできました!
0974名無しさん@お腹いっぱい。
垢版 |
2020/04/21(火) 23:58:24.87ID:WMuInGbR
タイトルと巻数がスペース無しで連続してるとき
"title": "(.*)[  (]\\(*(\\d{1,2})"
"series_index": "(\\d{1,2})",
じゃダメみたいです
情けないのですが1ミリも読めないのでご教示願いたいです
0975名無しさん@お腹いっぱい。
垢版 |
2020/04/22(水) 01:14:51.78ID:l1QzBd0S
具体的な巻数表記がどうなってるのかサンプル出さないで言われても分からんけど
巻数数字の直前にある文字を[] の中に列挙していけばいいだけ
上の例では[  (] の部分で 半角スペース or 全角スペース or 全角前カッコ を指定している
0977名無しさん@お腹いっぱい。
垢版 |
2020/04/23(木) 04:43:22.90ID:kWBaAkel
■■■■kindle版「プロボクサー井上尚弥の弱点 偽りの怪物」只今無料■■■■

Amazonで無料ダウンロードサービス中 只今なら定価250円が無料に
Amazon検索窓で「井上尚弥の弱点 偽りの怪物」をクリック
井上尚弥本人が書いた著作より、Amazon検索上位に来てるから笑えるナゾの電子書籍
<目次>
第一章 史上初の最強王者同士のトーナメント
◆実は「正規王者」は、「正規の王者」ではない
第二章 偽のベルトを量産させたボクシング団体
◆正規王者というウソのタイトル
◆本物の王者2人の不可解な棄権
第三章 姿を消した長身のサウスポー
◆井上尚弥のもっとも苦手な選手は何処へ?
◆一度もまともに勝たず決勝戦にたどりついた老ボクサー
第四章 「正規王者」という名の偽王者
◆WBSS出来レース抽選会
第五章 トヨタオブハリウッドからの刺客
◆スポンサー広告禁止を無視して
◆大橋ジム後援会の超大物顧問
第六章 パヤノの演技力
◆ヒットポイントから外れた効くはずのないパンチ
◆ネリのKO劇に酷似するパヤノのダウンシーン
第七章 ついにバレた「偽りの王者」
https://www.amazon.co.jp/dp/B0879FVBST/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&;dchild=1&keywords=%E4%BA%95%E4%B8%8A%E5%B0%9A%E5%BC%A5&qid=1587467105&sr=8-1
0978名無しさん@お腹いっぱい。
垢版 |
2020/04/27(月) 00:34:10.16ID:qUSke+cW
>>974
>>976ならその作者のタイトルに数字が入らない前提なら作者で絞っておいて
"title": "(.+?)\\s*(\\d{1,2})",
の大雑把な指定で2桁までの巻数が取れるはず
作者で絞っておけば誤爆しないだろうし
あとtitleで巻数取るようにしといたらseries_indexは無くても大丈夫
あえて書くなら
"series_index": ".+?(\\d{1,2})",
でいいと思う

タイトルに数字が入ってても巻数の数字がタイトルの末尾なら最短マッチの?消して
"title": "(.+)\\s*(\\d{1,2})",
でいい
0980名無しさん@お腹いっぱい。
垢版 |
2020/04/29(水) 12:40:05.27
ちょっと話に入りたいんだが、「KindleUnpack - The Plugin + ZIP mod」って、文字メインの活字本に対して役立つ?
画像で出力とか言われると、活字本の場合の文字データが全部消えてしまうように聞こえるんだが?
0983名無しさん@お腹いっぱい。
垢版 |
2020/04/29(水) 13:34:44.15ID:5ecm+hYZ
文章が画像になるわけじゃなく、テキストは捨てられるだろう
挿絵とかの画像だけになるのでは
0985名無しさん@お腹いっぱい。
垢版 |
2020/04/29(水) 14:01:32.07
俺ちゃんとKindle1.24使ってる。
高画質画像が収まってる(?)resファイルをazwファイルの該当画像に差し替えたいと思ってるんだが、丁度いいツールある?
0991967
垢版 |
2020/04/29(水) 18:40:00.72ID:3fdQqGt+
結局うちっておま環なんかいね
指摘もうちももないからよくわからん
0993名無しさん@お腹いっぱい。
垢版 |
2020/04/29(水) 20:29:22.17ID:3fdQqGt+
してません
今のところ「2系で動かない」っていうのは意図されていないと思っているので
作者さんもその意向なら諦めてそっちにしますが
0997名無しさん@お腹いっぱい。
垢版 |
2020/04/30(木) 22:30:20.41ID:lGiW5R0+
またID無しのハゲか
ろだコミに帰れよ
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況