【Calibre】電子書籍 保存・管理・変換・編集ソフト part1
レス数が1000を超えています。これ以上書き込みはできません。
https://calibre-ebook.com/
Wikipedia https://ja.wikipedia.org/wiki/Calibre
Calibreとはフリー・アンド・オープンソースの電子書籍ソフトウェアであり、
電子書籍を保存や管理を行うことが可能で、多数のフォーマットに対応している。
またDRMのかかった電子書籍を他のフォーマットへ変換でき、
数種類の主な電子ブックリーダーと同期することができる。
使い方説明サイト
http://gihyo.jp/lifestyle/serial/01/calibre
Calibreについて語りましょう ↓みたいにタイトル部が満遍なくエスケープされるな
ロケールをja_JP.UTF-8に強制したりしてみたが変わらず
[うにぁぼ] 地下ア(略).zip
こちらの環境はdocker上のdebian10
開発者の環境(WSL+Ubuntu18.04)との違いを調べる必要がありそうだ あれ、エスケープ文字を貼ったら5ch側で日本語にされちまった
後で貼り直す こんな感じか
おバカタイトルですまん
期待するタイトル:
[うにぁぼ] 地下アイドルあるある?八景島デジフェチパラダイス♡: 撮ってくれたらよしこ感じちゃうー!!.zip
実際のタイトル:(実際は5桁数値の前に&Hが付く)
[うにぁぼ] 22320;19979;12450;12452;12489;(略).zip 連投すまぬ
KVM上のUbuntu18.04でも試したが変化なし
どうも出力ファイル名が「UTF-8エンコードしたUnicode」でなくて
生のUnicode(UCS)になってそうに見える。
タイトル先頭の「地」の字の文字コードを調べると、
Unicode(UCS): 0x5730(10進で22320)
UTF-8: 0xE59CB0(10進で15047856)
で、上の方が使われているみたい。
著者名の方はちゃんと出てるから、何かマルチバイト文字周りで問題というか動作の違いがあるのかも。
WSLだと問題ないとしたら、マルチバイトの取扱いに差がある(WSLが吸収してる?)のかな かなり昔のことでうろ覚えだが、windowsでchcp 1200(UTF-16)が
使用できなくて、win10+Python2.7の環境で文字化けしたことがあった
その時は諦めてWSLで動かすことで逃げた >>888
ありがとう
おかげで「デパート女店員になる近道」のオリジナル画像を抜き出せた そんなんばっかですいません。それらです
とりあえずおま環ってやつではなさげですね >>892
いただきました
数冊試してみましたが一つにまとまってるから処理が早いですね
もしよろしければオプションの追加を検討していただきたいのですが、
例えば -f でImageフォルダ出力
-z -e でZIPとepub出力、-e -f でepubとImageフォルダ出力みたいな感じのを
Imageフォルダ出力はkindleによくある1ページ目のNEXT PAGEや
最後のBWロゴページを消したいので
複数出力はマンガか小説かを判定してオプションを切り替えたら
良いのでしょうが、良い判定方法が思いつかないので(汗)
両方一緒に出せば良いかなぁーと
お時間のあるときにでもご検討いただければ幸いです 作者さん次第だが、さすがにそりゃ自分でやることじゃないのか
azwからepub/zipに変換するツールが出てきたんだから組み合わせでどうにかできるでしょ
特定のページを捨てたいとか、いちいち組み込んでたらきりがないと思うがな 元のスクリプトを弄らんで、
epubとzipで引数変えて二回元のスクリプトを動かすスクリプトを作る、
その後に出来たzipをzipのファイル名のフォルダ作ってそこに解凍するバッチファイルなりスクリプトなりを自分で作るのじゃあかんの? py版いいっすね
せっかくなんでkindleunpack.py内のmakeOutputFileName()弄って出力ファイル名を調整しようとしたが
pythonニワカなうえPy2のUnicode制限がきつくてつらい
[苗字 名前] → [苗字名前] にするくらいならなんちゅーこともないが
タイトルHOGE (1)
みたいな尼の全半混じりクソ表記をどうにかしようとするとわけわからん
ファイルリネームするスプリクトを別に作るほうが楽か
>>903
junk2ool氏ではないが WSL+Ubuntu18.04 で試してみたが>902のタイトルはエラーで変換できなかった
ハートがcp932(SJIS)にはないコードなのでそのせいだと思うが
この辺の問題pyt3にすることでほぼほぼ解決しそうな気がするんだが
1byte圏の人らは自分らが困らないから無頓着だよね DeDRMをpython3に対応させようとしたら糞ややこしくて泣ける・・・
なんかソースがぐちゃぐちゃになってきた
>>902
原因は分かったから対応します
>>907
-zと-eでzipとepub両方出力は考えたけど優先度低かったからv.0.1では見送った(一応-e有りと無しで二回実行すれば望むことはできるし)
Imageもまぁ一段落ついたら考えます
zipも無圧縮/圧縮を切り替えれるとかも一応実装しときたいところ なるほどハートマークか
道理でエロタイトルばっかり引っ掛かる訳だ >>910
なるほど変換できない文字が含まれてると全体を生Unicodeにしちゃうような感じなのか
うちはメインフローはbashでpython部は呼び出すだけにしてるが、pythonは文字列処理難しいのかな
自分用のソースなら見た目気にせず使い慣れたsedやawkが大活躍なんだが >>902を直したazw2zip v.0.2上げといた k4mobidedrm.pyの72行目に書かれているhtml.entitiesが見つからないとかで動きませんでした
中身は良く判りませんがファイルの名前がなんとなくmobi用っぽいので
とりまエラー消しの為に該当行をv0.1の記述に戻して全件zip出力をテスト中です
ご報告まで 終了はしたのですが、数が合わなかったので、エラーになった書誌の特定のため、
vbsのコマンド部分をまんまバッチファイルに置き換えて実行したみたのですが、
不思議な事にバッチファイルだとうまく行きました
現在うちの環境ではコマンドプロンプトのデフォルトコードページが20127(UTF-8)から戻らなくなっていて、
バッチファイルでは先頭で932に変更しています
関連あるかはわかりませんが、一応文字コード近辺なので参考情報としてお伝えしておきます
あと>>802のファイル名ですが、ハートマーク以降が切り捨てられているようです
ご報告まで >>917
細かい事ですが、UTF-8は65001、20127はUS-ASCIIですね >>918
ども
数字の方は合っているので、US-ASCIIから戻らなかったようです
なんとかアイツのレジストリの話に辿り着き、削除してグローバル値に戻せました
(なんでアイツ呼ばわりかというとCFにブロックされたので書けたらこれかなと) 書籍名が切り捨てられる件の影響で、シリーズの巻数が切り捨てられて最後に変換された一冊だけが残る現象が発生しています
例はまたもうにあぼさんですが、「エロマンガ?描きますよ。お仕事ですから!」シリーズで発生を確認しました
ご報告まで タイトルが途中で切れる以上はそうなるわな
特殊な文字でしか起こらないだろうから個別に手で直せばいいのでは >>920
オプション-tを使えば行けるみたいよ
ちょっと調べたらKindleUnpackの時点でcontent.opfに記載のtitleが化けてる
Updated_Titleには正しい文字列が入ってるみたいだから、-tを使えばそっちを取れる
結局大元のazwの時点でデータに問題があるか、KindleUnpackのロジックに問題があるかのどちらかかな どもです。-t -eで全件お試し中です。
ところで>>916でk4mobidedrm.pyのhtml.entitiesの行を戻したままなんですが、これで何か不具合出たりしますか? html.entitiesはpython3
python2はhtmlentitydefsなんだけど実行環境変えたのかな なるほど。じゃpython2.7環境ならそのままでいい訳ですね
オプション次第では3特有の関数が必要とかかなぁ 処理終了
若干増えたので気が向いたら差分取ってみます(名前微妙に変わるわ母数4桁だわでちょっと大変)
恐らく全部EPUB化できたと思います
ありがたや
といいつつ要望なのですが、
・差分のみ出力オプション(既存の場合変換プロセスをスキップ)
・著者数が一定値を越えた場合に代替ラベルで出力するオプション(-alim 5 -albl "雑誌" みたいな)
あたりがあると非常にありがたいです
検討お願いします >>920
タイトルはTitleとUpdate_Titleと二種類あって自分の持ち物だとUpdate_Titleは後ろに(〜コミック)とかつくだけで邪魔だったからTitleを優先にしたのよね
readmeにも書いといたけどcalibreはUpdate_Titleを優先してた
で、指摘の件の本だとUpdate_Titleに完全なタイトルが入っててTitleは短いタイトルが入っているからどうしてもそうなっちゃう仕様です
なので>>922さんの言う通り-tオプション付けて変換かけてください
>>923,924
ブランチ切る前にPython3に同一ソースで対応させるために先走って弄ってたの忘れてました
今の最新コミットでは大丈夫なように直してあります
>>926
何冊以上となると数は変換してみないとわからないから、変換終了後に移動ってなるとアルゴリズムにちょっと悩む
著者名でディレクトリ掘って分けるオプションなら簡単に実装できそうだけど
差分出力は考えます あと>>395の修正取り込んでいたらepubのnavの表紙が2個(うち一つは存在しない表紙)になってしまうことがあるバグが有った
なので、KindleUnpack - The Plugin + ZIP modにも同じ不具合があります
両方とも次で直します
>>907の出力オプションは簡単だったからv.0.3で実装します
Images出力はzipとかのファイル名と同じディレクトリ作ってその中にjpgを投げます
で、python3のブランチにv.0.3 betaとしてpython3でも動くようにしたと思うのを上げときました
ただ動作確認はまだWindowsのpython 3.8でしかしてませんのでご注意を >>927
何冊以上に引っ掛かったので一応確認
雑誌などの場合、一冊の書籍に対して著者名が何人もつくと思うのですが、そういった場合を考えています
ずらずら著者が並ぶのも見栄え悪いしなにより毎号変わるから人によってはファイルの並びが不便かなと
とりあえずうちでは数冊なので困ってはいませんが
他は了解しました
差分出力のご検討ありがとうございます。期待しています 雑誌の扱いは悩むところ
うちでは雑誌名マスタを持っておいて、タイトルが前方一致したら著者名は「(雑誌名)編集部」に固定している ラノベ原作コミックスとかだと、原作者、原作絵師、コミックス作者が順不同で並んでたりしますね 例)りゅうおうのお仕事コミック版の場合
こけたおこげ:作画
しらび:キャラ原案
カズキ:構成
白鳥士郎:原作
西遊棋:監修 python3ブランチに設定ファイルで振り分け&リネーム可能にしたBeta2上げてみた
これで問題なければv.0.3にする
変な動作するものでKindle Unlimitedにあるものなら確認します azw2zip.sample.json
を参考に
azw2zip.json
にリネームして使ってください 以降はpython3で開発される予定でしょうか?
これのためだけにpython入れてるので
もしそうなら両方は入れたくないので入れ替えます
>>931-932
その手のは多くてもほぼ固定だから雑誌よりはマシですね
個人的には5人ならギリ許容範囲かなぁ Python 3.7.7で動作しました
azw2zip.jsonでのリネーム
python3だと\dで全角数字もマッチしてくれるの便利すぎ
巻数表記のゆらぎは
"title": "(.*)[ (]\\(*(\\d{1,2})"
"series_index": "(\\d{1,2})",
で大体何とかなりそう
ただこれ authors はマッチで前方抽出じゃなく直値で置き換えるしかない感じですか?
自分>910ですが[性 名]の真ん中部分のスペースを削ったりしたくて
re.subでいらんとこ削ったり置き換えの指定ができるようになるとありがたいです
あと巻数部文以外の全角英数→半角変換とかも >>928の不具合直した
KindleUnpack - The Plugin + ZIP mod v.0.3
上げといた
>>935
どっちでも動くようにソース書いているからよほどのことがない限りどっちでも動くようにするよ
py2exeでのexe化も目処がたったからやりたい
>>936
そういう著者もあったのか
ちょっと考えます
著者、作品名の全角→半角はとりあえずjsonにそれのON/OFFキー作ってみる 基本pytion2,3両用との事ですので報告
kindlekey.pyですが、python2ではwinregは_winregのようで、
v0.3のhtmlentitydefsに倣ってtry-except構文に書き換えようと試みたのですが、
いまいち理解できていないようでエラーになったのでとりあえず決め打ちで動かしています
現在EPUBと圧縮ZIPの同時出力でテスト中です
(毎回必ず全件変換だしオプションも変わらないので起動は自作バッチファイルですが)
雑誌はタイトルで引っ掛けてAuthorsを捨てるようにしました
私の案よりこっちのがモノによって雑誌、アンソロなど使い分けられていいですね
authorsに関しては>>936さんとほぼ同意見です。
同じ人でも全半角とか姓名空きとか揃っていない場合が多々ありますので
(もっとも検索にも難儀するので本来なら元データを統一してほしいところではありますが)
あとどちらかというとjsonの質問になってしまうのですが、例えば
オールカラーでわかりやすい! 世界の宗教
なる本はauthorsが空なのですが、こういった場合を引っ掛けるにはどう記述したらいいでしょうか?
あとこれは本来の機能とは全然関係ないのですが
ファイルと書誌の対応一覧表を作れるミニツールみたいなものがあると変換テストが最小限で済んでとても助かります 著者姓名間のスペースは不揃いだと煩わしいから俺は一律消してるけど消したら自動では戻せない
また英字のみの外国人の場合はスペースないと逆に不自然
といった感じで要望噴出しそうでまとめるのは大変だと思うけど、作者の人は普通に対応してて頭が下る その辺は([a-zA-Z]+)で振分け可能なのでユーザー側のjson編集でいけんじゃね
変換が不可逆なのも大前提だしね
ただ全半変換はタイトルに?が含まれてる本も多いからファイル名禁止文字に引っかかる
しかし氏名の間のスペースも半角だったり全角だったりあったりなかったり
全角英字タイトルも途中の巻から半角英字になってたり
表記ルールろくに決めずにノーチェックでバイトに入力させてるんやろうなって 漫画雑誌変換したら連結した作者名が長すぎてファイル名長の制限越えてダメだなw
1人目が出版社っぽいからとりあえず5人超えたら1人目だけにするようにするかな
リネームの処理柔軟にできるように考えてたら訳分かんなくなってきた…
>>938
あー、そういやそこもいじってたの忘れてた
直します 雑誌が限られてるならそれぞれの書誌名部分一致で変換ルール書く方が早いと思うです ソフトハウス名義とかで全部英字でもスペース有無の統一されてないのがあったり
うちの例だとRiddleSoftが何冊かあります
今売ってる奴は空白ありだけど完全に別商品扱いなので落とし直しても直らない 著者名末尾に(○○文庫)とか付いて邪魔なのもある
しかしつまるところファイル名になるんだからレアケースは手で直せばいい
著者名に関して標準であると嬉しいのは
・姓名間のスペース除去
・全角→半角変換
・複数著者は著者名でソート
・雑誌判定
くらいかなあ 差分出力も考え中って事だったからレアケースでもルールファイルに落とした方がいい気が
雑誌は書誌名の部分一致でなんとかならんかいね
スペース除去と英字半角はぜひ欲しいなぁ 差分出力するにはunpackまでやって名称一致判定するしかないのか 差分メンドそうですね
もう起動日時を(弄れる形で)ファイルに吐いてファイルかフォルダの日時と比べるとかでもいいかもしんない 差分変換って発想は
azwとzipの両方のライブラリも維持しつつ同期させたいってことだよね
無論個人の好みだけど俺は変換済んだらazwはさっさと消す派
残しても役にたたんから
強いて言うならKindleが本データ更新したときに追従できるくらいだけど
それも差分でやるにはAmazonの商品ID(Bで始まるやつ)をキーにするか、タイムスタンプで判定するしかない
後者だとファイル名が変わるような書誌変更はファイルが2つになる(まあそんな変更そうないが) 自分が差分変換したい理由はKindleforPCのビュアーが気に入ってるからですね
抜き出しはあくまでバックアップな感じです
自分の環境ではここ10年ちょっとで都合8冊ほど「ライブラリの管理」の対象から消えています
何冊かは商品ページも無くなっていました
幸い注文番号は残っていたので電話で復旧出来たんですが
こういうのもバックアップなり購入リストなりがないと正確に把握できませんし
それはそれとして、ASIN B07K5KJYZD の書誌名が化けてましたのでご報告
&が&になってました broken dream&reborn3: 一級建築士を目指して Broken dream & reborn Kindle版
タイトルに全角&は含まれてないようだけど epubファイルをリネームするツールを作ってみました
https://dotup.org/uploda/dotup.org2101707.zip.html
パスワード:epubren
使い方
node.jsをインストールした後booksフォルダに変換したいファイルを入れてrun.batを実行すると下記のような感じでリネームします
漫画や小説など
[作者名] 作品名 第00巻
雑誌
雑誌名 0000年00月号
既知の問題
run.bat実行時にWindows Defenderとかの警告がでるかも
タイトルに98以下の数字が入っていたり99巻以上の作品だとファイル名がおかしくなる
雑誌の場合は変換が雑
ファイルが多いと時間がかかるかも releaseにv.0.3 RC上げといた
リネーム処理融通効かせようと思ったらコードぐちゃぐちゃになったせいでバグありそうだけど・・・
py2exeを使ったexe化も可能にしたので、おいおいPythonインストールしないでいいexe版も上げとく
>>949
直ったと思う
差分は無駄なファイルを作らずできそうだからこれが問題なければやってみる 対応ありがとうございます
とりあえず単品では直っているのを確認しましたので取り急ぎご報告まで
一応全件も確認しておきます 全件比較終了
著者数が多い場合は纏めるようにしたんですね
「ほか」は「外」より「他」のがいい気がします
それ以外はそのままでした
あとこれは前からの見落としかつかなりレアケースだと思うんでいよいよ個別に手で対応した方がいい気もしますが、
温泉マーク(U+2668)が?に化けていました。対象はASIN B07RZYV69F(有料)です。一応報告しておきます 別ツールで作ろうとしたのですが、ファイル名長の都合で著者まとめ不可避っぽいので要望です
_authorsとかなんとかのフォルダを掘って各著者フォルダに書誌をリンクする機能があるといいなぁ
Windowsの場合XP以前はmklinkコマンドがないので対応するなら問題のないソースを拾う必要がありますが…
ちゃんと理解してないとコピー移動でエラい目に合う可能性があるのであくまでオプションで
あ、EPUB限定なら別ツールでもいいのか
うーんどうしようバランス悪い 自炊したコミックをシリーズとしてカテゴライズしたいのですが、やり方がわかりません。
Calibre4.13 + Kindle ペーパーホワイト を使っています。
方法があったら教えて下さい。 series列にシリーズ名を
series_idx列に巻数を
それぞれセットするだけ 最近はkindle使ってないんだけど、今のkindle端末ってcalibreのseriesをデフォで反映できるの?
昔はプラグインでseries毎にコレクション作るような設定してたけど >>960
例えばドラゴンボールだったら、
series列は ドラゴンボール
series_idx列は、1巻なら[1] 2巻なら[2]…になるの?
つまりGUI表示状は ドラゴンボール[1] とかになるの? Kindleもkoboもメタデータのseriesやcollectionは反映しない azw2zipの作者さん、DeDRM PluginのソースのPython3対応は自分で修正してるのかな?
本家のPython3ブランチのソースだとExceptionのシンタックスとかlong値リテラルとかpy3対応してないと思うんだけど。
だとしたら熱烈感謝の上、ソース流用させてもらいます。
メインロジックは自分のもの使いたいけどpy3対応はしたかったので。 azw2zip v.0.3 RC2としてzip化のDRM解除不要版を作るついでにデフォでは上書きしないようにしてみた
-oオプションつければ従来どおり上書きします
>>964
Pythonの勉強がてら自分で修正したよ
strとbytesの整合性取るのがめんどかった なんかエラーであります
全件固定版とD&D版でそれぞれバッチファイル作ってます
以下全件固定版画面まんま
D:\tool\azw2zip>"D:\Python2.7\python.exe" D:\tool\azw2zip\azw2zip.py -z -t -c "D:\RedirectedSettings\xxxx\My Kindle Content" "E:\My Kindle Backup\zip"
azw2zip v.0.3
Copyright (C) 2020 junk2ool
k4iディレクトリ: D:\tool\azw2zip
k4i: D:\tool\azw2zip\kindlekey1.k4i
変換ディレクトリ: D:\RedirectedSettings\xxxx\My Kindle Content
出力ディレクトリ: E:\My Kindle Backup\zip
出力ディレクトリ: 作成: E:\My Kindle Backup\zip
変換開始: D:\RedirectedSettings\xxxx\My Kindle Content\B0084AVKZW_EBOK
Traceback (most recent call last):
File "D:\tool\azw2zip\azw2zip.py", line 312, in <module>
sys.exit(main())
File "D:\tool\azw2zip\azw2zip.py", line 204, in main
a2z.load(azw_fpath, '', debug_mode)
File "D:\tool\azw2zip\azw2zip_nodedrm.py", line 564, in load
azw.load(azw_fpath, self.azw_header_data, self.debug)
File "D:\tool\azw2zip\azw2zip_nodedrm.py", line 419, in load
raise azw2zipException(u'invalid file format: {}'.format(ident))
UnicodeDecodeError: 'utf8' codec can't decode byte 0x81 in position 0: invalid s
tart byte 追記
RC(1)に戻して最初から試してみたところ、最初に解読失敗が1件ありました
この時はスキップされて次の本に移っているので、上記の場所ではなくエラー処理関係なのかも kindleunpackでepub3にしたのをiBooks で読もうとした時に「要求されたリソースがみつからないため〜」と出た場合にはどうすればいいですか? スゴイツールができたんですね
でもPython導入してみましたがやり方が分からないので
プラグインの方を使わせていただきます Got DSN key from database C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\kindlekey1.k4i
Found 4 keys to try after 0.2 seconds
Crypto Type is: 2
Error decrypting book after 0.2 seconds: No key found in 4 keys tried.
Traceback (most recent call last):
File "C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\DeDRM_Plugin\k4mobidedrm.py", line 274, in decryptBook
book = GetDecryptedBook(infile, kDatabases, androidFiles, serials, pids, starttime)
File "C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\DeDRM_Plugin\k4mobidedrm.py", line 248, in GetDecryptedBook
mb.processBook(totalpids)
File "C:\Users\Administrator\Archive\azw2zip-v.0.3.RC2\DeDRM_Plugin\mobidedrm.py", line 506, in processBook
raise DrmException(u"No key found in {0:d} keys tried.".format(len(goodpids)))
mobidedrm.DrmException: No key found in 4 keys tried.
DRM解除: 失敗:
DRM解除: 失敗:
azw3はいけるんですけどazwがDRMを解除できなくて引っかかってます
Pythonは3.8 パソコン内を検索したら出てきたkindlekey1.k4i使ったらできました! タイトルと巻数がスペース無しで連続してるとき
"title": "(.*)[ (]\\(*(\\d{1,2})"
"series_index": "(\\d{1,2})",
じゃダメみたいです
情けないのですが1ミリも読めないのでご教示願いたいです 具体的な巻数表記がどうなってるのかサンプル出さないで言われても分からんけど
巻数数字の直前にある文字を[] の中に列挙していけばいいだけ
上の例では[ (] の部分で 半角スペース or 全角スペース or 全角前カッコ を指定している ■■■■kindle版「プロボクサー井上尚弥の弱点 偽りの怪物」只今無料■■■■
Amazonで無料ダウンロードサービス中 只今なら定価250円が無料に
Amazon検索窓で「井上尚弥の弱点 偽りの怪物」をクリック
井上尚弥本人が書いた著作より、Amazon検索上位に来てるから笑えるナゾの電子書籍
<目次>
第一章 史上初の最強王者同士のトーナメント
◆実は「正規王者」は、「正規の王者」ではない
第二章 偽のベルトを量産させたボクシング団体
◆正規王者というウソのタイトル
◆本物の王者2人の不可解な棄権
第三章 姿を消した長身のサウスポー
◆井上尚弥のもっとも苦手な選手は何処へ?
◆一度もまともに勝たず決勝戦にたどりついた老ボクサー
第四章 「正規王者」という名の偽王者
◆WBSS出来レース抽選会
第五章 トヨタオブハリウッドからの刺客
◆スポンサー広告禁止を無視して
◆大橋ジム後援会の超大物顧問
第六章 パヤノの演技力
◆ヒットポイントから外れた効くはずのないパンチ
◆ネリのKO劇に酷似するパヤノのダウンシーン
第七章 ついにバレた「偽りの王者」
https://www.amazon.co.jp/dp/B0879FVBST/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&dchild=1&keywords=%E4%BA%95%E4%B8%8A%E5%B0%9A%E5%BC%A5&qid=1587467105&sr=8-1 >>974
>>976ならその作者のタイトルに数字が入らない前提なら作者で絞っておいて
"title": "(.+?)\\s*(\\d{1,2})",
の大雑把な指定で2桁までの巻数が取れるはず
作者で絞っておけば誤爆しないだろうし
あとtitleで巻数取るようにしといたらseries_indexは無くても大丈夫
あえて書くなら
"series_index": ".+?(\\d{1,2})",
でいいと思う
タイトルに数字が入ってても巻数の数字がタイトルの末尾なら最短マッチの?消して
"title": "(.+)\\s*(\\d{1,2})",
でいい >>978
出来ました! ありがとうございます! もうちょっと勉強します ちょっと話に入りたいんだが、「KindleUnpack - The Plugin + ZIP mod」って、文字メインの活字本に対して役立つ?
画像で出力とか言われると、活字本の場合の文字データが全部消えてしまうように聞こえるんだが? ごめんZIP modの話か
そりゃ画像にしかならんのでは 文章が画像になるわけじゃなく、テキストは捨てられるだろう
挿絵とかの画像だけになるのでは 俺ちゃんとKindle1.24使ってる。
高画質画像が収まってる(?)resファイルをazwファイルの該当画像に差し替えたいと思ってるんだが、丁度いいツールある? 今度はスレの流れ読まないマンか?
すぐ上で話題に出てるツールがまさにそれなんだが >>985
俺ちゃんとKindle1.24使ってるお前は誰ちゃんなの? >>987
気づいてなかったわ
980と同一人物か 結局うちっておま環なんかいね
指摘もうちももないからよくわからん してません
今のところ「2系で動かない」っていうのは意図されていないと思っているので
作者さんもその意向なら諦めてそっちにしますが 同じ症状出て3.8にしてpycryptoじゃなくてpycryptodome入れたら直ったから レス数が1000を超えています。これ以上書き込みはできません。