国立国会図書館 絶版本などの無料ネット閲覧開始
「インターネット公開」はPDF保存できるけど「図書館・個人送信資料」はできないよ
来年1月に印刷できるようになればPDFに印刷できるかもしれないけど
UWSCという自動化ソフトを使うと次のような簡単なスクリプトでスクショを自動的に
保存できる
フルスクリーンにしてブラウザの全画面表示で本の位置合わせをしてからスクリプト
を実行すると
保存フォルダに001.bmp, 002.bmp, 003.bmp, ・・・と保存される
SaveDir = "D:\TEMP" //保存フォルダ
id = GETID("怪獣ウルトラ図鑑") //都度書き換え
CTRLWIN(id, ACTIVATE)
KBD(VK_F11)
SLEEP(5)
SAVEIMG(SaveDir + "001", id)
for n = 2 to 100 //都度ページ数書き換え
KBD(VK_RIGHT)
SLEEP(3.5)
SAVEIMG(SaveDir + REPLACE(FORMAT(n, 3), " ", "0"), id)
next
あとは一括処理ができるグラフィックソフトで形式変換とトリミングをすればpdfや
kindle本への加工の材料をつくれる コピペで投稿したら空行と空白が消えてしまったがスクリプトは
SaveDir = "D:\TEMP" //保存フォルダ
の行から
next
の行までです まちがいがあったのですみませんが訂正
・保存フォルダの最後に「\」が必要
・「怪獣ウルトラ図鑑 - カラー版」は実際にはコマ番号が93までなので最終ページは93でよい
ちなみにブラウザのタブは「怪獣ウルトラ図鑑 - カラー版 - 国立国会図書館デジタルコレクション」だが
GETIDには部分一致で書ける
---------------------------------------------------------
SaveDir = "D:\TEMP\" //保存フォルダ
id = GETID("怪獣ウルトラ図鑑") //都度書き換え
CTRLWIN(id, ACTIVATE)
KBD(VK_F11)
SLEEP(5)
SAVEIMG(SaveDir + "001", id)
for n = 2 to 93 //都度ページ数書き換え
KBD(VK_RIGHT)
SLEEP(3.5)
SAVEIMG(SaveDir + REPLACE(FORMAT(n, 3), " ", "0"), id)
next 国立国会図書館月報
https://www.ndl.go.jp/jp/publication/geppo/ の733号の
「大公開! 国立国会図書館での資料のデジタル化事業」に書かれていたが
外注で何百人もかけて手作業でデジタル化したんだね 自動的にページをめくる機械を使っている訳ではなかったのか
大変だわ 来年1月に1969〜1987年分の絶版が追加となるとのことでその候補を
https://www.ndl.go.jp/jp/news/fy2022/220531_01.html
の「約30万点」のリンクで見ることができる
そのうち日本の小説・物語はなんとたったの1冊(NDC分類の913)
外国の小説・物語はゼロ
演劇・映画の本は7冊だけ(NDC分類77*)
といった具合で
総じて文学系(NDC分類9**)、芸術系(NDC分類7**)がなおざりにされていて
30万点追加と言ってもかなりかたよっている 自分で図書館作ればいいじゃん
外国に比べて日本は私立の図書館が少なすぎる 日本だと私立図書館とか作っても節税とかにならないんで、環境が違い過ぎる。 DIGITAL HUMANITIES 2022
25-29 July 2022, Toshi Center Hotel, Tokyo, Japan and Online
https://dh2022.adho.org/ 国文学研究資料館が進めている、日本語の歴史的典籍の大規模データ蓄積の現在と、今後の事業として計画しているデータ駆動型人文学の創成へ向けた取り組みについて報告し、意見交換を行います。
だそうです >>104
そりゃ小人さんがしてくれるわけではないからな
スキャン品質は低そうだ 確かにデジコレは最高
Googlebooksみたいに折り込みを折ったままスキャナして済ます様な極悪な事もしていないし
ただ初期のスキャンは濃過ぎたり薄過ぎたり極端なのが残念
再スキャンしてくれないかなぁ トップページ右下の便利ツール→雑誌分類検索がいいよ ケイブンシャ
コロタン文庫
とかの電車運転DATAが掲載されているような本もあるのか? 国会図書館デジタルコレクションはpdf印刷出来るから同じだと良いね
自分は印刷せずにファイルで積んでるけど PDFにパスワード掛けてんだな
sourceforge.net/projects/portablepdfunlocker/
で簡単に解除できるけどね プログラムを起動してその上にPDFをドラッグ&ドロップするだけ
jpgの取り出しやOCRを掛けることができるようになる 雑誌の投書コーナーも見れちゃうから知り合いの名前検索したら住所わかっちゃった ダウンロードしたPDFから抽出したjpgについてXnViewwを使って本の外側の邪魔な黒い部分を
「一括変換」で「自動トリミング」できた
「背景色」を黒にして「公差」を300にしたらうまくいったが「公差」は試行錯誤が必要かも
PDFからのjpgの抽出とjpgからのPDFの作成には「画像梱包」というフリーソフトで十分 何か月か前にオンラインで読んだ本をPDFで保存しておこうとしたら
対象外になってしまっていた
これからは保存しておきたい本はすぐにやっておこうと思った 読取革命というOCRソフトを使ってみたが読み取り画像のdpiを指定しないと
うまく認識されないことがある様子
いっしょに定規がスキャンされているのでdpiを測ることができる
400dpiが多い感じだが不統一 >>121-123
コピーガードかかってる著作物のコピーガード取り払って複製するの犯罪なんだが… それらは2023年2月28日に公開されていたようだが
今年4月30日にもまた絶版本が多数追加されたそうだ
https://www.ndl.go.jp/jp/news/fy2024/240430_01.html ここで猫に餌あげるなって言ってる奴ら全員童貞で友達ゼロ説 >>138,139
どこへの誤爆か気になるじゃないかw