X



国立国会図書館 絶版本などの無料ネット閲覧開始
0100名無しさん@お腹いっぱい。
垢版 |
2022/06/24(金) 15:58:53.17ID:0u7IjSef
「インターネット公開」はPDF保存できるけど「図書館・個人送信資料」はできないよ
来年1月に印刷できるようになればPDFに印刷できるかもしれないけど

UWSCという自動化ソフトを使うと次のような簡単なスクリプトでスクショを自動的に
保存できる
フルスクリーンにしてブラウザの全画面表示で本の位置合わせをしてからスクリプト
を実行すると
保存フォルダに001.bmp, 002.bmp, 003.bmp, ・・・と保存される
SaveDir = "D:\TEMP" //保存フォルダ
id = GETID("怪獣ウルトラ図鑑") //都度書き換え
CTRLWIN(id, ACTIVATE)
KBD(VK_F11)
SLEEP(5)
SAVEIMG(SaveDir + "001", id)
for n = 2 to 100 //都度ページ数書き換え
KBD(VK_RIGHT)
SLEEP(3.5)
SAVEIMG(SaveDir + REPLACE(FORMAT(n, 3), " ", "0"), id)
next
あとは一括処理ができるグラフィックソフトで形式変換とトリミングをすればpdfや
kindle本への加工の材料をつくれる
0101名無しさん@お腹いっぱい。
垢版 |
2022/06/24(金) 16:05:38.62ID:0u7IjSef
コピペで投稿したら空行と空白が消えてしまったがスクリプトは
SaveDir = "D:\TEMP" //保存フォルダ
の行から
next
の行までです
0103名無しさん@お腹いっぱい。
垢版 |
2022/06/25(土) 09:41:45.83ID:xWQT2tQl
まちがいがあったのですみませんが訂正

・保存フォルダの最後に「\」が必要
・「怪獣ウルトラ図鑑 - カラー版」は実際にはコマ番号が93までなので最終ページは93でよい

ちなみにブラウザのタブは「怪獣ウルトラ図鑑 - カラー版 - 国立国会図書館デジタルコレクション」だが
GETIDには部分一致で書ける
---------------------------------------------------------
SaveDir = "D:\TEMP\" //保存フォルダ
id = GETID("怪獣ウルトラ図鑑") //都度書き換え
CTRLWIN(id, ACTIVATE)
KBD(VK_F11)
SLEEP(5)
SAVEIMG(SaveDir + "001", id)
for n = 2 to 93 //都度ページ数書き換え
KBD(VK_RIGHT)
SLEEP(3.5)
SAVEIMG(SaveDir + REPLACE(FORMAT(n, 3), " ", "0"), id)
next
0106名無しさん@お腹いっぱい。
垢版 |
2022/06/27(月) 09:08:08.92ID:lnMZM3G2
来年1月に1969〜1987年分の絶版が追加となるとのことでその候補を
https://www.ndl.go.jp/jp/news/fy2022/220531_01.html
の「約30万点」のリンクで見ることができる

そのうち日本の小説・物語はなんとたったの1冊(NDC分類の913)
外国の小説・物語はゼロ
演劇・映画の本は7冊だけ(NDC分類77*)
といった具合で
総じて文学系(NDC分類9**)、芸術系(NDC分類7**)がなおざりにされていて
30万点追加と言ってもかなりかたよっている
0111名無しさん@お腹いっぱい。
垢版 |
2022/07/24(日) 16:52:56.70ID:Qiy7wO0u
国文学研究資料館が進めている、日本語の歴史的典籍の大規模データ蓄積の現在と、今後の事業として計画しているデータ駆動型人文学の創成へ向けた取り組みについて報告し、意見交換を行います。


だそうです
0114名無しさん@お腹いっぱい。
垢版 |
2022/09/01(木) 22:49:43.73ID:4WsKze96
確かにデジコレは最高
Googlebooksみたいに折り込みを折ったままスキャナして済ます様な極悪な事もしていないし
ただ初期のスキャンは濃過ぎたり薄過ぎたり極端なのが残念
再スキャンしてくれないかなぁ
0115名無しさん@お腹いっぱい。
垢版 |
2022/09/02(金) 12:59:37.40ID:1k1YlaMu
何か面白い出物はありましたか?
0119名無しさん@お腹いっぱい。
垢版 |
2023/01/08(日) 15:35:42.57ID:kSGr30yz
国会図書館デジタルコレクションはpdf印刷出来るから同じだと良いね
自分は印刷せずにファイルで積んでるけど
0123名無しさん@お腹いっぱい。
垢版 |
2023/01/20(金) 12:36:17.53ID:z/TvRZuL
プログラムを起動してその上にPDFをドラッグ&ドロップするだけ

jpgの取り出しやOCRを掛けることができるようになる
0125名無しさん@お腹いっぱい。
垢版 |
2023/01/20(金) 19:48:35.19ID:LUf9YyUt
雑誌の投書コーナーも見れちゃうから知り合いの名前検索したら住所わかっちゃった
0126名無しさん@お腹いっぱい。
垢版 |
2023/01/20(金) 21:57:24.20ID:z/TvRZuL
ダウンロードしたPDFから抽出したjpgについてXnViewwを使って本の外側の邪魔な黒い部分を
「一括変換」で「自動トリミング」できた
「背景色」を黒にして「公差」を300にしたらうまくいったが「公差」は試行錯誤が必要かも

PDFからのjpgの抽出とjpgからのPDFの作成には「画像梱包」というフリーソフトで十分
0127名無しさん@お腹いっぱい。
垢版 |
2023/01/21(土) 23:40:07.78ID:Ert9UGN5
何か月か前にオンラインで読んだ本をPDFで保存しておこうとしたら
対象外になってしまっていた
これからは保存しておきたい本はすぐにやっておこうと思った
0128名無しさん@お腹いっぱい。
垢版 |
2023/01/28(土) 17:27:18.09ID:2dF1PZnM
読取革命というOCRソフトを使ってみたが読み取り画像のdpiを指定しないと
うまく認識されないことがある様子
いっしょに定規がスキャンされているのでdpiを測ることができる
400dpiが多い感じだが不統一
0130名無しさん@お腹いっぱい。
垢版 |
2023/06/24(土) 09:59:37.21ID:9CnkaUKp
中学生警察乙
0136名無しさん@お腹いっぱい。
垢版 |
2024/05/07(火) 21:40:51.76ID:9k3bBWx1
なんだインプレスが誤報かよ。
レスを投稿する


ニューススポーツなんでも実況