うわづら文庫

別名「責空文庫」

これは、青空文庫への敬意を表した命名です。青空文庫がテキストファイルを提供し、さまざまな環境で読めるのに対し、この「うわづら文庫」はテキストではなく画像で、すなわち上面だけのものだ、という意味です。 (別名の「責空文庫」(せめぞらぶんこ)というのは、「テキストはなくても、せめて画像でも読めれば」という意味で「責めて版・青空文庫」と。でも、副詞の「せめて」に「責」を当てるのに不快感を感じる人も居るでしょうから(「せめて」を「責而」と書くことも用例がありますが)、これは別名ということにしました。

「うわづらをblogで」うわづら@cocologdocune。こちらにもあります。
うわづらでも、ブロードバンド環境さえあれば、読むことだけは出来ます。印刷することも可能です(Windowsなら右クリックで、Macならボタン押しっぱなしで出てくるリストで「ファイルに保存」できます)。PDFファイルですが、画像抽出等も自由にしていますので、OCRにかけることも可能です。旧字体でも可能なOCRをお持ちの方はおためしください。
pdfではなく、マルチページのtifでの掲載になっているものもあります。マルチページのをご覧いただくには、WindwsXPに付属の「画像とFAXビューア」よりも、

http://www.vector.co.jp/soft/win95/art/se309561.html
http://download.fujixerox.co.jp/dcc/download/f450series/tiffv.html
あたりが、よろしいかと思います。もちろん、OCRソフトでも読めるはずです。

国会図書館の近代デジタルライブラリーが、繋ぎっぱなしでないと読めない、10枚ずつしか保存・印刷が出来ないのよりは、ましではないかと思っております。もちろん作品数等、足許にも及びませんが、ぼちぼちやってゆきたいと思います。

ここの母体である国語学論文集の画像ファイルと同様、「版権」にも鑑み、著者の死後50年だけではなく、刊行後50年(団体名義の著作権の公表後50年になぞらえました)を経過したものを載せます。(「辞書研究」にも書籍画像があります。)
底本の選択についても、学術的であるとか、貴重であるとか、そういうものとは無関係に「読めればよい」「手元にあってスキャンしやすい」という立場で選びます。底本を示すために最後に刊記の部分を入れておこうと思っておりますが、スキャン初期のものなどで忘れているものもあります。また、当初から抜き刷り・抽出製本・切り貼り帳等の形で入手しているものもあり、書誌情報が示せないものもあります。


明治文化全集
近世編 国文学 その他
私の場合、スキャンの当初の目的はOCRにかけてテキスト化することでしたが、ADF型のスキャナを手に入れてスキャンしていくうちに、書籍の減量に関心が向いて行きました。
書籍をバラしてスキャンして保存している、と人に言うと、OCRはちゃんと読んでくれないでしょう、と言われることがよくありました。それで、画像のまま保存しているのだ、というと納得してくれていました。OCRにかけてもあまり読んでくれないような古いものの場合には、画像で保存することに意味があるわけですが、著作権が切れているものの場合には、これをそのまま公開することも出来ると考えたのです。
構想自体は前からありました(参考文献「複製本と電子化」(岡島)PDF)。時は今、ブロードバンドの時代だからこそ実現に至ったのです。
おおまかな方針(のようなもの)
どこかでテキストが公開されていないものを優先する。ただし初出に近い画像や本文が随分異なるものについてはその限りではない。
だからといって、一旦画像で公開したものは、テキストが公開されたとしても、あえて引っ込めることはしない。

著作権者の認定について

岡島への連絡
こちらから
戻る