人文科学とデータベース

浜渦 辰二
静岡大学人文学部社会学科
〒422-8005静岡県静岡市大谷836
E-mail:jsshama@hss.shizuoka.ac.jp

(注記: これは、静岡大学学内特定研究『広領域分野における学術・教育資料の情報体系分析と情報資源化に関する基礎的研究』研究成果報告書[1998年3月31日発行]に掲載されたものです。)

抄録 -- 小論は、人文科学におけるデータベースの現状を報告し、今後の課題を提示するものである。初めに前提として、人文科学におけるコンピュータ利用の現状について簡単にまとめた後、続いて、人文科学におけるデータベースの基礎と現在について、筆者が専門としている哲学の分野におけるデータベースの現在について、筆者が4年前から関わっているフッサール・データベースの現状について、インターネットによるデータベースの現在について、それぞれ報告し、最後に、今後の課題を述べることにしたい。

Humanities and Database

Shiji Hamauzu
Department of Sociology, Faculty of Humanities and Social Sciences, Shizuoka University
Ohya 836, Shizuoka-shi, 422-8005 JAPAN
E-mail:jsshama@hss.shizuoka.ac.jp

ABSTRACT -- The aim of this paper is to report about the contemporary situations of Databases in Humanities. At first, as presuppositions, giving a short summary about the usage of computers in Humanities, it will report about elementary knowledges and the situation of Databases in Humanities and in Philosophy, in which the reporter specializes, and the situation of Husserl-Database, with which he has been engaged since 4 years ago, and finally state some opinions about further problems.

1.研究の目的と概要

 現在、学問の様々な分野において、もはや文系・理系という枠を取り払っていかないとどうしようもない、という状況になりつつある。例えば、筆者自身強い関心を持っている生命倫理(バイオエシックス)や環境倫理の問題なども、単に医者、化学者、生物学者に任せておくわけには行かない、社会学者、文化人類学者、法学者、宗教学者、倫理学者、哲学者をも巻き込んだ文系・理系の学際的な研究が要求されている分野である。こうした状況であるにもかかわらず、文系の文化と理系の文化の間には、「お互いの無理解、ときには、敵意と嫌悪の溝がへだてている。だが、もっとも大きなことは、お互いに理解しようとしないことだ」と、C・P・スノー[21]が「二つの文化」と呼んで嘆いた事態が簡単にはなくなって行かない。そんな状況のなかで、「人文科学とデータベース」というテーマに関わる研究分野は、文系・理系融合の具体的な作業が実績を積み上げつつある。小論は、このような動向を、「広領域分野における学術・教育資料の情報体系分析と情報資源化に関する基礎的研究」という私たちの特定研究において筆者が担当したテーマとして報告するものである。以下、初めに前提として、人文科学におけるコンピュータ利用の現状について簡単にまとめた後、次に、人文科学におけるデータベースの基礎および現在について、筆者が専門としている哲学の分野におけるデータベースの現在について、筆者が4年前から関わっているフッサール・データベースの現状について、インターネットによるデータベースの現在について、それぞれ報告し、最後に、今後の課題を述べることにしたい。
          

2.人文科学におけるコンピュータ利用の現状

 コンピュータはもはや「計算する(compute) 」だけのものではなくなってきた。むしろ、言うなれば、ラテン語の語源的な意味(英語のcompute はラテン語のcomputare に由来する)において、いろいろな情報(データ)を「ともに(com = together)」まとめて「考え合わせる/考察する/思考する(putare = estimate, consider, judge, suppose, imagine, think)」ための道具となって来ている。言わば、バラバラのデータに繋がりを与えて「かたち」を与える(in-form) ことによって、それらをまさに情報(information) たらしめる道具となって来ているのである。もちろん、ハードとしては、0/1の二進法の数字で表されるような計算機能を行っているに過ぎないが、ソフトとしては文字・画像・音声などのアナログ情報がデジタル化(数値化)されることによって、ハードの機能に載せられるようになった。こうして、文字・画像・音声をコンピュータで扱うことができるようになったことは、人文科学におけるコンピュータ利用の道を大きく開いたと言えよう。同じ文系のなかでも社会科学系の学問には、数値を使って表計算をしたり、統計処理をしたりという分野もある。ここでは、計算するというコンピュータが本来得意な機能が利用されているわけだが、それはそれで、表や統計を分析し、読み取るという仕方での「思考」の補助手段としてコンピュータが多いに役立っている(1) 。しかし、こういう分野は筆者の所轄領野を越えるので、ここでは省略し、文系のなかでも人文科学系の学問分野でのコンピュータ利用、すなわち、テキスト(文書)の処理を中心としたコンピュータ利用に考察を限定したい。
 人文科学におけるコンピュータ利用は、初めは、もっぱらワープロ(word processor=文書作成機)としてであった。欧米では、タイプライターが18世紀初めに考案され、19世紀後半には商品化された(2) 。日本では、20世紀になってから(大正時代)、和文タイプライターが発明された。その後、この20~30年ほどで、欧米では、タイプライターにメモリとモニターがつけられたものから、パソコン(personal computer) の大衆化へと進んでいった。日本でも、半角(1バイト)文字のカタカナだけ使えるコンピュータと和文タイプライターとの併存する状況のなかで、かな漢字入力変換システムの開発により、日本語ワープロが登場した。それは初め「清書のための機械」であった、そして、それはそれなりに意味があったが、保存・整理・検索などの機能の充実とともに、次第に「思考の道具」[7] となってきた。ちょうど筆者の少し上の世代がワープロを使い初めた時、彼らはまず原稿用紙で原稿を書き上げた後、清書のためにワープロを使っていたが、筆者の世代あたりから、ワープロの使い方がかわってきた。もはや原稿用紙を使わず、最初からワープロの画面に向かい、直接原稿を入力する、すなわち、画面に向かって思考するようになってきたのである。ワープロが「清書のための道具」から「思考のための道具」へと変わってくる時代であった。
 人文科学においてコンピュータが使われ始めた時、最初はまず、このようにワープロとしてであり、ワープロソフトを載せてコンピュータを使う、という使い方であった。そこでは、どうせワープロとしてしか使わないのだから、コンピュータを使うまでもなく、ワープロ専用機でも十分であったが、やがて(今から15年ほど前)ワープロ専用機からパソコンへと乗り換える動きが出てきた。もちろん、現在においても、もし、論文(あるいはレポート)を1~2本作成するためだけであれば、ワープロ専用機でも充分である(実際、筆者自身も簡単な文章を書くくらいであれば、ワープロ専用機を愛用している)。論文(レポート)を書くだけのためにパソコンを使うのは馬鹿らしい(高価だし、面倒だし、時間もかかる)。ところが、例えば、論文を10本くらいまとめて、あちこち訂正・加筆を繰り返しながら、一冊の本を書こうとしたら、ワープロでは難しい(面倒な)ことになるが、パソコンを使えば、同時に10個のファイルを開き、切り換えながら編集するのは簡単なことである(3) 。また、パソコンであれば、ワープロとして使うことができるだけでなく、表計算ソフトやデータベースソフトなどを載せて使うこともできる(最近ではワープロ専用機でもそれなりに表計算やデータベースの機能をもっているが、専用のソフトに較べれば、機能は劣る)。ワープロ的な機能に限定しても、文書作成だけでなく、検索・分類・概観などの高度な作業をしたいとなると、パソコンが役に立ってくる。簡単な検索ならワープロでもできるが、後に述べるような複雑な条件をつけた検索(検索結果を頁数と行数で表示、検索された語句の前後数行ずつをすべて表示、検索結果の分類、等々)はワープロでは不可能である。また、画像や音声もパソコンでは処理可能となったが、これも、ワープロでは不可能な作業である(一部最新の機種では可能となっているものもあるが)。文書・画像・音声を含むデータベースの作成・利用には、パソコンが必要となってくるのである(4) 。
 最後に、人文科学におけるコンピュータ利用として付け加えなければならないのは、コンピュータのスタンドアローンでの利用からネットワークでの利用への変化という新しい事態である。10年以上前から、電話回線を使ったパソコン通信はあった。それは、1台のパソコンまたはワープロ(「パソコン通信」と呼ばれるが、パソコンでなくともワープロでもできることであった)のなかだけで作業を行う閉鎖的環境(もちろん、フロッピーなどの媒体によってこれを越えていく手段はあったが)を開放し、パソコン(ワープロ)とパソコン(ワープロ)を繋ぐ開放的作業空間を実現することになった。文書を印刷して活字にしてから公表するという流れが変わり、印刷しないままに画面に現れている文書が、通信によって発信され受信される(副次的にのみ印刷される)という情報の新しい流れが登場した。さらに、5年ほど前から爆発的にしかも世界的な規模で普及してきたインターネットは、パソコン通信とはまったく異なるネットワーク環境をつくり出した。まず、各国国別のホストを通じて行われていたパソコン通信と違い、そのようなホストがインターネットにはないため、一挙にインターナショナルな環境が実現した。しかも、電話回線を使わないため(家庭で使う時には電話回線を使うことになるが)、外国との通信もずっと早くなった。そして、文字データだけでなく、画像データ・音声データも簡単に送受信することができるようになった。文字・画像・音声という情報が世界的な規模でこれほど容易に飛び交うことを可能にしたのは、パソコンとネットワークであるが、このことは人文科学にとっても大きな意味をもってくるようになったのである[2][23][42](5)。

3.人文科学におけるデータベースの基礎

 さて、以上のような人文科学におけるコンピュータ利用のうち、ここでは特にデータベースに絞って考察したい。データベースと言っても、何も難しいことではない。ワープロ(以下、ワープロ専用機とパソコン上でのワープロソフトを併せてこう呼ぶ。また、ここで述べることはパソコン上のエディタでもできる作業なので、ここではこれも含めてよい)で作成したテキストもデータ(テキスト・データ)であり、そうしたデータが集積され、それなりに管理可能になっていれば、それも広い意味ではデータベースと呼ぶことができる。したがって、例えば、毎日毎日日記をワープロで打ち込んでいき、10年間くらいの蓄積が外部記憶装置(フロッピーディスクであれ、ハードディスクであれ、MOであれ)に保存されており、検索機能を使って、1987年1月1日には何をしたかとか、H先生の歓迎会を箱根でやったのはいつのことで、泊まった宿はどこだったかとか、思い出せないことを簡単に検索できるようになっていれば、これは立派な自分史のデータベース(テキスト・データベース、フルテキスト・データベース、全文データベース)となる[7] 。
 表計算ソフトを使ってデータベースを作ることもできる。表計算だからといって、数値データだけしか使えないわけではない。例えば、文献一覧表のように、著者名、書名、出版社、発行年、価格といった、表にしやすいデータ(数値であれ、文字であれ)であれば、ワープロを使うより表計算の方が、入力しやすいし、ソート(並べ替え)や抽出といった操作も可能であるし、もちろん、割引金額や合計金額を計算することも簡単にできる。一つのフィールドに入れられるテキストの量に融通のきくことも普通になってきており、「ワープロ+表計算」といった利用ができる良さもある。前述の自分史なども、入力データを長いテキストにするのではなく、短いテキストのいくつかの項目(例えば、日付、天気、健康状態、会った人、出掛けた所、読んだ本、気に入った一節、等)からなる表として表計算ソフト上に作成すれば、検索のみならず、ソート・抽出という利用ができるという点で、これは充分にデータベースとして利用できる。
 データベース作成・利用専用に開発されたデータベースソフトもある。これは、言わばかつての京大型カード[4] によるデータベースがコンピュータ上で動くようになったものと言える。いくつかの既成のフォーマットもあるが、自由にフォーマットを作ることもでき、表計算ソフトよりさらにテキストの量での融通がきく。また、表計算ソフトのような単純な縦横の表にすることもできるが、それだけでなく、一つのデータベースをさまざまな形で出力することもできる。検索・抽出という機能も表計算ソフトより充実している。ソフトによっては、様々なデータを関連づけたり、リンクを作ったりすることもできる。ここまで来れば、個人で作るデータでも、本格的なデータベースとなる[49]。
 データベースソフトのなかにはリンク機能をもち、データベースをいわゆるハイパーテキストとして作成することができるものもある。このリンク機能は、さまざまな網目状の検索を可能にする機能と言える。また、このようなソフトでは、テキストだけでなく、画像や音声をもリンク先に使うことができる。このようなソフトを使えば、例えば、或る日本語のテキストとその英訳およびそのフランス語訳、さらに関連する画像をさまざまにリンクさせることができる[29]。近年は、データベースのみならず、電子本をこのようなソフトで作ることも普及してきている(6) 。後に触れるHTMLもこの機能をもっており、HTMLヴューアーであるWWWブラウザをそのままデータベース用のソフトとして使うこともできる。しかし、問題なのは、このようなリンク機能だけでは研究者のデータベース利用としては十分ではないということである(これについては、後に論じることにしよう)。
 ここで、データベースとは何か、をまとめておこう[41]。データベース(ここでは特にコンピュータを利用したデータベースとして考えているが)とは、機械可読(machine-readable)=ディジタル化された多量のデータが、検索・抽出・並び替え等の運営システム(DBMS: Data Base Managing System )によって利用できるようになっているものである。したがって、前述のように、ワープロで作成し利用するデータベースも検索機能を備えている限りデータベースと呼べるが、ワープロに備わっている簡単な検索機能だけでは運営システムとしては不十分と言わざるを得ない。多量のデータが蓄積されているというだけではデータベースとは呼べず、それを充分に活用できるだけの運営システムを備えていて初めてデータベースと呼べる、ということである。もっとさまざまな機能をもつ表計算ソフト、さらにデータベースソフトであれば、それなりの運営システムを備えている、ということができる(ここまではまだ自分で作成し、スタンドアローンで利用するデータベースについてしか述べていないが、後に述べるネットワークを利用したデータベースについても運営システムが重要になってくる)。
 また、データベースに蓄積されたデータの種類としては、一次情報と二次情報とがある[47]。一次情報には、テキストデータ、数値データ、画像データ、音声データなどがあるが、二次情報というのは、これら一次情報についての情報である。例えば、或る本のなかのテキストそのものは一次情報であるが、この本についての書誌的情報は二次情報である。この一次情報と二次情報の違いには、後に述べる著作権の問題も絡んでくるが、今の脈絡で言えば、運営システムのあり方も一次情報と二次情報によって変わってくる。具体的には、書誌情報を集めたデータベース(表形式のデータベース)と本文テキストを集めたデータベース(テキスト・データベース)では、データの検索・抽出・並び替えという運営のあり方が変わってくることは容易に想像できよう。
 データの種類を述べたついでに、以下本論の中心的主題となるテキスト・データについて、さらにどんな種類があるか、述べておこう。もっとも単純なものは、プレーン・テキスト、あるいは、MS-DOS標準テキストファイルと呼ばれるものである。これは、特殊文字・罫線・飾り文字・外字などのないテキストで、表現力はそがれてしまった裸のテキストであるが、いまだにDOS/V、マック、98、Unixといったコンピュータの種類やメーカーごとに異なるワープロ専用機の種類の違い(特にそのなかでの文字コードと改行コードの違い)が標準化されていない状況のなかで、相互にテキストを交換・利用し合うためには必要となってくるテキスト形式である。次に、いま述べたコンピュータやワープロの機種あるいはソフトごとに異なる仕方で加工された(MS-DOS標準テキストファイルでは落とされてしまうものが付いた)テキストがある(例えば、ワープロソフト Word や一太郎で作成された文書)。これは、それぞれの表現力をもったものであるが、残念ながら、それぞれの機種あるいはソフトの内部でしか利用することができず(つまり、汎用性に欠けており)、この機種あるいはソフトがもつ機能においてしか利用できない。データベース作成ソフトや、電子本作成ソフト(例えば、「エクスパンドブック」なども、基本的には同じ性格のものと言えよう。次に、HTML(Hyper Text Markup Language)のテキストがある。これは、本文テキストにさまざまなコマンドを示すタグが入ったテキストで、加工の点においては第二の種類と大きな変わりがあるわけではないが、インターネットのWWWで使われることによって、一挙に標準化したと言ってよい。しかも、このテキストそのものはMS-DOS標準テキストファイルであるから、上記のような機種の違いに関わりなく利用できることが大きな利点である[10]。最後に、SGML(Standard Generalized Markup Language)のテキストがある。HTMLはSGMLの一部を単純化したものとも言われるが、SGMLは、HTMLがもっているタグの機能に加えて、テキストの構造を示すタグも含むような言語である[6][45] 。SGMLは、これまで出版関係者を中心に使われてきたが、これからは電子出版からインターネットまで、さまざまなところで標準化されていく可能性がある(7) 。以上のような四つの種類のテキストのうち、私たち研究者がデータベースを制作・運用していくにあたって、汎用性の点から、また、検索等の機能の点から、どのテキストを使うのがもっともよいか、を考えなければならない。

4.人文科学におけるデータベースの現在

 さて、これまではデータベースを自分で作成し利用することについて述べてきたが、データベースというものは蓄積されたデータが多ければ多いほど利用価値は高くなる。先に述べた自分史データベースのようなものであれば自分で作成しないとしようがないものだが、公共性をもったデータベースであれば、必ずしも自分一人で作成する必要はないし、自分一人で作成できるものには限度があり、データを多くして利用価値を高めるためには、むしろできるだけ共同作業で作成した方がいいことは言うまでもない。あるいは、自分自身でデータベースを作成しないでも(作成に関わらなくても)、他人ないし特定の組織や機関などが作成し、提供ないし販売しているデータベースがあれば、それを利用しない手はない。この既成のデータベースの利用方法については、次節で(哲学におけるデータベースに限定して)述べることにして、データベースを共同制作するということについて簡単に述べておこう。
 共同制作するにあたっては、一方では自分一人で作成することの延長として考えられることと、他方では単純な延長ではないものとして考えねばならないこととがある。ここでは後者の点についてのみ、いくつかの問題点を記しておくことにしよう。まず、汎用性をどうやって確保するか、が問題となる。すなわち、機種やソフトの違いに依存するデータベースあるいは運用システムは閉鎖的なものになってしまい、そうした違いを越えた汎用性をもちえなくなる。共同制作そして共同利用するにあたって、全員が同じ機種ないし同じソフトを使わねばならないというのは、現在のコンピュータ環境のなかでは決していい状況とは言えない。これは、先の四種類のテキストのうちどれを使うのかという問題とも関連して、どうやって汎用性を確保するかという問題となる(8) 。第二に、共同性をどうやって確保するか、が問題となる。共同制作・共同利用するにあたって、スタンドアローンのパソコンでフロッピー・MO・CD-ROMなどの外部媒体でデータの遣り取りをするよりも、これからはネットワーク上のパソコンでインターネットを利用することがますます必要になってくるであろう。となると、インターネット上で動く運用システムも必要になってくる。第三に、公開性をどうやって確保するか、が問題となる。このようにインターネットを利用することになると問題になるのは、共同制作に関わったグループを越えてどこまで情報を公開できるのか、という点である。特に、二次情報でなく一次情報となると著作権の問題が絡んでくるので、それをどうクリアするかが問題となる。これらについては、後に、筆者が直接関わったデータベースを例としてもう少し述べることにしよう。
 さて、日本における学術データベースの現状を把握するには、1995年度から4年間の計画で進行している「人文科学とコンピュータ -- コンピュータ支援による人文科学研究の推進 -- 」(文部省科学研究費補助金「重点領域」)[16][17][18][19][20][48]について触れておかねばならない。そこでは、現在、日本におけるこの分野の最大のプロジェクトとして、人文系の研究者と理工系の研究者の共同作業が続けられている。このプロジェクトは、「データベース」班、「テキスト処理」班、「イメージ処理」班、「数量的分析」班という四つの計画研究班と、これらを統括する「総括班」から成り、専門分野も「哲学、宗教学、倫理学、思想史、美術、音楽、心理学、社会学、人類学、民族学、民俗学、日本史、東洋史、西洋史、考古学、国語学、等々」といった人文社会科学の分野をほとんど網羅しており、「人文科学とコンピュータ」の問題を包括的に扱っている、と言える。したがって、筆者としてもこのプロジェクトから学ぶことは多い。
 しかし、「人文科学におけるデータベース」という課題に限定して言えば、これに先立つ10年前の1985年に始まったプロジェクトが、すでに1988年3月に『人文科学におけるテキスト・データベースの現状』[6] として報告が行われていた。それは、初め「哲学者のためのテキスト・データベース研究会」として1985年5月から始まった研究会が「哲学者のための」という形容句を外して、「テキスト・データベース研究会」として続けられた研究活動の成果でもあった(9) 。この名称の変更にも現れているように、このプロジェクトは、最初は哲学研究者の集まりであったものが、次第にその枠を取り払い、ドイツ文学、東洋学、国文学、英語英文学、等の分野の研究者も参加するようになったものだった。しかし、その枠が取り払われたとはいえ、いまだ、現在の重点領域「人文科学とコンピュータ」が謳っている分野の広がりから言えば、狭い範囲の研究者の集まりであったことは否めない。
 また、この10年前のプロジェクトはその表題にも表れているように、あくまで「テキスト・データベース」を中心とする企画であった。つまり、前述のように、現在の重点領域「人文科学とコンピュータ」が「データベース」「テキスト処理」「イメージ処理」「数量的分析」という四つの計画研究分野をもっているのに対し、10年前のプロジェクト「人文科学におけるテキスト・データベースの現状」は専ら「テキスト・データベース」に関する研究であり、一部「数量的分析」を含んでいたものの、「イメージ処理」はまったく含んでいなかった(また、当時のパソコン環境では個々の研究者が簡単にイメージ処理をできるようなものではなかった)。この点でも、現在のプロジェクト「人文科学とコンピュータ」は、10年前のプロジェクト「人文科学におけるテキスト・データベースの現状」に比べると、はるかに包括的なコンピュータ処理の可能性について扱い、またそれによって、テキストばかりでなく表・図・イメージ(画像)も扱わねばならない学問分野(例えば、考古学や美術史)の研究者達の参加が可能になり、また必要となったと言える。
 このように、現在の重点領域「人文科学とコンピュータ」は10年前の企画に比べ、はるかに包括的なものとなったと言えるが、それでも筆者には物足りなく思うところがある。なるほど、10年前には参加していなかった国文学、考古学、日本史、美術史、教育学、文化人類学、英語学、言語学、心理学、等々の研究者が多く参加しており、広範囲のプロジェクトになっていることは確かだが、哲学研究者である筆者としては、哲学・倫理学・思想史という分野が「広範囲」という謳い文句の中にも入っているのに、実際には研究班構成員のなかにも、課題研究の採択課題のなかにも、哲学研究者が一人も見当たらないことは残念である。何より惜しいのは、前述の10年前の総合研究「人文科学におけるテキスト・データベースの現状」に参加していたメンバーが一人も参加していないということである。彼らの研究成果が現在の「人文科学とコンピュータ」に十分に継承されているのであれば、あるいは、彼らの研究成果はもう過去のものとして乗り越えられているというのであれば、必ずしも同じメンバーが参加している必要はないかも知れない。しかし、10年前の彼らの遺産が十分に継承されているのか、あるいは、それはもう過去のものとなってしまったのか、筆者にはいま一つ疑問に思われる。
 そこで、次に、筆者が専門としている哲学の分野、すなわち今回の重点領域「人文科学とコンピュータ」には汲み上げられていない哲学の分野におけるデータベースの現在を報告して、「人文科学とコンピュータ」の欠落部を補うための作業とすることにしたい。

5.哲学におけるデータベースの現在

 さきに、10年前の企画が「人文科学におけるテキスト・データベースの現状」という題であったことを述べたが、ここで、哲学の分野に話を限定して、データベースにはどのような種類があるか、そのなかで「テキスト・データベース」とは何であるのか、について述べておこう。筆者が携わっている哲学の分野でも、テキスト処理にコンピュータを利用しようという動きは15年ほど前から始まり、その成果が前述の「人文科学におけるテキスト・データベースの現状」[6] として結実したわけだが、その後、この動きは衰えてしまったわけではなく、機械可読な電子テキストとなった哲学文献をさまざまなかたちで研究に利用しようとする動きはますます広がっていっている。そのなかで、データベースもさまざまなものが現れ、利用されてきている[9][11] 。哲学におけるデータベースには、四種類のものが考えられる。第一に、哲学者のテキストそのもの(一次文献の一次情報)のデータベース(テキスト・データベース)、第二に、哲学者のテキストについての書誌的情報(一次文献の二次情報)のデータベース、第三に、哲学者のテキストについて論じたテキスト(二次文献の一次情報)のデータベース(これも、テキスト・データベースと呼べる)、第四に、哲学者のテキストについて論じたテキストについての書誌的情報(二次文献の二次情報)のデータベース、である。
 次に、いま述べたデータベースの種類と関連づけて、データベースの利用方法について述べておこう。つまり、さきほど自分で制作するデータベース、共同制作するデータベースについて述べまたが、ここで、他人ないし特定の組織や機関などが作成し、提供ないし販売しているデータベースについて述べておきたい。これら既成のデータベースの利用方法については、次の四つの方法が考えられる。
 第一に、哲学文献のテキスト・データ(電子テキスト)については、出版社等によって市販されているCD-ROM(ないしフロッピー・ディスク)を購入する方法がある。これらはたいてい、プレインテキストだけでなく、Folio VIEWS や Word Cruncherといった検索専用ソフトが付いていて、さまざまな利用が可能になっている(10)。第二に、パソコン通信(あるいは、インターネットのTelnet)で入手できる学術情報センター(NACSIS)などの学術データベースがあり[47]、また、NIFTYやPC-VANなどの商業データベースにも学術的価値のあるものもある(11)。例えば、WWWにおける新聞社のホームページの開設にもかかわらず、過去の新聞記事からの検察をする新聞記事情報はいまだにここから入手することになるが、これは、場合によっては、哲学の分野においても、テキスト・データとして役立つものである。第三に、インターネットのWWW、FTP、Gopher、Telnetなどで入手する。各大学図書館などから書誌情報といった二次情報を得られるだけでなく、一次情報であるテキスト・データ(電子テキスト)もここから入手できる(著作権の保護機関の過ぎた古典的なテキストが公開されている)。これらは、プレインテキストのみであるのが普通(場合によっては、HTMLテキスト、RFTテキスト、SGMLテキストもある)で、無料で入手できる(インターネットに必要な費用は別にして)が、(たいていは)校訂が信頼できるとは限らない言わば試作版であり、その点で市販されているCD-ROM版の方が信頼性は高い。CD-ROM版とインターネット版と両方あるようなら、研究者としては信頼性の高いのCD-ROM版を使うべきであることは確かであるが、インターネット版しかない場合、たとえそれが「試作版」とはいえ、ゼロから自分で作ることを思えば、はるかに手間を省くことはできる。第四に、世界の各所で研究者達によって制作されているデータベース(一次文献および二次文献の一次情報のテキスト・データもあれば、一次文献および二次文献の二次情報の書誌的データもある)がある。このなかには、日本の研究者達によって構築されたものとして、デカルト、ヘーゲル、シェリングなどのテキスト・データベースがあり、研究者の間で利用されて来ている[9] (因みに、これらは、前述の10年前の総合研究「人文科学におけるテキスト・データベースの現状」に参加していたメンバー達が制作したものである)。ここでは、著作権問題をどうクリアするかが、重要な問題となる。なかには、研究者のあいだでのみの利用に限定されているという、言わば半公開(限定された公開)というかたちを取っているのも、そこのあたりの事情から来たものである。

6.フッサール・データベースの現在

 上述のような、哲学においても電子テキストのデータベースの利用が普及していくなかで、筆者が関わり続けてきた現象学的哲学の研究はずっと遅れをとっていた。そういう状況のなかで、4年前から筆者を代表とするフッサール・データベース作成委員会(12)が活動を始め、フッサール・データベースの構築を開始し、いまだ作業の途中ながら、これまでに完成したものから順に、1995年4月からインターネットを利用して(初めは、FTPのみを使って、翌年から更に、アクセスを容易にするためWWWも使って)公開してきた。これは、現象学的哲学の研究における欠落の一端を埋めるとともに、先行する哲学関係のデータベースよりも一層、いま最先端の電子メディアとなったインターネットに重心を置くものとして、このような動向を一歩進めるものとなった[34][35][36]。このフッサール・データベースは、すでに3年目の実績を持ち、世界各国からのアクセスを受け、国際的な現象学的哲学の研究に、基礎的な作業において大いに貢献してきている[39][40]。そこで、この筆者が関わってきたフッサール・データベースについて、以下、簡単に紹介することにしよう。
 フッサールに端を発する現象学的哲学の研究は、国際的には、Husserliana(『フッサール全集』、1950年より、現在30巻、補巻2巻)の刊行を初めとして、Phenomenologica(『現象学叢書』、1958年より、現在130 巻)のほか、いくつかの研究誌(Analecta Husserliana, Phaenomenologische Forschungen, Husserl Studies, etc.) において、多くの研究が発表されてきている。この分野での日本における研究は、『講座・現象学』(弘文堂、1980年、全4巻)、『現象学年報』(日本現象学編、1984年より、現在10巻)、『Phaenomenologica』シリーズ(世界書院、1986年より、現在16巻)、『現象学事典』(弘文堂、1994年)等々と、近年多くの蓄積を重ねており、また、日本人研究者の国際的な活躍も目ざましく、前述のような海外の研究誌に論文が掲載されたり、日米現象学の成果が刊行されたり、ドイツで企画された研究叢書シリーズの編集に加わる等、国際的にも高い水準で行われるようになっている。
 このような状況のなかで、日本現象学、日本現象学社会科学会、現象学解釈学研究会の会員を中心とする現象学研究者の間では、フッサールを初めとする現象学的哲学者のテキストをデータベース化する要求が高まってきた。なかでも、フッサールについては、『フッサール全集』に収録されているものの多くが生前未公刊の草稿であり、そのうちには、講義草稿のようにフッサール自身によって或る程度秩序づけられたもののほかに、編者によってそれなりに秩序づけられているとはいえ、本来はまったく断片的な作業草稿を集めたものもあり、さらに加えて、この『フッサール全集』には人名索引はあるが語句索引がないといった理由から、とりわけフッサールのテキストについてデータベース化の必要性が痛切に感じられてきた。ここに1994年度、筆者を代表としてフッサール・データベース作成委員会の名のもとに集まった研究者は、将来的には『フッサール全集』全巻のテキスト・データベース化を目標にして、作業を開始した。幸い、この計画は、平成6(1994)年度文部省科学研究費研究成果公開促進費(データベース)の援助を受け、その後、毎年継続を重ねて、この平成9(1997)年度にまで至っている(今年度で4年目となっている)。これまで作業を蓄積してきたのは、1994年度に5巻分(第11、13~15、16巻)、1995年度に6巻分(第21~21、25、27、29巻)、1996年度に6巻分(第1~5、10巻)であり、それぞれ各年度末にはインターネットを使った公開に至っている。そして、現在1997年度もまた6巻分(第6~8、18、19/1、19/2)について作業を行っており、1998年4月にはこれらも公開の予定であり、そこで合計23巻分(全体の3分の2)の作業を完成させることになる。
 ただし、公開している内容について、説明しておかねばならない。筆者たちは初め、『フッサール全集』を定本として、スキャナーを使って制作したテキスト・データベースをそのまま公開(一般公開とまで行かなくとも、せめて特定の研究者のあいだでの限定された公開)を目指していたが、これをそのまま公開することには問題が生じてきた。筆者たちは、前述の先行する哲学関係のデータベースでの経験を仄聞するところにしたがって(「テキスト・データベースがあると相乗効果で本も売れる」と寛容な態度を示す出版社もあるとのこと)、フッサールのテキスト・データベースを公開することにも、筆者たちが定本として使った『フッサール全集』の編集出版版権をもつオランダのネイホフ社(MARTINUS NIJHOFF、現在は、KLUWER ACADEMIC PUBLISHERS)が寛容に許可を与えてくれるものとばかり思っていた。ところが、筆者たちの問い合わせに対して、同出版社の返事は、「CD-ROM化する計画があるので、公開を許可することはできない」というものであった。その後、筆者を代表とするフッサール・データベース作成委員会は同出版社とずっと連絡をとり、交渉を続けており、同出版社の『フッサール全集』CD-ROM化の企画に筆者たちも関わることになるかも知れない、という状況である。筆者たちの制作したテキスト・データベースをそのまま公開することにはならなかったにしても、筆者たちの活動が出版社の重い腰を上げさせて、CD-ROM化の計画を早めることになったとすれば、それなりの成果はあったと言えよう。しかしながら、筆者たちとしては、テキスト・データベースをそのまま生のかたちで公開することは断念するとして、その代わりに、筆者たちが厳選した(とりあえず)400 個の重要語句(来年度からは、これを倍増する作業をしている)について検索した結果を「フッサール・データベース」として公開することにした。それこそが、1995年4月からまずはインターネットのFTPを使って公開を始め、翌年4月からはインターネットのWWWを使ってアクセスを容易にして公開し続けてきている「フッサール・データベース」なのである(13)。
 検索とは言っても、ワープロ・ソフトのもつような単純な検索機能では物足りないことは言うまでもない。そこで浮かんできたのは、前述の先行する哲学関係のデータベースでも使われていたデータベース運用プログラム(14)の検索機能であった。筆者たちとしては、その後も、もっと筆者たちの研究状況にぴったりのソフトがあれば乗り換えてもよいと思って探してきたが、いま一つぴったり来るものがなく、結局、いまでもやはりこのソフトを利用している。このソフトの検索機能にはいくつかのものがあるが、現在公開のために使っているのは、二つの機能のみである。一つは、『フッサール全集』各巻におけるそれぞれの語句(語頭の大文字・小文字を区別せず拾い、語尾を前方一致で拾う)の出現回数を表示させるものであり、もう一つは、それぞれの語句の出現箇所を各章のタイトルとともに、5桁の数字(前半3桁が頁数を表し、後半2桁が行数を表す)で表示させるものである(15)。このように、フッサール・データベースはテキストそのものを公開せず、特定の語句についての検索結果のみを公開するものであるから、このデータベースの定本となっている『フッサール全集』を利用者が手元に持っていることを前提としている(それによって著作権問題をクリアしているわけである)(16)。
 このような公開方法によるフッサール・データベースは結局のところ、いわゆるコンコルダンスに過ぎないと言われるかも知れない。確かに或る意味ではそうであるが、印刷物のコンコルダンスに比べて大きな利点をもっていることは強調しておきたい。つまり、印刷物のコンコルダンスはすでに出来上がって固定してしまったものである。例えば、もし、これまでの研究者が予想もしていなかったようなアイデアでそのテキストを読みたいと考え、これまで注目されて来なかったようなタームについて調べてみたいと思っても、そのコンコルダンスにそのタームが掲載されていなかったら、そこで万事休す、それ以上は自分でコツコツ調べていくしかしようがない。思えば、索引というのは、単純に出現頻度によって作成されるわけではなく(だとしたら、「われわれ(wir) 」とか「である(ist) 」などが幅を効かすことになる)、たとえ出現回数が少なくともそれが重要であるなら、やはり索引に取り入れられるはずである。ということは、索引というのは、それを作成した人が何を重要と考えるかによって、取り上げられる事項が大きく異なってくることになる。だとすると、或る枠組み(パラダイム)においては重要と見なされなかったタームが、別の枠組み(パラダイム)のなかでは重要と見なされるということも大いにありうる。既成の索引やコンコルダンスは、そのような新しい読みには対応できないのである。しかし、筆者たちのフッサール・データベースであれば、その要求を申し出てもらえば、データを付け加えることができる。フッサール・データベースはインターネットによる公開を基本としており、インターネットを通じて必要な情報を直ちに得られ、また、新しいデータについての要望があれば、速やかに対応してデータを追加する用意がある。その意味で、増殖する生けるコンコルダンスと呼んでもよい。これは、今のところ筆者たちのアフターサービスに依るものであるが、将来的には、大型計算機のレベルで、利用者が応答型の検索ソフトをリモート・ログインして自由に検索できるようにしたい、と考えている(17)。
 このような公開方法は、初め著作権問題の壁にぶつかり、やむを得ない二次的な逃げ道として案出したものであったが、それがインターネットを通じて公開されるということによって、「情報についての民主主義」という積極的な意味を持つようになったのではないか、といまは考えている。もちろん、或る語句の出現箇所が一目瞭然で分かるということは、それだけで哲学的な意義を持つものではなく、それは、単なるデータに過ぎない。それを単なるバラバラの無意味な所与ではなく、意味のある情報(information) として「かたちを与える(in-form) 」ことができるのは、利用者がそれをどう読むのかという読みである。しかし、少なくとも、そのための材料(material)を誰もが共有できるということを可能にしたのは、インターネットによる公開であった。検索結果のような研究材料は、研究者の誰もが共有していて(あるいは、誰もがいつでも利用できる状態になっていて)いいものである。一生懸命汗水たらして調べ上げた人が、自分で苦労して調べたことだから人には教えない、調べたかったら自分で調べればいい、という状態は、決して生産的なものとは思えない。こういうことに関心を持つ人がそれぞれ別個に同じ作業を繰り返すというのは、研究全体の水準を上げるという観点からすると、無駄な反復作業である。そういう研究材料は、誰もが利用できる共有財産として公開してしまった方がいい。検索結果のデータそのものは何ら作成者に固有の思想を含んでいるものではなく、誰もがそれを利用して自分の思索を産み出していくための踏み台である。これが、筆者たちのフッサール・データベースの公開に込められたアイデアであった(18)。

7.インターネットを通じたデータベース

 哲学文献のテキスト・データ(電子テキスト)がインターネット(WWW、Gopherなど)を通じて入手できることには、前述の通りである。ここでは、もう少し詳しく、哲学関係を中心に、インターネットによって利用可能なデータベースについて述べておこう(19)。哲学の世界は、最新の情報が瞬時のうちに世界中を飛び交うというインターネットの世界からはほど遠いように思われるかも知れない。しかし、ここにもインターネットの並はすでに着実に普及し、インターネットは哲学研究のこれまでのあり方を根本的に変えていくのではないかという認識が広がりつつある。ここでまず、実際WWW上にどのような哲学関係の情報源が構築・公開されているか、いくつか代表的なものだけを選んで紹介しておこう(20)。
 初めに、一般的なインフォーメーションを得るためのサイトの代表的なものを一つだけ紹介する。
  • Computing Resources for Philosophy: An introduction -- イギリスのオックスフォード大学の人文科学コンピュータ・センター(CHC: Centre for Humanities Computing)による、哲学においてコンピュータを利用した資源についての紹介。オックスフォード大学におけるコンピュータ・サービス、同サービスにおける人文科学コンピュータ・プロジェクト(特に、オックスフォード・テキスト・アーカイヴ)、インターネット上の資源、電子テキストとテキスト解析、などについての紹介がある。1997年の改訂版となっており、インターネット上の哲学関係の資源の利用について基本的な知識を得るのに役に立つ。
 次に、哲学関係の情報源への一般的な入口となるリンク集をアメリカ、ドイツ、オーストリア、香港、そして日本からそれぞれ一つずつ紹介する。
  • American Philosophical Association -- 合衆国における哲学者達の主要な専門組織であるアメリカ哲学会(APA) のホームページ。案内板、会員紹介、学会安定と論文募集の案内、補助金と奨学金の案内の他に、哲学的内容をもったウェブ・サイト、各大学の学科・研究所・センター、図書館・コレクション・参考史料、文献情報、出版社などへのリンクも豊富に張られている。
  • Philosophie-Seiten -- ドイツ・ハイデルベルク大学のDieter Koehler氏によるサイト。すでに世界中にある哲学関連のホームページのなかで、ドイツで作られ、ドイツを中心としたヨーロッパの哲学関連情報を提供するものとしては、最も充実している。膨大なリンクが、研究(オフラインおよびオンラインの文献案内、討論・フォーラム、哲学者達のホームページ等)、組織(学部、研究所、プロジェクト、学会)その他に分類されている。
  • Philosophy in Cyberspace - Home Page -- オーストラリア・Monash大学のDey Alexander 氏による哲学関連のソースガイド。哲学的主題、テキスト関係のリソース、組織、討論・フォーラム、等にグループ分けされている。
  • Research Institute for the Humanities - Philosophy -- 香港中文大学・文学院・人文科学研究所の哲学部門のホームページ。中国哲学関係を中心にさまざまなリンクが、哲学関係のサイト、各大学哲学科のページ、哲学的主題、論理学、哲学者、などに分類されている。アジアにある、おそらく一番大きな哲学関係リンク集であろう。
  • 哲・倫・宗 -- 筑波大学大学院哲学・思想研究科の永崎研宣氏が、「ホームページ運用の経験を積むことを兼ね、ASAHIネットのホームページ作成サービスを利用して個人的に運営している」、哲学・倫理学・宗教学関係の国内リンク集。学会、研究機関等、リンク集、資料集、テキトス等、雑誌等、に分類されている。東北大学と京都大学にもミラーサイトがある。
 最後に、哲学文献の電子テキストへの入口となっているサイトをイギリス、アメリカ、ドイツ、スイスからそれぞれ一つずつ紹介する。
  • Oxford Text Archive Home Page -- イギリス・オックスフォード大学のテキスト・アーカイヴのホームページ。このアーカイヴに保存されているのは、ギリシア語・ラテン語・英語・その他の言語の主要な作家・著者の作品の電子ヴァージョンである。1500を越えるテキストが、プレイン・テキスト、SGML、HTMLという異なる形式で保存されているが、すべてのテキストがインターネット・ユーザーにアクセス可能なのではなく、オックスフォードのユーザーに制限されているものもある。TEI(Text Encoding Initiative)とSGMLについても詳しい説明がある。
  • The University of Virginia Electronic Text Library -- アメリカ・ヴァージニア大学の電子テキスト図書館。同大学のユーザーにはすべてのテキストとイメージが入手できるが、一般のインターネット・ユーザーには制限されているものもある。すべてのテキストは、SGMLでマークアップされているが、ユーザーが利用するときには自動的にHTMLに変換される。英語・フランス語・ドイツ語・ラテン語・日本語・中国語・キリル文字と、使用言語によって分類されている。ウィトゲンシュタインのドイツ語デキストが三つ入っているが、利用制限されている。因みに、日本語のテキストとしては、同大学図書館電子テキスト・センターとピッツバーグ大学東アジア図書館の協力による Japanese Text Initiative が唯一『小倉百人一首』を英日対訳テキストとして公開している。
  • Philosophische Seiten: Klassische PhilosophInnen -- ドイツ・ハイデルベルク大学のDieter Koehler氏(前出)が作成しているサイトで、世界中に散らばっている電子テキストのサーバーへのリンクを張ったリンク集。英語のテキストだけでなく、ドイツ語、フランス語、イタリア語のテキストもあるのが嬉しい。哲学者別に一次文献・二次文献を含めて分類されているほか、源泉になっているサーバーへのリンクもまとめられており、大変充実している。
  • ATHENA: BOOKS, LITERATURE, ARTS, SCIENCE, MINERALOGY-- スイス・ジュネーブ大学のPierre Perroud氏によるサイトで、電子テキストあるいはそれを保存したサイトへのリンクを収集した膨大なリンク集。2500件以上の電子テキストへのリンク(著者別のアルファベットで分類されている)、スイス人の書いたもの、フランス語で書かれたもの、美術と科学、鉱物といった分類がなされ、哲学・科学・古典・文学・歴史・経済等といった広い分野にわたって、しかも多言語での電子テキストへのリンクを収録している。スイス人の書いたもののなかには、ルソーのフランス語のハイパーテキストもある。
 さて、以上の紹介でも分かるように、すでに多くの哲学文献の電子テキストがインターネットを通じて公開されている(21)。これは、インターネットによって公開されたテキスト・データベースと言えよう。しかし、ここには大きく二つの問題がある。第一に、すべてのインターネット・ユーザーに公開されているのは既に著作権・版権の保護期間が切れたテキストのみであり、それらは出版社が十分に校正したものではなく、ボランティアの個人あるいは特定組織・機関が制作した言わば試用版であり、その点でいま一つ信頼性に欠けるということである。出版社が校正に関わり、信頼性の高いものであればあるほど、一般公開はされておらず、ユーザーを制限したものとなっている。このインターネットにおける著作権・版権の問題はまだまだこれからどうなっていくのか分からない。研究者としてはどんどん著作権フリーにして欲しいという希望がありつつ、製作者サイドとしてはまったくフリーになってしまえば制作のための費用が出せなくなるということになる。その間でバランスがどう取られていくのか、これからの課題であろう[28][32][33]。第二に、公開されているたいていのテキストは、プレイン・テキストであるか、せいぜいHTMLテキストである。SGMLテキストも、HTMLヴューアーであるWWWブラウザで読む限り、HTMLテキストに変換されて見ることになる。いくつかの特殊なサイトで、特殊なテキストについて、特定の検索エンジン(あるいは、CGI[10])を使ってテキスト検索ができるようになっていたりすることはあるが、決して一般的ではない。となると、プレイン・テキストやHTMLテキストを入手できることは確かであるが、それを単に自由に閲覧できるというだけでは、研究者にとってはそれほど大きな価値があるとは言えない。更に高度な検索をしたいと思ったら、テキストをダウンロードしてきて、自分の使っている検索プログラムで使うということになろうか。以上が、現状である。

8.今後の課題

 最後に、これまで折り折りに触れてきたことだが、今後の課題について、とりあえず筆者たちの運営するフッサール・データベースの抱える問題に則して、簡単にまとめておこう。
 第一に、汎用性の問題をクリアするためには、テキストの種類が問題となろう。HTMLはWWWによってすっかり普及し、一般化していることは確かであるが、不十分な点も多い。例えば、「1.構造化できない、2.再利用しづらい、3.必要な情報が取り出せない、4.理想の自動化ができない、5.多すぎる「検索結果」、6.変化する仕様」などが挙げられている。他方、SGMLは充実した機能をもつが、素人には近づきにくく、労力も必要とし、「時間的にもコスト的にもかなりの投資が求められる」し、また「SGML周辺のツールが現在のところまだ発展途上」である。そこで、両者の間を行き、「SGMLを大幅に簡素化した点に着目すれば、SGML-」であり、「HTMLが持つ制約を大きく打破した点に着目すれば、HTML++ 」とも言われ、「構造化されたテキストとドキュメントをWeb上で簡単に配付することができる」という点では「ネットワーク上のSGML」とも呼ばれるXML(The eXtensible Markup Language)が注目されているのである[14]。
 第二に、テキスト・データベース運用プログラムの問題がある。研究者にとって、単純の検索だけでは物足りない。さまざまな形での検索、抽出、並べ替え、等々の充実した機能が欲しい。筆者たちが使ってきているプログラムは、とりあえず筆者たちの最低の要求を満たしてくれるものではあったが、いま一歩進んだ機能の充実が欲しいところである。OCP(Oxford Concordance Programm) については前から話を聞くが[29][41]、改訂準備中なのか、現在は入手できない。可能性として、一つは、WWW上での検索を可能にするCGI(Common Gateway Interface)のプログラムを利用ないし作成すること[10][13]、もう一つは、Opentextを利用すること[13][18]、を現在検討している。ここでも、前述のテキストの種類や汎用性の問題との絡みに加えて、インターネット上での利用可能性とが無視できないであろう。
 第三に、これも以上の二点とも絡むことであるが、研究者としては、定本となる原典との対応がはっきりしていた方がいい。すでに述べたように、印刷本と電子本(電子テキスト)にはそれぞれの良さとそれぞれの不便さがある。文学書をやはり印刷された本で読みたいといのとはまったく違う意味で、哲学文献もまた印刷された本で読むことをすてられない。確かに、検索などの機能によって電子テキストを研究のために利用するメリットは大きい。しかし、だからと言って、哲学文献を電子テキストだけで読むようになるとは思えない。また、電子テキストを使わない研究者との共同性を維持するためにも、印刷本も棄てることはできないであろう。とすると、電子テキストを使うにしても、いつも容易に印刷本との対応がつけられる方がいい。具体的に言えば、頁数・行数・改行位置・注の位置、これらすべてが原本と同じ状態が維持されていること(あるいは、それとの対応が一目で分かるようになっていること)が、必要であるが、同時に、そのことによって検索などの作業が妨げられてはならない。上のデータベース運営プログラムも、こうような条件を満たすものでなければならないだろう。  このような課題をクリアしながらフッサール・データベースを発展させることが筆者たち(フッサール・データベース作成委員会)の課題である。しかし、同時に、筆者たちとしては、前に触れた出版社のCD-ROM制作の計画に加わっていくことにはやぶさかではない。むしろ、そのことですべての研究者が電子テキストを使うことができる時期が早く来ることを歓迎し、そこに向けて筆者たちが貢献できることがあれば大いに役立ちたいと思っている。こうして筆者たちのフッサール・データベースが姿を変えながらも充実し豊かになっていくことが、そのことによって哲学におけるデータベースという課題に貢献し、ひいては人文科学におけるデータベースという課題に貢献していくものと確信している。

(1) こういうコンピュータの利用については、[12]を参照。
(2) 今世紀最大の哲学者の一人ハイデガーは、タイプライターの出現という時代を体験した一人であるが、タイプライターが人間にとって持つ意味を次のように述べていた。「現代人が用いるタイプライターは言葉を破壊し、書くということを手、すなわち言葉の本質領域から奪い去る」。現代の多くの哲学者にとってワープロ/パソコンが必需品になって来ている状況、更に若い世代ではワープロ/パソコンの画面に向かわないと思考することさえ困難になってきているという状況は、ハイデガーにとって「言葉の本質が奪い去られてる」という事態なのであろう。田舎の哲学者ハイデガーは、レコード・映画・タイプライターの出現と普及という、現代へと続く当時の状況に背を向けてしまったと言うべきであろう。
(3) [21]が説くのは、せいぜいこのレベルのパソコン利用である。
(4) 以上も含め、人文科学におけるさまざまなパソコン利用については、[25][26]に実用的な紹介がある。また、歴史学におけるコンピュータ利用については、[3] を参照。
(5) この節および次節の一部は、1997年度前期に筆者が担当した人間学演習 Iにおいて講義したことをまとめたものである。この演習について詳しくは、筆者のホームページ(http://jcmac2.hss.shizuoka.ac.jp/shakai/ningen/hamauzu/hamauzu.html )から「今年度の開講科目~人間学演習 I」と辿って参照されたい。
(6) このような電子本の登場によって、伝統的な印刷本がなくなってしまうとは思えない。それぞれにそれぞれの長所と短所があるからである。このようなテーマについては、[1][24][42] を参照。
(7) すっかり普及はしたが機能的には不十分なHTMLと、機能的には充実しているが一般には高度すぎるSGMLのあいだに、言わば第三の道を探ろうとするXML(The eXtensible Markup Language)がいま話題になっている[13]。
(8) このことと関連して、欧文テキストの場合、アスキーコードにない特殊文字(ドイツ語のウムラウトやフランス語のアクサン記号のついた文字など)をどう表記するか、という問題がある。これらはHTMLやSGMLを使えば汎用性を確保することができる[39][44]。また、日本語テキストの場合も特殊な漢字をどうやって汎用性を失わずに表示させるかという問題があるが、小論ではもっぱら欧文テキストのデータベースに関心があるため、割愛せざるをえない。これについては、[14][18][46]などを参照。
(9) この当時の状況については、[8][27][40] を参照。
(10)例えば、InteLex 社の販売している哲学フルテキストCD-ROMに PAST MASTERS シリーズがあり、プラトン、ホッブス、ロック、バークリ、ヒューム、ベンサム、キルケゴール、ウィトゲンシュタイン、パースなどのテキストが入手できる。あるいは、 Walter de Gruyter社で出している Friedrich Nietzsche: Historisch-Kritische Ausgabeや、また、これは出版社ではないが、ボン大学の Institut fuer Angewandte, Kommunikations und Sprachforschungが制作し市販している Kant: Akademie-Ausgabe ([11]を参照)などがある。
(11)例えば、学術情報センターの情報検索サービスには、人文科学の研究者の関心を引くものとして、「科学研究費補助金研究成果概要データベース」や「研究者ディレクトリ」などがある。また、NIFTY-Serve で使えるデータベースのうち、「朝日新聞記事情報」「NICHIAGI ASSIST 」などは、学術的にも価値がある。
(12)代表者である筆者のほか、谷徹(城西国際大学)、貫成人(埼玉大学)、榊原哲也(立命館大学)、和田渡(阪南大学)、水谷雅彦(京都大学)からなるグループであるが、具体的な作成の作業にあたっては、東北大学、東洋大学、早稲田大学、学習院大学、御茶の水大学、上智大学、名古屋大学、大阪大学、関西大学、立命館大学、龍谷大学、九州大学ほかの多くの学生・院生の諸君にお世話になっている。
(13)詳しくは、「フッサール・データベースのホームページ」を参照。 (14)弘前大学の清水明氏の制作したTEXASというデータベース運用プログラム。そのマニュアルは、[ftp://ftp.ipc.shizuoka.ac.jp/HUA/doc/japanese/texas.doc]で見ることができる。
(15)ここで、簡単なサンプルを一部のみお見せしよう。
 まず、1巻分の出現回数のみを表した検索結果のリストから、Husserliana Bd.Iの一部(Aで始まる検索語のみ)を示す(HUA_01Tは第1巻の本文を表す)。#のあとの数字はナンバリングされた集合番号、次の数字はその検索語のこの巻における出現回数、"_"は大文字・小文字を区別せずに拾う機能、"*"は前方一致で拾う機能(例えば、"_abbild*"は、"Abbild" "Abbildung" "abbildet" etc.をすべて拾う)をそれぞれ表す。
                  << HUA_01T.IDX >>

#   1:   18 : _a priori
#   2:    1 : _abbild*
#   3:    0 : _abschattung*
#   4:   90 : _absolut*
#   5:   12 : _abstraktion*
#   6:   14 : _abwandlung*
#   7:   10 : _ada~quat*
#   8:    4 : _a~hnlichkeit*
#   9:   80 : _akt*
#  10:   27 : _aktiv*
#  11:   17 : _aktuell*
#  12:    2 : _als-ob
#  13:   19 : _alter ego
#  14:   46 : _an sich
#  15:    7 : _analogon*
#  16:   32 : _analyse*
#  17:   29 : _anderer*
#  18:    5 : _anonym*
#  19:    0 : _anormal*
#  20:    0 : _anormalita~t*
#  21:   16 : _anschauung*
#  22:    3 : _anthropolog*
#  23:    4 : _antizipation*
#  24:    0 : _anzeichen
#  25:    3 : _anzeige*
#  26:   73 : _apodiktisch*
#  27:   13 : _apodiktizita~t*
#  28:    1 : _apparenz*
#  29:   24 : _apperzeption*
#  30:    3 : _apperzeptiv*
#  31:   12 : _apperzipier*
#  32:   19 : _appra~sentation*
#  33:    9 : _appra~sentativ*
#  34:   28 : _appra~sentier*
#  35:    0 : _apprehension*
#  36:   37 : _apriori
#  37:    0 : _arithmetik
#  38:    3 : _aspekt*
#  39:    0 : _assertorisch*
#  40:   26 : _assoziation*
#  41:   11 : _assoziativ*
#  42:    4 : _auffassung*
#  43:    3 : _aufmerksamkeit*
#  44:    0 : _ausdehnung*
#  45:   11 : _ausdruck*
#  46:    9 : _aussage*
#  47:    5 : _ausschalt*
#  48:    4 : _ausschaltung*
#  49:    1 : _aus~enhorizont
#  50:    0 : _axiologie
次に、サンプル語("_horizont*")の同巻(ただし本文のみ)における出現箇所を頁数と行数とで表した検索結果を示す。#のあとの数字は、検索語につけられたナンバリングの数字、次の"items"の前の数字がこの巻における出現回数、その下に並ぶ5桁の数字のうち、前3桁は頁数を、後2桁は行数をそれぞれ表す。
<< HUA_01T >>

#174:S:   71 items        _horizont*
---A---           
DIE PARISER VORTRA~GE
                  01838 01901 01912 01927 01935 02035 02106 02107 02132 02223 
                  02339 02410 03325 03630 03639 03727 
---B---           
CARTESIANISCHE MEDITATIONEN
EINLEITUNG        
I. MEDITATION     05308 06216 06216 06223 06229 
II. MEDITATION    06729 06909 08115 08205 08206 08214 08225 08231 08233 08239 
                  08301 08309 08313 08319 08526 08604 08714 08812 08836 09104 
                  09105 
III. MEDITATION   09535 09629 09838 09902 
IV. MEDITATION    09922 10003 10226 10502 10717 10720 11814 
V. MEDITATION     13205 13215 13313 14106 14403 15838 15839 16034 16036 16727 
                  17520 17605 17721 
SCHLUSS           17919 17927 18017 
---C---           
INHALTSU~BERSICHT
                  19036 19110 
(16)インターネット上の著作権の問題については、[29][31][32]を参照。
(17)とりあえず、念頭に置いているのは、CGI(Common Gateway Interfacd) [10] であるが、現在静岡大学情報処理センターではCGIを使うことはセキュリティ上の問題から許可されていない。
(18)以上、この節の論述は、[33]~[37]および[39]の拙論を要約したものであり、一部重複のあることをお断りしておく。ここで、ついでに、現在WWWでアクセスできるフッサール関係のサイトを紹介しておこう。
  • The Husserl Page -- アメリカ・コロラド大学のBob Sandmeyer 氏が運営しているサイトだが、オリジナルのデータとしてはフッサールの著作年代記くらいで、他には、二次文献の哲学者の Bibliographがあり、関係したリンクが集められている。
  • Glossary Guide for Translating Husserl -- メキシコ・国立自治大学のAntonio Zirion氏が運営しているサイトで、フッサールのテキストをスペイン語へ翻訳する際の語彙集を独自に作成・公開している。Zirion氏の計画としては、これを多言語の語彙集にまで拡大すること、他方でまた、重要な語句について重要な文脈を集めた『フッサール辞典』を作成すること、も考えている。
  • Center for Advanced Research in Phenomenology [] -- アメリカ・フロリダ大西洋大学にある、Lester Embree らによって運営されているサイトで、フッサールだけでなく、現象学全般に関わるさまざまなデータを集めている。1997年に出版されたENCYCLOPEDIA OF PHENOMENOLOGYは、この現象学先進研究センターの活動の集大成とも言える。
その他は、「フッサール・データベースのホームページ」の「関連する哲学関係のサイトへ」を参照。
(19)哲学研究におけるインターネットの利用に関しては、[48]および[34][37]を参照。
(20)以下、この節の論述は、[38]の一部をヴァージョン・アップしたものであることをお断りしておく。
(21)以上は、私が蓄積しているブックマークのなかから、できるだけ哲学プロパーで、しかも一般的に役立つものを厳選して紹介した。これ以外にも、電子ジャーナルや学会・組織や各大学哲学科のサイトなどもあるが、それぞれ以上に挙げたものからリンクが張られているので、それを辿って頂きたい。また、筆者が制作中の「はまうず・ホームページ」からも若干リンクを張っているので、それも参照されたい。前述の「関連する哲学関係のサイトへ」にも、フッサール関係のリンク集を作っているので、併せて参照されたい。

文献表

[1] 合庭 惇『電子出版の未来形』(マルチメディア出版研究会、1996年4月)
[2] アリアドネ『調査のためのインターネット』(ちくま新書、1996年9月)
[3] イーヴァン・モーズリーほか『コンピュータで歴史を読む』(有斐閣、1997年4月)[4] 梅棹忠夫『知的生産の技術』(岩波新書、1969年7月)
[5] Eric van Herwijnen『実践SGML』(日本規格協会、1992年4月)
[6] (研究代表者)加藤尚武『人文科学におけるテキスト・データベースの現状』(昭和62年度科学研究費綜合研究(B) 研究成果報告書、1988年3月)
[7] 黒崎政男『哲学者クロサキのMS-DOSは思考の道具だ』(アスキー出版、1993年)
[8] 佐々木周「テキスト・データベース"RENE"の公開と今後のデータベース構築について」(『理想』No.628、1985年9月号)
[9] 佐々木周「テキストデータベース・ルネ」(デカルト研究会編『現代デカルト論集Ⅲ日本篇』勁草書房、1996年9月、所収)
[10]佐木望ほか『HTML&CGI入門』(エーアイ出版、1996年4月)
[11]佐藤 労「カント・テキスト・データベース試用記」(カント研究会編『現代カント研究4 自然哲学とその射程』晃洋書房、1993年1月、所収)
[12]清水 誠『データ分析はじめの一歩』(講談社ブルーバックス、1996年10月)
[13]情報知識学会編『情報知識学会誌』Vol.6 No.1(1996年12月)
[14]情報知識学会編『情報知識学会誌』Vol.7 No.1、「SGML/XML研修フォーラム特別号」(1997年11月)
[15]『シンポジウム コンピュータ国文学 第1回講演集』(国文学研究資料館、1996年7月)、同『第2回講演集』(同、1997年10月)
[16]『シンポジウム 人文科学とコンピュータ』(文部省科学研究費補助金重点領域「人文科学とコンピュータ」総括班主催、青森公立大学、1996年9月)
[17]『シンポジウム 考古学とコンピュータ』(文部省科学研究費補助金重点領域「人文科学とコンピュータ」総括班主催、青森公立大学、1996年9月)
[18]『じんもんこん』第1号(文部省科学研究費補助金重点領域「人文科学とコンピュータ」研究情報誌、1995年9月)、同第2号(1996年2月)
[19]『「人文科学とコンピュータ」シンポジウム予稿集』(文部省科学研究費重点領域「人文科学とコンピュータ」1996年度研究成果報告書第3号、1996年10月)
[20]「重点領域研究 人文科学とコンピュータ」(『人文学と情報処理』No.13 、勉誠社、1997年3月) [21]C.P.スノー『二つの文化と科学革命』(みすず書房、1967年)
[22]諏訪邦夫『パソコンをどう使うか』(中公新書、1995年4月)
[23]立花 隆『インターネット探検』(講談社、1996年4月)
[24]立花 隆『インターネットはグローバル・ブレイン』(講談社、1997年12月)
[25]津野海太郎『本とコンピュータ』(晶文社、1993年8月)
[26]中尾 浩『文科系のパソコン技術』(中公新書、1996年6月)
[27]中尾 浩ほか『マッキントッシュによる人文系論文作法』(夏目書房、1995年4月)[28]長瀬真理「哲学とコンピュータ -- テキスト・データベースの現状と展望 -- 」(『理想』No.630、1985年11月号)
[29]長瀬真理・西村弘之『コンピュータによる文章解析入門 -- OCPへの招待』(オーム社、1986年)
[30]長瀬真理「研究用データベースの著作権と流通慣行」(『人文学とコンピュータ』No.5、1994年6月)
[31](研究代表者)長瀬真理『「源氏物語」ハイパーテキストの作成と教育利用の為の基礎的研究』(平成6年度科学研究費補助金(一般研究(B) )研究成果報告書、1995年3月)
[32]中山信弘『マルチメディアと著作権』(岩波新書、1996年1月)
[33]名和小太郎『サイバースペースの著作権』(中公新書、1996年9月)
[34]浜渦辰二「フッサール・データベースについて」(『人文論集』、第46号の1、1995年7月)
[35]浜渦辰二「国内情報:インターネットによるフッサール・データベースの公開」(『現象学年報』11、1996年1月)
[36]浜渦辰二「フッサール・データベースの現状報告」(『情報知識学会ニューズレター』36、1996年2月)
[37]浜渦辰二「フッサール・データベースの新段階」(『情報知識学会第4回研究報告会講演論文集』、1996年5月)
[38]浜渦辰二「インターネットを利用した哲学研究のために -- フッサール・データベースの新段階 -- 」(『人文論集』、第47号の1、1996年7月)
[39]浜渦辰二「インターネットによって利用可能な哲学関係の情報源について」(『情報知識学会ニューズレター』39、1996年8月)
[40]浜渦辰二「峠を越えたフッサール・データベース -- インターネット時代のマルチリンガル・テキストのために -- 」(『人文論集』、第48号の1、1997年7月)
[41]藤澤賢一郎ほか「人文・社会科学のテキスト・データベースをめぐる諸問題」(『東京経済大学人文自然科学論集』、1988年7月、所収)
[42]古瀬幸広『インターネット活用法』(講談社ブルーバックス、1996年7月)
[43]『季刊 本とコンピュータ』1(トランスアート、1997年7月)
[44]松井陽子「HTML、SGML、TEXの比較」(『オープンデザイン』No.13 、「HTMLリファレンス」特集、1996年4月)
[45]Martin Brayan 『SGML入門』(アスキー出版、1991年3月)
[46]三上吉彦ほか『電脳外国語大学』(技術評論社、1993年)
[47]安永尚志『文科系のための情報検索入門』(平凡社、1996年7月)
[48](研究代表者)安永尚志『重点領域「人文科学とコンピュータ」 -- テキスト処理 -- 研究成果報告書』(1995年3月)
[49]山形庫之助『個人データベースを作る』(講談社ブルーバックス、1997年5月)
[50]山田友幸「研究環境としてのインターネット 哲学の場合」(『情況』1995年4月)