インターネットを利用した生命科学情報の広域データベース化とその意義
日本産アリ類カラー画像データベースの紹介

5.日本産アリ類カラー画像データベースの構築

 上記のような観点から,我々と日本蟻類研究会は協同で日本産アリ類の画像データベース構築とそのネットワークでの公開に向けた活動を行なってきた。
 画像データベース化計画が始まる以前,日本蟻類研究会では,研究者および一般向けに250余種の確認種を網羅した「日本産蟻類の検索と解説 I, II, III」【11, 12, 13】を刊行している。また,将来的にこれを図鑑化するために,採集したアリ標本の写真撮影を行ってきた(この際,アリの体色は死ぬと変化してしまうため撮影には野外から採集した個体を麻酔して用いている)。その後,これらをデータベース化すればより有効であろうということで我々が協力することになった。なお,本計画のメンバーは北海道から九州にかけて在住しているため全員が集まれるのは年に1,2回しかない。そのため,データベース構築に関する連絡・議論・データ交換のほとんどはメーリングリストを作成してネットワーク上で行なっている。

構築までの経緯
 まず,種の検索・解説などのテキストデータは,「日本産蟻類の検索と解説 I, II, III」および「日本産蟻類文献目録」【14】の原稿がすでにテキストファイルとしてあったのでそれらを利用した。
 画像(スライド写真)のディジタル化は色々検討した結果,コダック社が始めたフォトCDサービスを利用するのがもっとも画質を損ねず,かつ,容易であることがわかった。一枚のフォトCDディスクには標準で100枚までの写真が保存できる。実際には各写真ごとに1つの画像ファイルがあるだけだが,フォトCD専用のインターフェイスにより,ファインダー上は192 x 128, 384 x 256, 768 x 512, 1536 x 1024, 3027 x 2048ピクセル計5種のサイズの画像があるようにみえる。実際に各々をHDDなどにコピーすることも可能である。
 今回のデータベースの作成過程では,フォトCD4枚に収められた画像データは4 x 100 x 5 = 2000枚ほどあり,そのファイルサイズは合計2.8Gバイトに達した。そこで通常のパソコンでは表示が不可能な最大サイズの画像ファイル(3027 x 2048)を省き,残りの4種の画像をGIFまたはJPEG形式で圧縮して後述するハイパーテキストと共に1枚のCD-ROMに収めた。CD-ROMの作成にはRCD-202(Pinnacle Micro)を用いた。これまでに製作したCD-ROMはMacintosh用のみだが,今後は他のプラットフォーム用のCD-ROMも開発する予定である。

 作成した画像データベースは,当初,CD-ROMで配布するつもりだったが,計画が具体化する過程で,データベースの内容は研究の進展とともに追加・更新されるべきであり,将来を考えればネットワークを通じて公開するほうがより望ましいとの認識が生まれた。そのため,データベース化はCD-ROMの配布とネットワーク公開の二本立てでいくことになった。
 つぎの問題はソフト環境だった。当初は,これらの膨大な量の画像データを管理する適当なソフトがなかったため作業はなかなか進まなかった。画像専用の市販データベースソフトはあるが,一般への普及を考えると高価な市販ソフトを利用するのは好ましくないので断念した。そこで,最初はファイルメーカープロ(Claris)を利用してデータベース化作業を行なった。ファイルメーカープロは画像も扱える上に市販ソフトとしては安価であり,一般に普及しているのが採用した理由である(データをみるだけなら体験版ソフトも利用可能である)。ただし,ファイルメーカープロは扱えるファイルサイズに制限があるうえ,大量の画像を扱うのには適していないので,大きなサイズの画像を取り込むことはできなかった。
 ところが,その後,WWWという新しいネットワーク環境が生まれ普及するようになった。WWW用のブラウザソフトを調べたところ,それらは非常に簡単にたくさんのファイル(含画像)を管理できるソフトであり,しかも,その利用範囲はとくにネットワークに限定されないことがわかった。したがって,これらのブラウザを利用すれば膨大な画像データを管理するデータベースをネットワーク上で構築できるだけでなく,それがそのままCD-ROMとしても公開できるのである。さっそくこれらを使ってデータベース(実際には画像を含んだハイパーテキスト)を作ることにした。

ネットワーク公開
 当初,作成したデータベースはanonymous ftp, gopher等により画像やテキストファイルを個々別々にネットワーク公開する予定だった。しかし,上記のように最終的にはWWWサーバ上でハイパーテキストからなる画像データベースとして公開することになった。
 データベース構築作業はMacintosh上で行なったため,当初のサーバ用ソフトにはMacHTTP(Copyright (c) 1991-1994, Chuck Shotton)を使用した。しかし,問題はサーバの設置場所だった。回線速度の遅いネットワークにパソコン(Macintosh)のサーバを設置した場合,外部からのアクセスに時間がかかるだけでなく,周囲のネットワーク環境にも迷惑をかける恐れがあった。そのため,画像データベースのミラーサイトを農業生物資源研究所にあるUNIXワークステーション上に設置した( http://www.dna.affrc.go.jp/htdocs/Ant.WWW/htmls/index.htm )。このミラーサイトはアクセス条件がよいのでここを一般公開することにしている。しかし,利用者が増えた場合は,さらに他にもミラーサイトを増やしていく必要があるだろう。なお,日本語テキストはShift-JISコードを採用している。英語メニューもあるがまだ全体の英語化はできていない。

もどる  すすむ


Copyright 1995 by 日本コンピュータサイエンス学会