ロゴ

木材情報に特化した統合型データベースの構築ならびに専用サーチエンジンの開発

日本木材加工技術協会総会 市川賞受賞者講演 2008.10.23 東京大学弥生講堂

1.現状と問題点

情報の収集は、インターネットとホームページ(以下Web)の出現で飛躍的に便利になった。強力なWebサイトも出現したため、多くの情報はそれほどの時間をかけなくても容易に集めることができる。しかし特定の業界情報を収集しようとすると、なかなか目的の情報にたどりつかない。限られた誌面なので割愛するが、これらはインターネット特有の現象で、この傾向は今後も続くと予想される。

2.iWISE(アイワイズ)の開発 

そこで、木材情報を探したい人が、たやすく見つかるシステム、逆説的には情報発信者が、SEOなどのWeb知識がない人でも、無数のWeb情報に埋もれるのではなく、情報が前面に出せて、欲しい人に見つけられるシステムを構築しようと考えた。幸いに、パソコン黎明期の頃からデーターベース(以下DB)の構築をしていたので、それらの経験とDB資産を活用し開発した。木材情報に特化し、専用のサーチエンジンから構成するシステムとしてiWISE(Integrated Wood Information Search Engine)」と名づけた。

3.iWISEのDB構成

.

 情報登録の方法や収集の違いで4つのDBグループで構成されている。
1.情報発信者が登録するもので、4本のDBが動いている。
木材関連情報を発信したい企業・団体・個人が自主登録するDBで、登録する側には自社製品のPRや自身の研究紹介につながる。このDBはYahoo等のディレクトリ登録と同様のもので、なおかつ審査なしで簡単に登録でき、即時にWebに反映され、確実に自分の発信したい情報が公開される。現在3150社(個人含む)の登録で、毎日追加登録されている。そしてこのDBを、4つの団体でも利用している。
木に関係するショウルーム情報のDBで、ログハウス展示場、木製エクステリアなどの展示場内容が登録できる。360社の登録がある。
木に関係のあるお店情報のDBで、木製玩具、家具、木材会社などの利用が多い。現在380社の登録がある。②と共に検索方法は府県別地図指定とキーワード検索の2種類の方法がある。
木に関係のあるイベント、募集情報を登録できる。現在までに600件の情報が登録された。
2.ロボットによる自動収集DB。大手検索エンジンの検索ロボットには及ばないが、Webに含まれるの木材関係のキーワードを吸い上げる、簡易構造のロボットを開発し、日本の木材関係Webの情報を収集している。アルゴリズムは公開していない。現在の収集Webは27000社(個人含む)である。
3.情報の鮮度が優先されるDBで、サイト管理者が毎日収集し、入力したDBで、テレビ番組情報とWebニュースの2本を公開している。テレビ番組情報は木材、樹木、木工、木造建築、林業、森林などの範疇を収集し2日前にわかるようになっている。ニュースはインターネット上の大手新聞社から地方、業界、趣味新聞までをあらかじめ検索し、DB登録をしている。リンク形式で掲載し、オリジナルWebから削除されたものについては、自動的にDB上から削除する機能をつけている。
4.先の鮮度優先・動的なものではなく、原理原則的で変化の少ない静的なDBで、木に関係のある用語、方言・別名、学名、市町村の木、諺、万葉集、強度・性質、何でも事典、今日は何の日、などの9本を公開している。用語辞典は業界最大で現在7700語登録されている。既存DBは常時追加やメンテナンスをしており、構築、整備中のDBもいつくかあり、出来る限り公開してゆきたい。

?     

4.iWISE、企業情報の検索

検索には検索方法、処理時間、対象範囲などによって異なる4種類の検索方法を用意した。
あらかじめ用意されたカテゴリをクリックするカテゴリ検索は瞬時に結果が表示される。図(イ)
上記のカテゴリを3つまでAND条件で検索できる。図(ロ)
キーワードを入力して検索するもので、現在のところ1秒程度の検索時間が必要となっている。図(ハ)
このシステムのために開発した業界初(世界初)の木材シソーラス辞書を利用した検索方法。
キーワードの展開に負荷がかかるため1-2秒の時間が必要。図(ニ)
各々の検索の範囲は、先の①②は企業登録したデーターの中から検索される。③④は企業登録以外にロボット収集のもの、テレビ情報、Webニュースなどのデーターも一緒に検索される。現在のところ3万2000件のデーターが検索対象範囲となっている。

木の情報検索エンジン画面

5.iWISEのシソーラス辞書

一般の人が木材の業界をわかりにくいと思ってしまう原因のひとつに、木の名前がある。和名、商業名、現地名、その他が入り混じり、業界人でも木材のあらゆる分野で正確に言える人は少ない。そこで、単純に置き換えるものから、展開できるもの、選択できるもの、一方だけのものなどを整理しプログラムを組んでみた。
例えば、「ひのき」について検索をする場合、「ヒノキ」と入力しても「桧」や「檜」でも検索対象になる。「レッドウッド」と入力すると、別ウインドウが開き、「欧州赤松」、「セコイア」、「レバノン杉」などから選択ができる。
収集樹木名は約1万の単語を関連づけている。現在のところ展開、関連づけは樹種名のみだが、木材用語なども展開できるように準備中である。

 

5.iWISEの挑戦

業界、一般人を問わず、木材の情報を探すのに、必ず利用し、欲しい情
 報を得ることが出来るWebを目指します。そのため別Webの「木の情報
 発信基地」と連携し、木材に関するあらゆる情報を収集してDB化します。

(アドレス http://www.wood.jp? 登録件数は2008年8月末現在のもの)

講演にもどる