本研究で開発した自然言語解析システムの概観を図1に示す.斜線の部分がシ ステムの基本的モジュールである.JUMANと書かれているのは,日本語の形態 素解析を行なうシステムであり,我々のグループで開発されてフリーソフトと して公開しているものである.ユーザプログラムと書かれた部分は,ユーザに よって指定される辞書から本システムの語彙記述への変換プログラム,および, 言語情報を用いた優先解釈規則を記述したプログラムである.これらはユーザ がしようする辞書や優先解釈の方法に応じて記述されるべきものである.ただ し,今回はこれらの部分についても,典型的な利用法として,IPAL辞書からの 変換プログラム,および,例との類似性による優先規則の記述を実験のために 作成した.解析の結果の表示は,解析中に得られた句や節の内部構造をユーザ にわかりやすく提示するインターフェースとして実現されている.
なお,言語解析システム本体はSICStus Prolog(version 2.1)で書かれており, ユーザインターフェース部はTcl/Tkによって書かれている.
従来は,個別の言語現象を扱うために開発されることが多かった特定の語彙記 述や優先解釈規則を統合的に利用するための解析環境を提供していることが本 研究の特徴である.利用者は,自身で開発した言語情報あるいは既存の言語情 報と自身のものを同時に利用することによって言語解析能力の評価がどの程度 のものであるかを知りたいことが多い.従来は,それらの評価が、それぞれの 言語情報ごとに個別に行なわれてきた。しかし、これらの言語情報は単独では 全ての曖昧性を解消できないため、実用的には他の言語情報と統合的に用いる 必要がある。従ってその評価も、それぞれの言語現象に対して個別にではなく、 多種類の言語情報を用いた場合を全体として評価する必要がある。本システム は,そのような評価を行なうための基盤となる環境を提供するものである.
言語解析部と曖昧性解消のための優先度スコア計算の部分は実現されている. また,ユーザ辞書の変換部についてもIPALや分類語彙表など日本語処理で広く 使われている辞書の利用ができるように変換プログラムを試作している.HPSG で記述している日本語文法については,まだ基本的な構文構造にしか対応して おらず,さらに拡張が必要である.英語文法についてはHPSGの教科書程度のも のを実装しており,基本的な構文については対応できる.ただし,文法につい ては,システムへの実装に向けて特異な記述を行なった部分があるので,シス テムに依存しない独立した記述法を定め,そこから実装形態へ変換する方式に 改める予定である.