本年度の研究成果は,前節で述べた3項のうち,特に第3項の言語資源の評価支 援システムである.本システムでは,さまざまな言語情報を統合的に用いて曖 昧性を解消しながら、文を解析することができる.この解析システムは、次の 二つの目的を持つ。
本システムでは、複数の言語情報を統合的に用いるために、素性構造を拡張 した混合並列素性構造を採用している。混合並列素性構造の単一化手続きを システム側でサポートすることにより、複数の言語情報を統合して利用する 場合も、文法記述の変更せずに、単一の言語情報を用いる場合と同様に扱う ことができる。また、ユーザは自分が用意したもの以外の言語情報について は特別な知識がなくても、それらを並列的に用いることができる。
曖昧性解消のメカニズムとしては、優先度スコアによる曖昧性解消手法を用 いることで、複数の言語情報からの優先付け結果を統合しやすくしている。 また、優先付けの手掛かりとして、単位データという基本的なデータ形式を 使うことにより、ユーザの負担を軽減すると同時に、コーパスから生成でき るデータとして、より言語情報構築に利用しやすい情報を提供することがで きる。
利用できる文法としては、特に限定せず,一般にDCG形式の文法を扱うことが できる。文法によって情報の記述方法が異なるため、一般的には文法に沿って 辞書の変換方法を替える必要がある。このような負担を軽減するため、本論文 では、汎用的に用いることのできる文法体系/素性構造記述として、HPSG の形 式を利用することを提案した。
統合して用いることのできる言語情報/優先度付け手法には制限が少なく、様々 な言語情報/優先度付け手法を本システム上で用いることができると考えてい る.