next up previous
Next: (2)ソフトウェアと しての成果 Up: 研究 の成果 Previous: 研 究の成果

(1)研究上の成果

本年度の研究成果は,前節で述べた3項のうち,特に第3項の言語資源の評価支 援システムである.本システムでは,さまざまな言語情報を統合的に用いて曖 昧性を解消しながら、文を解析することができる.この解析システムは、次の 二つの目的を持つ。

本システムでは、複数の言語情報を統合的に用いるために、素性構造を拡張し た混合並列素性構造を採用している。混合並列素性構造の単一化手続きをシス テム側でサポートすることにより、複数の言語情報を統合して利用する場合も、 文法記述の変更せずに、単一の言語情報を用いる場合と同様に扱うことができ る。また、ユーザは自分が用意したもの以外の言語情報については特別な知識 がなくても、それらを並列的に用いることができる。

曖昧性解消のメカニズムとしては、優先度スコアによる曖昧性解消手法を用い ることで、複数の言語情報からの優先付け結果を統合しやすくしている。また、 優先付けの手掛かりとして、単位データという基本的なデータ形式を使うこと により、ユーザの負担を軽減すると同時に、コーパスから生成できるデータと して、より言語情報構築に利用しやすい情報を提供することができる。

利用できる文法としては、特に限定せず,一般にDCG形式の文法を扱うことが できる。文法によって情報の記述方法が異なるため、一般的には文法に沿って 辞書の変換方法を替える必要がある。このような負担を軽減するため、本論文 では、汎用的に用いることのできる文法体系/素性構造記述として、HPSG の形 式を利用することを提案した。

統合して用いることのできる言語情報/優先度付け手法には制限が少なく、様々 な言語情報/優先度付け手法を本システム上で用いることができると考えてい る.



www-admin@icot.or.jp