next up previous
Up: 「単一化に基づく日英文法の開発および言語知識評価支援システム」に関する成果概要 Previous: 研究の内容

研究の成果

研究上の成果

本年度の研究成果は、前節で述べた2項のうち、特に第2項で述べた統計 的手法と宣言的手法を統合したシステムの部分である。統計的処理の部 分は人手で文法規則を詳細に記述することは避け、簡単な文法モデルを 用いて解析結果に優先度をつけることを目標とした。日本語に関しては、 係り受け解析に基づき、係り受けに影響を与えると考えられる文節の主 辞、係り受け関係、係り受けの距離などをパラメータとした確率モデル にしたがった解析システムを作成した。また、英語に関しては、解析済 みデータからの文法規則の獲得および規則の生起確率の学習に関する研 究を行なった。

ソフトウェアとしての成果

本研究で開発したシステムの概観を 図--1に示す。矢印で示した部分が今回開発 したモジュールである。茶筌と書かれているのは、日本語の形態素解析 を行なうシステムであり、我々のグループで開発されてフリーソフトと して公開しているものである。形態素解析済みのデータからのパラメー タ学習のためのインタフェースも同時に開発している。統計モデルに基 づく英語および日本語の解析の部分は独立に作成されている。

HPSGに基づく解析の部分では文法規則は言語により独立であるが、統語 解析のためのエンジンとユーザインタフェースは共通である。HPSGに基 づく解析はこのユーザインタフェースを通じて行なわれ、解析過程にお ける句がもつ構文木や素性構造を自由に表示することが可能である。

統計的解析システムの部分はPerlおよびCによって記述されている。 HPSGに基づく言語解析部はSICStus Prolog(version 3)によって書かれ ており、ユーザインターフェース部はTcl/TkとPerlによって書かれてい る。それぞれのシステムのプログラムサイズは次の通りである。

残された課題

HPSGに基づく日本語および英語の文法については今年度も言語現象とし て広い対象のものを扱えるまでのものは作成できなかった。複雑な現象 を記述することに伴う計算量の問題を回避することを優先に考えたこと がその理由の一つである。本年度は、HPSGの記述のための枠組の拡張と、 前処理的な部分を統計モデルにしたがって作成することに力点をおいた。 前者については、今後はカバーする言語現象の範囲を拡大することが必 要である。また、統計モデルによる解析結果をHPSGに基づくシステムに 与える部分の作成は現在のところまだ完成していない。統計モデルから の出力はいわゆる句に対して括弧付けされた入力文であり、現在のシス テムでそのような入力を受け付けることへの困難は特にはない。

成果についての自己評価

HPSGのような詳細な文法体系を現実的な文の解析に用いたシステムが報 告されたことはまだない。本研究ではそれが達成された訳ではないが、 統計的なモデルとHPSGに基づいたシステムを統合したシステムを提案し、 その方向性を示したことは重要であると考えている。今後は両システム を詳細していくことにより、漸進的に精度の高いシステムの構成が可能で あると考える。

外部発表論文リスト



next up previous
Up: 「単一化に基づく日英文法の開発および言語知識評価支援システム」に関する成果概要 Previous: 研究の内容



www-admin@icot.or.jp