本研究では、高度な言語処理システム実現のための制限言語モデル構築技術の 確立を目指す。
制限言語構築には、対象分野における語用論的特徴や構文的特徴の調査・分析 が必要である。本研究では、対象分野として法律文を選び、特に国際法である 「国際物品売買契約に関する国連条約(ウィーン統一売買法)」を主たる対象と して、「法律文制限言語モデル」の構築を進めた。
法律文では、記述を明確にするために、一般の用法よりも強い制約を加えられ た法令用語が数多く存在する。本研究では、この強い語用論的特徴を調査・分 析し、その特徴を法律文制限言語モデルで活用する。また、一般的に言われる 単語ではないが、何らかの法的概念単位となるような語の連なりが存在するこ とが、我々の従来からの研究で明らかになっている。そこでこれらを「相当語」 として設定し、法律文制限言語モデルに組み入れた。
法律文は構文的にも強い特徴を持つ。法律文は基本的に、いかなる条件(「要 件」)の下にいかなる規定が適用されるか(「効果」)を定めるものである。本 研究における調査・分析の結果、この要件や効果は、法律文の文構造に密接に 関わることが判った。そこでこれを法律文の「要件効果構造」として、法律文 制限言語モデルに組み入れた。要件や効果はその法律文の記述内容の論理的側 面に密接に関わるものであるため、要件効果構造はその法律文の論理的構造を も表すと言える。
本研究では、制限言語を用いた高度な言語処理システム実現の核となる「素性 論理構造表現形式」を提案する。素性論理構造表現形式とは、言語構造の部分 を素性構造表現として表現し、意味構造の部分を論理構造表現として表現する 統合的な表現枠組みである。素性論理構造表現は、高度言語処理システムにお ける構文情報と意味情報との統合的利用に供することができるものである。本 研究においては、制限言語に基づく最終的な解析結果として、この素性論理構 造を生成するものとする。
本研究では、これらの法律文制限言語モデル構築の研究と同時に、その研究過 程を通して得られる経験に基づく制限言語モデル構築支援環境の作成を行った。
制限言語モデルの構築は、まず対象分野における言語現象の調査・分析に始ま る。通常は、大量のテキストデータの調査・分析を行うことになるであろう。 また、制限言語モデルの文法設計においては、文法適用と修正との反復が必要 となる。これらの作業には多大なる労力が要求されるため、作業の効率化を図 ることは必須である。労力の軽減は、作業上のミスの減少にも繋がり、高品質 の制限言語モデル完成を早めることができる。
本研究で構築する支援環境は、様々なツールの起動、解析実施、結果提示など、 GUI を駆使して支援することにより、効率良く快適な開発環境とすることを目 指した。制限言語モデルの文法設計の段階では、形態素解析や構文解析を行う システムが必要となるが、本研究では独自の解析システムを開発することは行 わず、形態素解析システム JUMAN 、構文解析システム SAX などの既存のシス テムを利用し、それらとのインターフェースモジュールを支援環境に組み込む こととした。これは、既存のシステムを有効利用することで言語処理システム の開発労力を軽減すると同時に、解析システムを可換として支援環境の汎用性 を高めるためである。また、処理システム部が独立であることにより、本支援 環境上での制限言語文法の改良と同時に、その制限言語文法に基づく独立した 解析システムの改良も実施され、文法の改良完了と同時に解析システムも利用 可能となることを意味する。