研究の背景
自然言語処理システムにおける,文法規則や辞書の開発には,多く の経験によって培われたノウハウが蓄積されている.そうしたノウ ハウを,自然言語処理システムを利用するアプリケーション開発者 が共有できる手立てを構築することが必要である.それによって, 自然言語処理システムを要素技術とする様々のアプリケーション開 発におけるソフトウェアの生産性や信頼性を向上させることが可能 になる.
現在,文法規則や辞書を作成する時の言語分析手法やデータ作成の 手続きは標準化されておらず,自然言語処理システムの再利用を阻 んでいる.次のような問題点をまとめることができる.
研究の目的
本研究の目的は,自然言語処理システムを構成する文法規則や辞書 のデータ類が,アプリケーション開発に適用する際に再利用を促進 するよう,データ作成の手続きの方法論を十分に詳細化しノウハウ の一般化を行なうことで,自然言語処理システムを利用しようとす るユーザーが共有できる方法論を構築することである.すなわちソ フトウェアとしての文法規則の維持,管理や保守を容易にすること を目的し,結果として公開ソフトウェアのユーザビリティの向上を 目指す.
本研究では,オブジェクト指向方法論を用いて,複数の専門家によ る日本語文法のモデル化を行ない文法モデルを作成する.分析対象 の言語現象を一つのドメインとし,そのドメインに対応する文法規 則をオブジェクトと考え,オブジェクト(文法規則)の均質性を確保 する.こうして属人性を排して作成した文法モデルを使い,ICOTフ リーソフトウェアのLTB(Language Tool Box)として提供されている 文法規則の再編と追加修正を行なうと同時に,辞書や文法規則記述 の方法論を確立する.それを基に規則の利用マニュアル作成する. 文法規則を利用するアプリケーション開発におけるソフトウェアの 生産性や信頼性を向上させることが目的である.