平成8年度 委託研究ソフトウェアの提案 |
情報化社会の発展により,様々な分野で高度な自然言語処理を望む声が増大し ている.しかし,現在の自然言語処理技術は,分野を限定しない一般の自然言 語文に対して,正確かつ高度な解析を実現できるまでにはまだ成熟していない. とはいえ,対象分野を限定し,その分野における文法的特徴や語彙の制約など の言語的特徴を活用するならば,高度な自然言語処理システムの実現は現在の 技術でも十分に可能であると思える.
ある特定分野の言語的特徴を活用する場合,それを制限言語モデルとして構築 し,そのモデルに基づく自然言語処理システムを構築するのが効果的であると 考えられる.しかしながら,制限言語モデル構築の方法論は,まだ確立されて いるとは言えない.よって,高度な自然言語処理システム実現のためには,制 限言語モデル構築技術の確立が急務であると言える.
制限言語モデル構築技術確立のための研究対象として適切なものとして,法律 文がある.法律文は,解釈の際になるべく曖昧性が生じないように言語表現に 強い制約を持っており,法的概念と言語表現との間に密接な対応が存在する. 現代社会における法律の役割は重要性を増す一方であり,これにともなって法 律の問題を取り扱う法律エキスパートシステムの必要性も増している.法律エ キスパートシステムには,法律コンサルタントシステム,法律文作成・改訂支 援システム,法律学CAIシステムなどがあり,これらのシステムを構築するた めに,法律文言語処理を行なう高度な自然言語処理システムの開発への要請は 極めて強い.
このような法律文を題材として,制限言語モデル構築と,その制限言語モデル に基づく応用システムの開発とを行うことにより,制限言語モデル構築技術の 確立や,深い意味処理を行う高度な言語処理システムの実現が期待できる.
本研究の目的は,次の二つの側面を持つ.
一つは,制限言語モデルによる高度な自然言語処理技術の開発である.研究の 背景でも述べたように,分野を限定するならば,現在の自然言語処理技術でも 高度な自然言語処理システムの実現は十分に可能であると考える.本研究では, そのような限定された分野の研究対象例として,言語的特徴の強い法律文を取 り上げる.法律文を制限言語として捉え,「法律文制限言語モデル」と,法律 文の言語構造と意味構造とを統合して表現する枠組である「素性論理構造表現 形式」とを提案する.そして,その言語的特徴を活用した自然言語解析および 自然言語生成の方式を提案し,それにより「法的文章処理システム」の実験シ ステムを作成して機能を検証する.
もう一は,法律文言語処理システム開発の過程を通して得られる経験に基づき, 制限言語モデルに基づく高度な自然言語処理システム開発を支援する「支援環 境」の構築である.法律文に限らず,限定された分野における高度な自然言語 処理システムの実現のためには,対象領域の言語的特徴を調査・分析し,それ を辞書や文法の中に適切に組み入れ,活用する必要がある.この作業には非常 に多くの労力を必要とする.そのような作業を適切に支援する環境があれば, 効率の良い開発作業が行え,労力の軽減に役立つ.ひいては,高度な自然言語 処理システムの実現を早めることができる.
制限言語モデル構築法や素性論理構造表現形式など,本研究の遂行上で得られ る知見は,法律文のみならず,他の分野,ひいては一般の自然言語文に対する 高度な自然言語処理システム開発にも非常に有用なものとなると考える.
本研究では,高度な自然言語処理システム実現のための制限言語モデルとそれ に基づく自然言語処理システムの構築技術の確立を目指す.対象分野としては 法律文を選ぶ.従来は,「国際物品売買契約に関する国連条約(統一売買法)」 を主たる対象として,その言語的特徴の調査・分析を行ってきた.本研究では, 対象とする法律文の範囲を「民法」などにも広げ, 以下に述べる項目などにつ いての研究により「法律文制限言語モデル」の精密化・拡充とそれに基づく 「法的文章処理システム」の実験システムを作成して機能を検証する.
本研究では,関連する研究として,さらに,下記の研究支援環境システムにつ いても検討する.これらは研究の過程における作業を効率化するためのもので ある.
研究の内容で述べた研究対象を,適宜,研究協力者とともに役割分担を行いつ つ研究を進める.研究従事者間の討論だけでなく,外部の法律専門家の意見に も耳を傾けることで,より正確な法律文理解に基づく法律文制限言語モデル, 素性論理構造表現の構築を行う.そして,これらに基づく法律文処理の実験シ ステムを作成し,そこから得られる知見により,モデルの精密化,拡張を進め ると同時に,一般の利用に供することができるシステムに仕上げていく.
LIPS (Legal Information Processing System) は,法律文制限言語の文 法や辞書,法律文制限言語を利用した処理システム,そして,制限言語の開発 支援環境の集合体である.制限言語開発支援環境は,対象を法律文に限るもの ではない.ある特定分野の高度な自然言語処理システム実現のために,その分 野の制限言語を開発したいというような場合に,一般的に利用することができ る.
法律文制限言語モデルとその応用システムは,支援環境を利用して作成された サンプルであると同時に,実用的な法律文言語情報,および法律文解析システ ムや法律文生成システムの原形でもある.これらは,法律研究者や学習者など がツールとして利用することができる.無論,支援環境に含まれるような法律 文に特化しないツールもこの目的に利用可能である.また,本ソフトウェアに 含まれる以外の高度な法律文言語処理システムを実現しようとする際に,言語 データとして利用することもできる.
制限言語モデル構築の作業は,対象分野のテキストデータの調査・分析による 言語的特徴の基礎データ獲得作業と,獲得した言語的特徴を反映した文法の構 築作業とに大別することができる.本支援環境はその両方の作業を効率良く行 うための環境を提供する.
基礎データ獲得作業においては,テキストデータ調査のためにさまざまなツー ルが作成・駆使される.文法設計作業においては,解析試験と文法修正の試行 錯誤が必要となる.文法設計の過程で得られた知見は,言語的特徴分析のため の基礎データ獲得作業にフィードバックされるし,その結果として新たに得ら れた性質が文法の改訂を促す.このような作業においては,通常,同様の処理 を何度も反復して行う必要がある.これを人手で行うのは非効率的であり,制 限言語構築のためのスムーズな思考の展開の妨げにもなる.本支援環境は,こ のような作業を支援し,非能率性を解消するための統合環境である.さまざま なツールの起動や連係を支援することにより,制限言語開発者による制限言語 設計への思考の集中を助けることができる.本支援環境では,GUIを採用す ることにより,制限言語開発作業を視覚的に理解しやすくする.操作もできる 限り直感的に行えることを目指し,制限言語開発作業の流れをスムーズにする ことができる.
本ソフトウェアは,法律文制限言語モデルに関する言語データ,応用システム としての法律文解析生成システム,制限言語モデル開発のための支援環境など の様々なモジュールの集合体から構成される.
法律文制限言語とその応用システムは,支援環境を利用して作成されたサンプ ルであると同時に,実用的な法律文言語情報,および法律文解析システムや法 律文生成システムでもある.これらは,法律研究者や学習者などがツールとし て利用することができる.無論,支援環境に含まれるような法律文に特化しな いツールもこの目的に利用可能である.また,本ソフトウェアに含まれる以外 の高度な法律文言語処理システムを実現しようとする際に,言語データとして 利用することもできる.
制限言語モデル開発支援環境は,その全体のコントロールを司るプラットホー ムを中心として,各支援処理を実現する実体である処理モジュールや,処理モ ジュールの入出力を司るインターフェースモジュール,さらに,複数処理の連 係を規定する連係制御モジュールが組み合わせられる.各処理モジュールは, できる限り独立性が強いものとし,プログラムの再利用性を向上させる.また, インターフェースモジュールを独立させていることにより,必要に応じて処理 モジュールを差し替えることを容易にする.この構造は,支援環境上での制限 言語文法の改良と同時に,その制限言語文法に基づく独立した解析システムの 改良も,利用者が特に意識することなく実施できることを意味する.
制限言語開発支援システムは,文法開発支援環境(LINGUIST)の考えも参考に して,その拡張ないし代用として用いることができるものである.支援システ ムの処理モジュールには,IFSの中から有用なものを選択して利用する計画 である.解析システムについても独自の開発は行わず,SAXなどを処理モジュー ルとして活用する予定である.
GUIによる統合環境は,Tcl/Tkにより構築する予定である.各処理は, このプラットホームから起動されるため,各処理に適するプログラム言語を選 択する.具体的にはC,Prolog,CESP等である.基本的にGNUや ICOTのフリーソフトウェアのみで動作させる予定であるため,それらのフ リーソフトウェアが稼働する環境であれば,利用可能である.
本ソフトウェアは,下記に示す法律文制限言語モデルの言語データ,その応用 システムとしての法律文解析生成システム,および制限言語モデル開発のため の支援環境とからなる.
これらのソフトウェアは,言語分析などのために開発しているツールが既に 手元に存在するならば,そのツールとのインターフェースを記述することによ り,そのツール操作のソフトウェアランチャーとして,このシステムを利用す ることができる.これにより,すでに開発しているツールを無駄にすることな く,快適で作業効率の良い開発環境を実現できる.さらに,他のツールと組み 合わせて作業の効率化を図りたい場合には,組み合わせるツールとの間の連係 制御モジュールを記述することで,開発済みツールの活用をより促進すること もできる.
本ソフトウェアの支援処理を実現する各モジュールは,法律文を題材として 実際に行った制限言語モデル開発の過程において必要であった,あるいは作業 効率化のために作成されたものである.それらは独立性の高いものとしている ため,各モジュール単独でも,自然言語処理の研究や自然言語処理応用システ ムの開発において,有効に活用することが可能である.
www-admin@icot.or.jp