ゴールに依存して関連した知識を切り出し、切り出された部分に限定して類似 性を検出・判断するプログラム「GDA(ゴールに依存した抽象化)アルゴリズム」 を開発してきた。その際、複雑な法的知識をできるだけ効率よく記述するため の戦略、すなわち、辞書的な知識を記述したTKB (terminological knowledge base)と、TKBで定義された語彙を用いて、ルールや事実等により事物間の関係 を記述するRKB (relational knowledge base)の2種類の知識ベースを使うこと を前提にした。その理由として下記をあげておく。
上記に述べた基本方針は前年度の研究から継承している。すなわち、順序ソー ト論理が持つ signature をTKBとし、signature で宣言された述語でルールや 事実を整合節 (well-sorted clause)として書き下しこれを RKBとする。さら に、語彙間の類似性は概念を現わすソート集合の分割(同値類)で表記され,直 観的には,同一の同値類に属するソートはゴールに関連するある関係的知識を RKBの中で共有することを意味している.また,ゴールの証明に使われる整合 節を保存する分割を探索する方式も基本的には同じである。
このように,GDAはRKBが持つ関係的知識のみから類似性を検出するパワーを有 しているが,所与のゴールを提示したとしても,潜在的な類似性の可能数は膨 大なものとなる.こうした計算量の問題に対処するために,昨年度研究におい て,類似性がTKB中の概念階層(ソート階層)と両立することを要求する類似性 継承条件(以下、SIC)を分割に課すことも同様である。
本年度はこれに加えて、KL/ONE 風の語彙的知識表現言語が持つロール制約の うち、特にロールの value restriction(以下、VR)が保存される条件、value restriction preservingness (以下,VRP)を新たに導入し実装した。VRそれ自 体は signature を拡張する形式で記述され、VRPによる探索効率の向上を期す ために、SICの実装方式にも変更を加えた。
VRPの機能を一言で説明すれば、語彙AおよびBが類似しており、かつ、別の語 彙CおよびDがそれぞれABに対する同一のロールリンクで結合されているときは、 かならずCとDも類似していることを要求する。結果的に、新方式のGDAアルゴ リズムが算出する類似性は、ゴールの証明に使われた部分のロール構造を共有 することになり、出力類似性はTKBが持つ概念構造との整合性を獲得したこと になる。
類似性に対してVRPのような制約を課すことは、可能な類似性のクラスを狭め ることになり異論もあるかも知れない。しかしながら、辞書的知識は万人が共 有できる知識であり、そうした辞書との整合性を持つ類似性はユーザにとって はるかに理解しやすく、かつ、類似性が妥当である根拠をTKBに求めることが 可能になる。また、可能な類似性のクラスを狭めることが、膨大な類似性の空 間に対する定性的なバイアスとして働き、その結果、効率上も貢献できること は明白であろう。