平成9年度 委託研究ソフトウェアの中間報告

(6) 帰納論理プログラミングによるデータマイニングエンジンDatagolの研究開発

研究代表者: 古川 康一 教授
慶應義塾大学 大学院 政策・メディア研究科


研究テーマ、研究代表者:
(1)研究テーマ
帰納論理プログラミングによるデータマイニングエンジンDatagolの研究開発

(2)研究代表者(氏名、所属、役職)
古川 康一、慶應義塾大学 大学院 政策・メディア研究科 教授

記述項目:
(1)研究進捗状況

本研究では、データマイニングシステムの機能の高度化を目的とし、 帰納論理プログラミング(ILP)に基づくデータマイニングエンジンの 開発を行なっている。そのため、表現言語のDatalogへの制限、帰納 推論アルゴリズムの改良、演繹データベースにおけるマジックセット 法の利用、の観点から、ILPの代表的システムであるProgolのアルゴ リズムの詳細を検討し、考察を行なった。

仮説探索アルゴリズムにおける候補仮説の評価に関しては、MGTPを用 いたボトムアップ計算に基づくアルゴリズムの精密化を行なった。 またProgolの最新版が実現しているノンホーンの最弱仮説の生成に関 して、理論的な考察を行ない、制約付きMGTP(CMGTP)の適用について 検討を行なった。さらに、ユーザインターフェースを、単なるGUIで はなく、デバッグツールとして捉え、その開発を行なっている。

現在、アルゴリズムの検討をほぼ終了し、実装に向けての詳細設計お よびKLICやJAVA言語を使った実装に着手したところである。

(2)現在までの主な成果

データベースの観点から、候補仮説の評価アルゴリズムの精密化を行 なった。特に、MGTPとデータベースにおける問い合わせ処理、及びマ ジックセット法の関係について考察を行ない、データベースからのデ ータの取り込み(ステージング)への応用を行なった。これはEDB(外延 データベース)に対するマジック述語を導入し、それをデータベース に対するステージングの要求と解釈することで実現されている。また、 背後にデータベースを意識した形でのMGTPの再設計を行なった。

ノンホーン最弱仮説の生成について、そのアルゴリズムの検討を行な った。その過程で、部分評価(Partial Evaluation)やアブダクショ ンが重要な役割を果たすことが確認された。現在のProgolは、Prolog Technology Theorem Proverを利用しているが、それに代わるもの としてCMGTPを取りあげ、これを利用したノンホーン最弱仮説の生成 に関する考察を行なった。

また、ILPの基礎理論の研究として、帰納推論とアブダクションの関係 について理論的考察を行ない、アブダクションを利用した新述語導入 に関する考察を行なった。

(3)今後の研究概要

今後は、現在までの調査検討した内容に従って、現在進めているKLIC によるプログラミングの完了、及びデバッグを行なう。またさらなる 効率化のための改良アルゴリズムの開発、及び機能面の充実もあわせ て行なっていく予定である。 特に仮説空間の探索(候補仮説の生成)に関しては、現在までに開発し た改良アルゴリズムではカバーできない冗長性が認められており、今 後はこの問題に対する改良アルゴリズムの開発を行なう。

(4)今年度目標成果ソフトウェアイメージ

今年度は、推論エンジンとユーザインターフェースをそれぞれ独立に 開発する。

推論エンジンは、CMGTPを利用したノンホーン最弱仮説の生成、及び 効率的な最適仮説探索機能を中心に開発を行なう。さらに、仮想的に 外部データベースを想定し、これとMGTPとのインターフェースをとる ことで、より大規模な問題に適用できるよう設計、実装を行なう。

またユーザインターフェースは、事例、背景知識の補完機能を中心に、 デバッギングツールとして開発を行なう。


www-admin@icot.or.jp