現在、インターネットを中心として、情報化が加速されており、企業において もデータウエアハウスなどによる統合情報システムの確立が望まれている。そ こで期待される機能は、氾濫する膨大な情報の中から如何にして有益な情報を 抽出するかである。
現在、これらの要求に答えるための技術として、データベースからの知識獲得、 データマイニングの技術が注目を浴び、多くの研究が行なわれている。データ マイニングへの関心が高まるにつれ、システムの機能面に対し、さらなる要求 が生まれてきている。現在利用されているデータマイニングの主な手法として、 統計解析に基づくものや、ニューラルネットワーク、また命題論理学習器など があげられる。しかしこれらの手法では、表現能力の不足から、より現実的で 複雑な問題を扱うことは困難である。
一方、帰納論理プログラミングは、一階述語論理に基づく機械学習の新しい方 法論として、現在注目を浴びている。帰納論理プログラミングでは、一階述語 論理をその表現言語として採用しており、背景知識を利用することが可能であ る。これにより、命題論理学習器に比べて、応用分野が格段に広がった。デー タベースの用語で言えば、命題論理学習器は単一の表からの学習しか出来ない が、一階述語論理学習器は、複数の表に跨るデータの中から、論理的な関連性 を抽出してくれる。このため、例えば関係データベースからの知識の発見が帰 納論理プログラミングの枠組の中で、自然に達成することができる。
これらのことを背景に、本研究では、データマイニング機能の高度化を、その 研究目的とする。データマイニングの研究においては、知識を抽出するエンジ ン部が重要となる。しかし、通常データマイニングが対象とするデータベース のサイズは、1万件、あるいはそれを越えてしまうので、これまでの一階述語 論理学習器では、性能面で手に負えなかった。本研究においては、この問題を 解決し、従来のデータマイニング技術では扱うことが困難であった'関係知識' を対象とした、表現力に富み、かつ効率の良い、データマイニングエンジンの 開発を目指す。より具体的には、現在の帰納論理プログラミングシステムの高 機能化及び高速化を行い、データマイニングシステムとしての要求に応じるこ とのできる、帰納論理プログラミングに基づくデータマイニングエンジンの開 発を目的とする。